部署C++ API说明

本文档主要根据部署步骤，讲解用到的一些API、数据结构，包括以下5个内容

创建模型对象
模型初始化
模型预测
预测结果字段
代码示例

1. 创建模型对象

std::shared_ptr<PaddleDeploy::Model>  PaddleDeploy::ModelFactory::CreateObject(const std::string  &model_type)

根据模型来源的套件类型，创建相应的套件对象并返回基类智能指针。所有推理相关的操作，包括预处理、推理和后处理都在该对象中。

参数

model_type 套件类型，当前支持的套件为PaddleDetection、PaddleSeg、PaddleClas、PaddleX对应的model_type分别为 det、seg、clas、paddlex

返回值

指向套件对象的父类指针

代码示例

std::shared_ptr<PaddleDeploy::Model> model = PaddleDeploy::ModelFactory::CreateObject("det")

2. 模型初始化

模型初始化包括2个步骤，第一步读取配置文件，初始化数据预处理和后处理相关操作；第二步初始化推理PaddleInference推理引擎；对应的接口分别为PaddleDeploy::Model::Init()和PaddleDeploy::Model::PaddleEngineInit()

2.1 模型前后处理初始化

bool Model::Init(const std::string& cfg_file)

读取模型的配置文件，初始化模型预测过程中的数据预处理和后处理等相关操作

参数

cfg_file 配置文件路径，如PaddleDetection导出的模型中的infer_cfg.yml

返回值

true或false，表示是否正确初始化

代码示例

if (!model->Init("yolov3_mbv1/model/infer_cfg.yml")) {
    std::cerr << "Fail to execute model->Init()" << std::endl;
}

2.2 推理引擎初始化

bool Model::PaddleEngineInit(const std::string& model_filename,
                             const std::string& params_filename,
                             bool use_gpu = false,
                             int gpu_id = 0, 
                             bool use_mkl = true,
                             int mkl_thread_num = 8)

初始化Paddle 推理引擎, 创建Model或者其子类对象后必须先调用它初始化，才能调推理接口。

参数

model_filename 模型结构文件路径，如model.pdmodel或__model__

params_filename 模型权重文件路径，如model.pdiparams或__params__

use_gpu 是否使用GPU

gpu_id GPU设备ID

use_mkl 是否使用mkldnn（CPU上推理加速引擎）

mkl_thread_num 使用mkldnn时的推理线程数

返回值

true或false，表示是否正确初始化

代码示例

if (!modle->PaddleEngineInit("yolov3_mbv1/model/model.pdmodel", 
                             "yolov3_mbv1/model/model.pdiparams",
                             true, 0)) {
  std::cerr << "Fail to execute model->PaddleEngineInit()" << std::endl;
}

3.模型预测

推理过程包括输入数据的预处理、推理引擎的inference、inference结果的后处理3个步骤，在部署代码中，三个步骤分别对应PaddleDeploy::Model::Preprocess()、PaddleDeploy::Model::Infer()、PaddleDeploy::Model::Postprocess()。

为了更便于开发者使用，此三个步骤被封装为PaddleDeploy::Model::Predict()一个接口内，用户可根据自行需求进行调用，一般情况下，推荐使用PaddleDeploy::Model::Predict()接口即可一步完成预测需求。

3.1 预测接口

 bool Model::Predict(const std::vector<cv::Mat>& imgs,
                     vector<PaddleDeploy::Result>* results,
                     int thread_num = 1)

对传入的图像进行预处理、inference、后处理，最终结果写回到results结构体内

参数

imgs 传入的vector，元素为cv::Mat，预测时将会对vector中所有Mat进行预处理，并作为一个batch输入给推理引擎进行预测；开发者在调用时，需考虑硬件配置，vector的size过大时，可能会由于显存或内存不足导致程序出错

results 预测结果vector，其与输入的imgs长度相同，vector中每个元素说明参考预测结果字段说明

thread_num 当输入vector的size大于1时，可通过thread_num来配置预处理和后处理的并行处理时的多线程数量

返回值

true或false，表示是否预测成功

代码示例

std::vector<cv::Mat> inputs;
std::vector<PaddleDeploy::Result> results;
inputs.push_back(cv::imread("test.jpg", 1));
if (!model->Predict(inputs, &results)) {
  std::cerr << "Fail to execute model->Predict()" << std::endl;
}

3.2 预处理接口

bool Model::Preprocess(const std::vector<cv::Mat>& imgs,
                       std::vector<PaddleDeploy::DataBlob>* inputs,
                       std::vector<PaddleDeploy::ShapeInfo>* shape_infos,
                       int thread_num = 1)

对传入的图像进行预处理，得到推理引擎推理时所需的输入，此接口为PaddleDeploy::Model::Predict中的第一步

参数

imgs 传入的vector，元素为cv::Mat，预测时将会对vector中所有Mat进行预处理

inputs 输入的imgs经过预处理后，将输给推理引擎进行推理使用的数据内存存在inputs中

shape_infos 记录每张图像在预处理过程中的操作信息

thread_num 当传入imgs的size大于1时，可通过thread_num来配置预处理的并行处理时的多线程数量

返回值

true或false，表示是否预处理成功

示例代码

std::vector<cv::Mat> imgs;
std::vector<PaddleDeploy::DataBlob>  inputs;
std::vector<PaddleDeploy::ShapeInfo> shape_infos;
inputs.push_back(cv::imread("test.jpg"), 1);
if (!model->Preprocess(imgs, &inputs, &shape_infos)) {
  std::cerr << "Fail to execute model->Preprocess()" << std::endl;
}

3.3 推理接口

bool Model::Infer(const std::vector<DataBlob>& inputs,
                  std::vector<DataBlob>* outputs)

接收预处理后的数据输入std::vector<PaddleDeploy::DataBlob>，使用推理引擎进行推理，此接口为PaddleDeploy::Model::Predict中的第二步

参数

inputs 预处理（即Model::Preprocess接口)后的输入数据

outputs 推理引擎推理后的输出数据

返回值

true或false表示是否推理成功

示例代码

std::vector<cv::Mat> imgs;
std::vector<PaddleDeploy::DataBlob>  inputs;
std::vector<PaddleDeploy::ShapeInfo> shape_infos;
inputs.push_back(cv::imread("test.jpg"), 1);
// 预处理
if (!model->Preprocess(imgs, &inputs, &shape_infos)) {
  std::cerr << "Fail to execute model->Preprocess()" << std::endl;
  return -1;
}
// 推理
std::vector<PaddleDeploy::DataBlob> outputs;
if (!model->Infer(inputs, &outputs)) {
  std::cerr << "Fail to execute model->Infer()" << std::endl;
  return -1;
}

3.4 后处理接口

bool Model::Postprocess(const std::vector<PaddleDeploy::DataBlob>& outputs,
                        const std::vector<PaddleDeploy::ShapeInfo>& shape_infos,
                        std::vector<PaddleDeploy::Result>* results,
                        int thread_num = 1)

对推理引擎推理后的结果进行后处理，形成可供用户直接使用的结构化数据，存储在results字段中，此接口为PaddleDeploy::Model::Predict中的第三步

参数

outputs 推理引擎推理（即Model::Infer接口)后的结果

shape_infos 预处理（即Model::Preprocess接口)过程中存储的相关操作信息

results 后处理后结果写入到此字段，其长度与Model::Preprocess接收的图像数量一致

thread_num 当后处理是在处理多张图像的结果时，通过thread_num可设置后处理的并行线程数

返回值

true或false表示是否后处理成功

示例代码

std::vector<cv::Mat> imgs;
std::vector<PaddleDeploy::DataBlob>  inputs;
std::vector<PaddleDeploy::ShapeInfo> shape_infos;
inputs.push_back(cv::imread("test.jpg"), 1);
// 预处理
if (!model->Preprocess(imgs, &inputs, &shape_infos)) {
  std::cerr << "Fail to execute model->Preprocess()" << std::endl;
  return -1;
}
// 推理
std::vector<PaddleDeploy::DataBlob> outputs;
if (!model->Infer(inputs, &outputs)) {
  std::cerr << "Fail to execute model->Infer()" << std::endl;
  return -1;
}
// 后处理
std::vector<PaddleDeploy::Result> results;
if (!model->Postprocess(outputs, &results)) {
  std::cerr << "Fail to execute model->Postprocess()" << std::endl;
  return -1;
}

4. 预测结果字段

在开发者常调用的接口中，包括主要的Model::Predict，以及Model::Predict内部调用的Model::Preprocess、Model::Infer和Model::Postprocess接口，涉及到的结构体主要为PaddleDeploy::Result（预测结果），PaddleDeploy::DataBlob和PaddleDeploy::ShapeInfo。其中DataBlob和ShapeInfo开发者较少用到，可直接阅读其代码实现。

以下重点介绍PaddleDeploy::Result, 其结构定义如下

struct Result {
  std::string model_type;    // 结果类型，仅支持det/seg/clas三种
  union {
    // 当model_type为clas时，仅该指针为非Null，存储预测结果
    ClasResult* clas_result; 
    // 当model_type为det时，仅该指针为非Null，存储预测结果
    DetResult* det_result; 
    // 当model_type为seg时，仅该指针为非Null，存储预测结果
    SegResult* seg_result; 
  };
};

4.1 图像分类结果

struct ClasResult {
  int category_id;       // 类别id
  std::string category;  // 类别名
  double score;          // 置信度
};

4.2 目标检测结果

struct DetResult {
  // 单张图像中所有检测到的Box
  std::vector<Box> boxes;
};

struct Box {
  int category_id;       // 类别id
  std::string category;  // 类别名
  float score;           // 置信度
  // Box四维坐标[xmin, ymin, width, height]
  std::vector<float> coordinate;
  // MaskRCNN实例分割模型中，对应每个Box的掩膜信息
  Mask<uint8_t> mask;
};

template <class T>
struct Mask {
  // Mask数据
  std::vector<T> data;
  // Mask的Shape信息
  std::vector<int> shape;
};

4.3 语义分割结果

struct SegResult {
  Mask<uint8_t> label_map;   // 每个像素的分类id
  Mask<float> score_map;     // 每个像素的置信度
}

template <class T>
struct Mask {
  // Mask数据
  std::vector<T> data;
  // Mask的Shape信息
  std::vector<int> shape;
};

5. 部署代码示例

以下示例代码以目标检测模型为例

#include <iostream>
#include "model_deploy/common/include/paddle_deploy.h"
int main() {
  std::shared_ptr<PaddleDeploy::Model> model =
                    PaddleDeploy::ModelFactory::CreateObject("det");
  model->Init("yolov3_mbv1/model/infer_cfg.yml");
  model->PaddleEngineInit("yolov3_mbv1/model/model.pdmodel",
                          "yolov3_mbv1/model/model.pdiparams",
                          true, 0);
  
  std::vector<cv::Mat> images;
  std::vector<PaddleDeploy::Result> results;
  images.push_back(cv::imread("test.jpg", 1));
  
  if (!model->Predict(images, &results)) {
    std::cerr << "Fail to execute model->Predict()" << std::endl;
    return -1;
  }
  
  // 第一层循环为样本数量，当前为1
  for (auto i = 0; i < results.size(); ++i) {
    // 第二层循环为每张样本中的box数量
    for (auto j = 0; j < (results[i].det_results->boxes).size(); ++j) {
      std::cout << (results[i].det_results->boxes)[j].coordinate[0] << " "
                << (results[i].det_results->boxes)[j].coordinate[1] << " "
                << (results[i].det_results->boxes)[j].coordinate[2] << " "
                << (results[i].det_results->boxes)[j].coordinate[3]
                << std::endl;
    }
  }
}

输出结果示例如下

419.252 155.974 48.2672 144.499
44.3458 213.229 15.759  29.256
372.985 152.078 90.556  144.341
384.818 172.375 17.1848 33.8331

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

model.md

model.md

部署C++ API说明

1. 创建模型对象

2. 模型初始化

2.1 模型前后处理初始化

2.2 推理引擎初始化

3.模型预测

3.1 预测接口

3.2 预处理接口

3.3 推理接口

3.4 后处理接口

4. 预测结果字段

4.1 图像分类结果

4.2 目标检测结果

4.3 语义分割结果

5. 部署代码示例

Files

model.md

Latest commit

History

model.md

File metadata and controls

部署C++ API说明

1. 创建模型对象

2. 模型初始化

2.1 模型前后处理初始化

2.2 推理引擎初始化

3.模型预测

3.1 预测接口

3.2 预处理接口

3.3 推理接口

3.4 后处理接口

4. 预测结果字段

4.1 图像分类结果

4.2 目标检测结果

4.3 语义分割结果

5. 部署代码示例