OpenCV4 | 如何一行代码搞定SSD模型推理与结果解析

2019 年 11 月 11 日
筆記

高阶API介绍

最新版本OpenCV4.1.2，针对深度神经网络模块，提供了三个高阶的API，通过它们，自动实现输入图像预处理与后处理，直接输出检测结果，支持图像分类、对象检测、图像分割三种常见的视觉常见任务。相关API如下：

dnn::ClassificationModel

dnn::DetectionModel

dnn::SegmentationModel

它们之间的继承关系如下：

以DetectionModel为例，创建时候声明模型路径（权重与配置文件路径）完成初始化与网络加载函数：

DetectionModel  (const String &model,  // 模型权重  const String &config="" // 配置文件  )

检测函数:

void cv::dnn::DetectionModel::detect(  InputArray frame, // 输入图像  std::vector< int > & classIds, // 输出类别index  std::vector< float > & confidences, // 得分  std::vector< Rect > & boxes, // 目标框  float confThreshold = 0.5f, // 阈值  float nmsThreshold = 0.0f  // NMS  )

这样就不需要再去解析SSD/Faster-RCNN/YOLOv3最后一层，而且这个函数还支持NMS功能，可以说是极大的方便了小白调用深度学习对象检测模型。是不是有一种级联检测器对象检测的既视感！

代码演示

以OpenCV深度神经网络模型自带的SSD人脸检测为例，首先需要运行：

samplesdnnface_detector文件夹下的

download_weights.py

文件下载模型，下载之后，通过下面的代码执行加载与初始化：

// 定义与初始化 检测模型  DetectionModel face_detector(modelBinary, modelDesc);  face_detector.setInputSize(Size(300, 300));  face_detector.setInputMean(meanVal);  face_detector.setInputScale(1.0);  face_detector.setInputSwapRB(false);  face_detector.setInputCrop(false);

然后对输入的图像或者视频的每一帧调用detect方法进行人脸检测即可：

face_detector.detect(frame, classIds, confidence, boxes, 0.5, 0.0);

完整的演示程序如下：

// 定义与初始化 检测模型  DetectionModel face_detector(modelBinary, modelDesc);  face_detector.setInputSize(Size(300, 300));  face_detector.setInputMean(meanVal);  face_detector.setInputScale(1.0);  face_detector.setInputSwapRB(false);  face_detector.setInputCrop(false);    // VideoCapture capture(0);  VideoCapture capture("D:/images/video/fbb.avi");  Mat frame;  vector<int> classIds;  vector<float> confidence;  vector<Rect> boxes;  ostringstream ss;  while (capture.read(frame)) {      int64 start = getTickCount();      imshow("input", frame);        // 调用模型      face_detector.detect(frame, classIds, confidence, boxes, 0.5, 0.0);      for (int i = 0; i < boxes.size(); i++) {          rectangle(frame, boxes[i], Scalar(0, 0, 255), 2, 8, 0);      }        double fps = cv::getTickFrequency() / (cv::getTickCount() - start);      double time = (cv::getTickCount() - start) / cv::getTickFrequency();      ss.str("");      ss << " FPS: " << fps << " ; time: " << time*1000 << " ms";      putText(frame, ss.str(), Point(20, 20), 0, 0.5, Scalar(0, 0, 255));      imshow("dnn_face_detection", frame);      if (waitKey(1) >= 0) break;  }  waitKey(0);  return;

运行效果如下：

速度有点感人，别着急，重新编译源码支持OpenVINO inference engine加速之后，改两行代码速度就可以提升10倍以上：

face_detector.setPreferableBackend(DNN_BACKEND_INFERENCE_ENGINE);  face_detector.setPreferableTarget(DNN_TARGET_CPU);

再看一下运行效果：

很简单使用OpenVINO的推理引擎(IE)之后，加速效果满满的。

OpenCV4 | 如何一行代码搞定SSD模型推理与结果解析

VirMach 便宜 VPS

QNews

OpenCV4 | 如何一行代码搞定SSD模型推理与结果解析

分享此文：

Related Posts

Python全栈之jQuery笔记

解决“与 Microsoft Exchange 的连接不可用，Outlook 必须联机或已连接才能完成此操作”

如何对CDH集群中的Impala打印线程堆栈

有限状态机与Lucene的那些事（开篇）

VirMach 便宜 VPS

QNews

熱門搜尋