Main Content

このページの翻訳は最新ではありません。ここをクリックして、英語の最新版を参照してください。

オブジェクトの検出

畳み込みニューラル ネットワーク (CNN または ConvNet) を使用した分類、オブジェクト検出、転移学習の実行、ならびにカスタム検出器の作成

オブジェクト検出は、イメージまたはビデオ内のオブジェクトのインスタンスを特定するためのコンピューター ビジョンの手法です。オブジェクト検出アルゴリズムは通常、機械学習または深層学習を活用して、意味のある結果を生成します。イメージやビデオを見るとき、人間は関心のあるオブジェクトを瞬時に認識して特定できます。オブジェクト検出の目的は、コンピューターを使用してこのインテリジェンスを模倣することです。オブジェクト検出の最適なアプローチは、アプリケーションや解決しようとする問題によって異なります。

深層学習手法では、多数のラベル付き学習イメージを必要とするため、モデルに学習させるのに必要な時間を短縮するために GPU を使用することを推奨します。深層学習ベースのオブジェクト検出では、R-CNN や YOLO などの畳み込みニューラル ネットワーク (CNN または ConvNet) を使用するか、シングルショット検出 (SSD) を使用します。カスタム オブジェクト検出器に学習させることも、転移学習を活用して事前学習済みのオブジェクト検出器を使用し、事前学習済みのネットワークから始めて、アプリケーションに合わせて微調整することもできます。畳み込みニューラル ネットワークには Deep Learning Toolbox™ が必要です。学習と予測は CUDA® 対応 GPU でサポートされます。GPU を使用することが推奨され、これには Parallel Computing Toolbox™ が必要になります。詳細については、Computer Vision Toolbox の基本設定およびMathWorks 製品での並列計算のサポート (Parallel Computing Toolbox)を参照してください。

オブジェクト検出の機械学習手法には、集約チャネル特徴 (ACF)、勾配方向ヒストグラム (HOG) 特徴を使用したサポート ベクター マシン (SVM) 分類、および人間の顔や上半身を検出するための Viola-Jones アルゴリズムなどがあります。事前学習済みのオブジェクト検出器から開始することも、アプリケーションに合わせてカスタム オブジェクト検出器を作成することもできます。

Object detection, neural network

アプリ

イメージ ラベラーコンピューター ビジョン アプリケーションに使用するイメージのラベル付け
ビデオ ラベラーLabel video for computer vision applications

関数

すべて展開する

深層学習検出器

rcnnObjectDetectorR-CNN 深層学習の検出器を使用したオブジェクトの検出
fastRCNNObjectDetectorDetect objects using Fast R-CNN deep learning detector
fasterRCNNObjectDetectorFaster R-CNN 深層学習の検出器を使用したオブジェクトの検出
ssdObjectDetectorDetect objects using SSD deep learning detector
yolov2ObjectDetectorDetect objects using YOLO v2 object detector
yolov3ObjectDetectorDetect objects using YOLO v3 object detector
yolov4ObjectDetectorDetect objects using YOLO v4 object detector
maskrcnnDetect objects using Mask R-CNN instance segmentation

特徴ベースの検出器

ocr光学式文字認識を使用したテキストの認識
readAprilTagDetect and estimate pose for AprilTag in image
readBarcodeDetect and decode 1-D or 2-D barcode in image
acfObjectDetectorDetect objects using aggregate channel features
peopleDetectorACF集約チャネル特徴を使用した人物の検出
vision.CascadeObjectDetectorViola-Jones アルゴリズムを使用したオブジェクトの検出
vision.ForegroundDetector混合ガウス モデルを使用した前景の検出
vision.PeopleDetectorHOG 特徴を使用した直立の人物の検出
vision.BlobAnalysis連結された領域のプロパティ

特徴点を使用したオブジェクトの検出

detectBRISKFeaturesBRISK 特徴を検出して BRISKPoints オブジェクトを返す
detectFASTFeaturesFAST アルゴリズムを使用してコーナーを検出し cornerPoints オブジェクトを返す
detectHarrisFeaturesHarris-Stephens アルゴリズムを使用してコーナーを検出し cornerPoints オブジェクトを返す
detectKAZEFeaturesKAZE 特徴を検出して KAZEPoints オブジェクトを返す
detectMinEigenFeatures最小固有値アルゴリズムを使用してコーナーを検出し、cornerPoints オブジェクトを返します。
detectMSERFeaturesMSER 特徴を検出して MSERRegions オブジェクトを返す
detectORBFeaturesORB キーポイントを検出し、ORBPoints オブジェクトを返す
detectSIFTFeaturesScale Invariant Feature Transform (SIFT) 特徴を検出し、SIFTPoints オブジェクトを返す
detectSURFFeaturesSURF 特徴を検出して SURFPoints オブジェクトを返す
extractFeatures関心点記述子の抽出
matchFeaturesマッチする特徴の検出

検出オブジェクトの選択

selectStrongestBboxSelect strongest bounding boxes from overlapping clusters
selectStrongestBboxMulticlassSelect strongest multiclass bounding boxes from overlapping clusters

学習データの読み込み

boxLabelDatastoreDatastore for bounding box label data
groundTruthグラウンド トゥルース ラベル データ
imageDatastoreイメージ データのデータストア
objectDetectorTrainingDataオブジェクト検出器用の学習データの作成
combine複数のデータストアのデータを統合

特徴ベースのオブジェクト検出器の学習

trainACFObjectDetectorACF オブジェクト検出器に学習させる
trainCascadeObjectDetectorカスケード型オブジェクト検出器モデルの学習
trainImageCategoryClassifierイメージ カテゴリ分類器の学習

深層学習ベースのオブジェクト検出器の学習

trainRCNNObjectDetectorR-CNN 深層学習オブジェクト検出器の学習
trainFastRCNNObjectDetectorFast R-CNN 深層学習オブジェクト検出器の学習
trainFasterRCNNObjectDetectorFaster R-CNN 深層学習オブジェクト検出器の学習
trainSSDObjectDetectorTrain an SSD deep learning object detector
trainYOLOv2ObjectDetectorTrain YOLO v2 object detector
trainYOLOv4ObjectDetectorTrain YOLO v4 object detector
trainMaskRCNNTrain Mask R-CNN network to perform instance segmentation

深層学習用の学習データの拡張と前処理

balanceBoxLabelsBalance bounding box labels for object detection
bboxcrop境界ボックスのトリミング
bboxeraseRemove bounding boxes
bboxresize境界ボックスのサイズ変更
bboxwarpApply geometric transformation to bounding boxes
bbox2pointsConvert rectangle to corner points list
imwarpイメージへの幾何学的変換の適用
imcropイメージのトリミング
imresizeイメージのサイズ変更
randomAffine2dランダムな 2 次元アフィン変換の作成
centerCropWindow2d四角形の中央トリミング ウィンドウの作成
randomWindow2dRandomly select rectangular region in image
integralImage2 次元インテグラル イメージの計算

R-CNN (Regions with Convolutional Neural Networks)

rcnnBoxRegressionLayerBox regression layer for Fast and Faster R-CNN
fasterRCNNLayersCreate a faster R-CNN object detection network
rpnSoftmaxLayerSoftmax layer for region proposal network (RPN)
rpnClassificationLayerClassification layer for region proposal networks (RPNs)
regionProposalLayerRegion proposal layer for Faster R-CNN
roiAlignLayerNon-quantized ROI pooling layer for Mask-CNN
roiInputLayerROI input layer for Fast R-CNN
roiMaxPooling2dLayerNeural network layer used to output fixed-size feature maps for rectangular ROIs
roialignNon-quantized ROI pooling of dlarray data

YOLO v2 (You Only Look Once version 2)

yolov2LayersCreate YOLO v2 object detection network
yolov2TransformLayerCreate transform layer for YOLO v2 object detection network
yolov2OutputLayerCreate output layer for YOLO v2 object detection network
spaceToDepthLayer空間から深さへの変換層

焦点損失層

focalLossLayerCreate focal loss layer using focal loss function
focalCrossEntropyCompute focal cross-entropy loss

SSD (シングル ショット検出器)

ssdMergeLayerCreate SSD merge layer for object detection

アンカー ボックス

estimateAnchorBoxesEstimate anchor boxes for deep learning object detectors
cuboid2imgProject cuboids from 3-D world coordinates to 2-D image coordinates
insertObjectAnnotationトゥルーカラー イメージ、グレースケール イメージ、またはビデオ ストリームに注釈を付ける
insertObjectMask Insert masks in image or video stream
insertShapeイメージまたはビデオへの形状の挿入
showShapeDisplay shapes on image, video, or point cloud
evaluateDetectionAOSEvaluate average orientation similarity metric for object detection
evaluateDetectionMissRateEvaluate miss rate metric for object detection
evaluateDetectionPrecisionオブジェクト検出の適合率メトリクスの評価
bboxOverlapRatio境界ボックスのオーバーラップ率の計算
bboxPrecisionRecallCompute bounding box precision and recall against ground truth
evaluateInstanceSegmentationEvaluate instance segmentation data set against ground truth
instanceSegmentationMetricsInstance segmentation quality metrics

ブロック

Deep Learning Object Detector学習済み深層学習オブジェクト検出器を使用したオブジェクトの検出

トピック

開始

オブジェクト検出およびセマンティック セグメンテーション用の学習データ

深層学習入門