イメージラベラーで作成したデータのリサイズ方法について

Question

0 投票

YOLOv2をresnet50を用いて転移学習させたのですが、関数evaluateDetectionPrecisionで分類器の精度検証を行おうとしたところ、resnet50の入力サイズが224*224に対して元画像が2304*1296であり、そのままのデータですと評価を行うことが出来ません。

関数imresizeを用いて分類器に画像を入力することはできますが、テストデータのバウンディングボックスを共にリサイズを行っていない為だと考えています。

テストデータはイメージラベラーにて作成したラベリングデータでありtable変数です。

解決策としては画像とバウンディングボックス共にリサイズを行うか、入力データを2304*1296に対応したYOLOv2を作成することだと考えていますが、どちらも方法が見つかりません。

0 件のコメント
-2 件の古いコメントを表示 -2 件の古いコメントを非表示

サインインしてコメントする。

サインインしてこの質問に回答する。

Follow Question

Answer 1

Kenta 2019 年 12 月 12 日

MATLAB Online で開く

2 投票

こんにちは、解決策として「バウンディングボックス共にリサイズを行うか、入力データを2304*1296に対応したYOLOv2を作成することだと考えています」とありますが、どちらかといえば前者のほうか現実的かなあと個人的には思いました。もちろん、使用するデータ数やPCによるのですが、直感的には、２KのデータをYOLOで学習するのは非常に計算コストが大きいように感じられます。

例えば、サンプル画像とそのラベリングがあって、そのサンプル画像を小さくしたいとします。

以下のように、imresize関数でサンプルを小さくして、それと同様に、table変数のラベルの大きさ自体も小さくするとよいのではないでしょうか。下に例を載せましたが、画像のみが小さくなって、ラベリングの相対的な位置は保持されていることがわかります。アノテーションのフォントサイズ自体は一緒なので、文字が右の図では大きく見えていますね。

ただ、対象物体が２Kのデータを224*224に小さくすると見えなくなるかもしれません。それをご確認いただいたうえ実行いただけると幸いです。YOLOv2でバックボーンのCNNで畳み込んでいくときに、最終的な、例えば14*14の特徴マップに、うまく対象物体の特徴が反映されないかもしれない思いました。

詳しく確認できていないので不正確かもしれませんが、ここに、より大きなインプットサイズの事前学習ネットワークがあるかもしれません。resnet50もよいとは思いますが、224*224と2Kの間のインプットサイズにて学習をしてもよいかもしれません。また結果がでたら教えていただけると幸いです。よろしくお願いいたします。

https://jp.mathworks.com/matlabcentral/fileexchange/71277-deep-learning-darknet-importer

I=imread('onion.png');
p=table2cell(gTruth.LabelData);
I_original = insertObjectAnnotation(I,'rectangle',p{1},'target',...
    'TextBoxOpacity',0.9,'FontSize',18);
subplot(1,2,1)
imshow(I_original)
I_resized=imresize(I,.5);
I_resized = insertObjectAnnotation(I_resized,'rectangle',round(p{1}./2),'target',...
    'TextBoxOpacity',0.9,'FontSize',18);
subplot(1,2,2)
imshow(I_resized)

3 件のコメント
1 件の古いコメントを表示 1 件の古いコメントを非表示

Kenta 2019 年 12 月 13 日

ご返信ありがとうございます。はい、また追加検討されましたら、ご報告いただけると幸いです。よろしくお願いいたします。

Kiwamu Nichihara 2019 年 12 月 17 日

頂いたURLの中から、YOLOｖ２の６０８＊６０８の入力サイズのネットワークを転移学習させ、更に関数esitimateAnchorBoxeshttps://jp.mathworks.com/help/vision/ref/estimateanchorboxes.html?s_tid=doc_taを用いて2304*1296を608*608にリサイズしたバウンディングボックスで学習を行いました。結果、224＊224よりはるかに精度が向上しました。今後YOLOｖ３のネットワークを用いたり、データの水増しaugmentedImageDatastorehttps://jp.mathworks.com/help/deeplearning/ref/augmentedimagedatastore.htmlを行う予定です。

知恵をお貸していただき、ありがとうございました。

サインインしてコメントする。

イメージラベラーで作成したデータのリサイズ方法について

0 件のコメント
-2 件の古いコメントを表示 -2 件の古いコメントを非表示

採用された回答

3 件のコメント
1 件の古いコメントを表示 1 件の古いコメントを非表示

その他の回答 (0 件)

カテゴリ

製品

リリース

タグ

Community Treasure Hunt

イメージラベラーで作​成したデータのリサイ​ズ方法について

0 件のコメント -2 件の古いコメントを表示 -2 件の古いコメントを非表示

採用された回答

3 件のコメント 1 件の古いコメントを表示 1 件の古いコメントを非表示

その他の回答 (0 件)

カテゴリ

製品

リリース

タグ

参考

Community Treasure Hunt

イメージラベラーで作成したデータのリサイズ方法について

0 件のコメント
-2 件の古いコメントを表示 -2 件の古いコメントを非表示

3 件のコメント
1 件の古いコメントを表示 1 件の古いコメントを非表示