Faster R-CNNの入力サイズにつてい

Question

HY 2021 年 2 月 25 日

0
リンク

この質問への直接リンク

https://jp.mathworks.com/matlabcentral/answers/755824-faster-r-cnn

コメント済み: Kenta 2021 年 2 月 28 日

こんにちは。

Faster R-CNNを学習させようとしています。こちらのドキュメント(Faster R-CNN 深層学習オブジェクト検出器の学習 - MATLAB trainFasterRCNNObjectDetector - MathWorks 日本)を実際に実行してネットワークの入力サイズを確認したのですが、32×32×3でありかなり小さいサイズでした。

入力サイズがその値ということは、車の映る画像全体を32×32にリサイズしてネットワークに入力し、その後RPNで車のみをプーリングし分類＋検出すると思うのですが、物理的に入力サイズが小さすぎませんでしょうか。しかし、ドキュメントではこの値で精度良く検出できていて不思議です。

逆にこちらのドキュメント(Faster R-CNN 深層学習の検出器を使用したオブジェクトの検出 - MATLAB - MathWorks 日本)では、Resnetを使用しており入力サイズが224×224であり、かなりサイズが違います。物理的な大きさで言えばこちらの方が特徴が学習しやすいように感じます。

そもそもこの２つのドキュメントですが、タイトルが違うものの検出器を学習させ最後にオブジェクトを検出しているので、行っていることは同じでしょうか？

最後に32×32のような人間が見ても特徴がわからないサイズで物体検出できている理由が知りたいです。

勉強不足で申し訳ありませんが、よろしくお願いいたします。

0 件のコメント
-2 件の古いコメントを表示-2 件の古いコメントを非表示

サインインしてコメントする。

サインインしてこの質問に回答する。

Answer 1

Kenta 2021 年 2 月 28 日

0
リンク

この回答への直接リンク

https://jp.mathworks.com/matlabcentral/answers/755824-faster-r-cnn#answer_635379

３２×３２のほうはあくまで例として用意されていて、実質はより大きな画像サイズで試すべきなのだと思います。３２×３２にしても、ぼやっと車のピクセルなどが存在するので、今回はそれをうまく拾える場合が多いので検出自体はできる、くらいの理解でよいのではないでしょうか。faster RCNNはそれなりに計算時間がかかるので、小さいサイズにして試しやすくしているのかな、と思っていました。手元のデータで試すときは、おおよそ224×224以上の入力サイズで実行されてはいかがでしょうか。

2 件のコメント
なしを表示なしを非表示

HY 2021 年 2 月 28 日

kenta様

再度回答していただきありがとうございます。そうですね、車くらいの特徴でしたら32*32でも問題なさそうですね。

度々質もしてお申し訳ありません。納得いきました。

ありがとうございました。

Kenta 2021 年 2 月 28 日

いえいえ、参考になったようで幸いです。

サインインしてコメントする。

Faster R-CNNの入力サイズにつてい

0 件のコメント
-2 件の古いコメントを表示-2 件の古いコメントを非表示

採用された回答

2 件のコメント
なしを表示なしを非表示

その他の回答 (0 件)

参考

カテゴリ

タグ

Community Treasure Hunt

Faster R-CNNの入力サイズにつてい

0 件のコメント -2 件の古いコメントを表示-2 件の古いコメントを非表示

採用された回答

2 件のコメント なしを表示なしを非表示

その他の回答 (0 件)

参考

カテゴリ

タグ

Community Treasure Hunt

0 件のコメント
-2 件の古いコメントを表示-2 件の古いコメントを非表示

2 件のコメント
なしを表示なしを非表示