Faster R-CNNの入力サイズにつてい
3 ビュー (過去 30 日間)
古いコメントを表示
こんにちは。
Faster R-CNNを学習させようとしています。こちらのドキュメント(Faster R-CNN 深層学習オブジェクト検出器の学習 - MATLAB trainFasterRCNNObjectDetector - MathWorks 日本)を実際に実行してネットワークの入力サイズを確認したのですが、32×32×3でありかなり小さいサイズでした。
入力サイズがその値ということは、車の映る画像全体を32×32にリサイズしてネットワークに入力し、その後RPNで車のみをプーリングし分類+検出すると思うのですが、物理的に入力サイズが小さすぎませんでしょうか。しかし、ドキュメントではこの値で精度良く検出できていて不思議です。
逆にこちらのドキュメント(Faster R-CNN 深層学習の検出器を使用したオブジェクトの検出 - MATLAB - MathWorks 日本)では、Resnetを使用しており入力サイズが224×224であり、かなりサイズが違います。物理的な大きさで言えばこちらの方が特徴が学習しやすいように感じます。
そもそもこの2つのドキュメントですが、タイトルが違うものの検出器を学習させ最後にオブジェクトを検出しているので、行っていることは同じでしょうか?
最後に32×32のような人間が見ても特徴がわからないサイズで物体検出できている理由が知りたいです。
勉強不足で申し訳ありませんが、よろしくお願いいたします。
0 件のコメント
採用された回答
Kenta
2021 年 2 月 28 日
32×32のほうはあくまで例として用意されていて、実質はより大きな画像サイズで試すべきなのだと思います。32×32にしても、ぼやっと車のピクセルなどが存在するので、今回はそれをうまく拾える場合が多いので検出自体はできる、くらいの理解でよいのではないでしょうか。faster RCNNはそれなりに計算時間がかかるので、小さいサイズにして試しやすくしているのかな、と思っていました。手元のデータで試すときは、おおよそ224×224以上の入力サイズで実行されてはいかがでしょうか。
その他の回答 (0 件)
参考
Community Treasure Hunt
Find the treasures in MATLAB Central and discover how the community can help you!
Start Hunting!