faster r-cnn についての質問

Question

HY 2020 年 9 月 25 日

0
リンク

この質問への直接リンク

https://jp.mathworks.com/matlabcentral/answers/599590-faster-r-cnn

コメント済み: HY 2020 年 9 月 26 日

Faster R-CNNにていて教えていただきたいことがあります。今、ディープラーニングで研究を行うにあたり先行研究(同研究室)で行われていたFaster R-CNNのネットワークを比較実験するために、学習済みのネットワークを調べています。このネットワークは2017aでのバージョンで作成されています。

ここで何点か疑問に思ったので質問いたします。

まず、InputLayerを調べてみると[32 32 3]と比較的小さいサイズになっているのですが、アンカーボックスのサイズはそれより大きい224*212などのサイズになっています。学習データはsmallestImageDemensionで700*700の同一サイズに変更されていますが、自分の理解ではそれをさらに32*32にリサイズされ入力層に流れると思っています。そこで下記のURLで同じような質問をしてあるのを見つけたのですが、どうやら仕様が2017とでは違うようで、2017では検出するオブジェクトの検出するサイズに合わせて入力サイズを決めているそうなのですが、答えにある内容があまり理解できませんでした。

この質問者と同じ疑問ですが[32 32]の画像ではあまりにも小さすぎると思い、どうやって学習していたのか疑問です。2020verで例にのっとって入力サイズを224*224で行ってもうまく学習できません。

https://jp.mathworks.com/matlabcentral/answers/332757-faster-rcnn-code-in-matlab#answer_261715

もし2017verでFRCNNを学習していた方や、この変更点について少しでも知っている方がいましたら、教えていただけると幸いです。

よろしくお願いいたします。

8 件のコメント
6 件の古いコメントを表示6 件の古いコメントを非表示

HY 2020 年 9 月 26 日

返信していただきありがとうございます。

チュートリアルのようにデータストアへ学習画像とラベルを入れてtransformを使用することは可能ですが、700*700などにサイズを変更して学習させると、inputLayerが32*32であるためかエラーが発生します。(32*32に変更すれば学習できますが、画像が小さすぎます。)

データストアを使わずに、table状態の学習データをtransformしたいのですが上手くできませんでした。(そもそもsmallestImageDimensionがtableの学習データサイズを変更できると説明にあったので必要ないよう感じますが...)

ちなみにミニバッチサイズを１すれば学習はできますがほぼ認識できません。サポートセンターに問い合わせたら、NumRegionsToSampleをミニバッチサイズにするように言われましたが、それでも上手くいきません。そもそも、領域をサンプリングする設定だから関係ないように感じますが。。。

余計なことまで長々と話してしまいすみません。

Kenta 2020 年 9 月 26 日

なるほど、ありがとうございます。

それではなぜ、先行研究のほうではうまく行ったんですかね？もし、以前どこかの質問やコメントですでに言及があれば申し訳ありません。

バックボーンネットワークを変えたり、アルゴリズムをR-CNN系からYOLOなどに変更してうまくいくとよいのですが、、、

HY 2020 年 9 月 26 日

一番上の質問に載せたURLでも質問しているように、2017aでの学習方法が今と違うみたいでこの違いがわかれば、なぜ先行研究が上手くいったのかわかりそうです。。。

同時進行でYOLOなども行っている状態です。

色々と検討していただき誠にありがとうございます。

サインインしてコメントする。

サインインしてこの質問に回答する。

Answer 1

Kenta 2020 年 9 月 26 日

0
リンク

この回答への直接リンク

https://jp.mathworks.com/matlabcentral/answers/599590-faster-r-cnn#answer_500797

コメントのほう、ありがとうございます。2017のバージョンは使ったことがなくて、今回の状況だと私にはわかりそうにありません。

ひとまず画像サイズを同一にするようtransformしてみて、かつ特徴抽出のバックボーンのネットワークを変えたりしてみるとよいかもしれません。また、transform後のバウンディングボックスと入力画像も可視化してみて、しっかりとうまくラベリングや前処理ができているかも見てみると良いと思います。色々と原因になりそうなことがあって、ここで同定できず残念ですが、こちらや以前のコメントなど参考になれば嬉しいです。

1 件のコメント
-1 件の古いコメントを表示-1 件の古いコメントを非表示

HY 2020 年 9 月 26 日

ありがとうございました。色々と確認してみます。

サインインしてコメントする。

faster r-cnn についての質問

8 件のコメント
6 件の古いコメントを表示6 件の古いコメントを非表示

採用された回答

1 件のコメント
-1 件の古いコメントを表示-1 件の古いコメントを非表示

その他の回答 (0 件)

参考

カテゴリ

タグ

Community Treasure Hunt

faster r-cnn についての質問

8 件のコメント 6 件の古いコメントを表示6 件の古いコメントを非表示

採用された回答

1 件のコメント -1 件の古いコメントを表示-1 件の古いコメントを非表示

その他の回答 (0 件)

参考

カテゴリ

タグ

Community Treasure Hunt

8 件のコメント
6 件の古いコメントを表示6 件の古いコメントを非表示

1 件のコメント
-1 件の古いコメントを表示-1 件の古いコメントを非表示