事前学習済みの深層ニューラルネットワーク

自然イメージから強力で情報量の多い特徴を抽出するよう既に学習させてある事前学習済みのイメージ分類ニューラルネットワークを用意し、新しいタスクを学習させるための出発点として、そのニューラルネットワークを使用できます。事前学習済みのニューラルネットワークの大部分は、ImageNet データベース[1]のサブセットで学習しています。このデータベースは ImageNet Large-Scale Visual Recognition Challenge (ILSVRC)[17]で使用されています。これらのニューラルネットワークは、100 万個を超えるイメージで学習しており、イメージを 1000 個のオブジェクトカテゴリ (キーボード、マグカップ、鉛筆、多くの動物など) に分類できます。通常は、転移学習によって事前学習済みのニューラルネットワークを使用する方が、ニューラルネットワークにゼロから学習させるよりもはるかに簡単で時間がかかりません。

事前学習済みのニューラルネットワークは、次のタスクで使用できます。

目的	説明
分類	事前学習済みのニューラルネットワークを分類問題に直接適用します。新しいイメージを分類するには、`minibatchpredict` を使用します。予測された分類スコアをラベルに変換するには、関数 `scores2label` を使用します。事前学習済みのニューラルネットワークを分類に使用する方法を示す例については、GoogLeNet を使用したイメージの分類を参照してください。
特徴抽出	層の活性化を特徴として使用することで、事前学習済みのニューラルネットワークを特徴抽出器として使用します。これらの活性化を、サポートベクターマシン (SVM) などの別の機械学習モデルの学習で特徴として使用できます。詳細については、特徴抽出を参照してください。例については、事前学習済みのネットワークを使用したイメージの特徴の抽出を参照してください。
転移学習	大規模なデータセットで学習させたニューラルネットワークから層を取り出し、新しいデータセットで微調整します。詳細については、転移学習を参照してください。簡単な例については、転移学習入門を参照してください。他の事前学習済みのニューラルネットワークを試してみるには、新しいイメージを分類するためのニューラルネットワークの再学習を参照してください。

事前学習済みのニューラルネットワークの比較

事前学習済みのニューラルネットワークには、問題に適用するニューラルネットワークを選択する際に重要になるさまざまな特性があります。最も重要な特性は、ニューラルネットワークの精度、速度、およびサイズです。ニューラルネットワークの選択には、通常、これらの特性の間のトレードオフが生じます。以下のプロットを使用して、ニューラルネットワークを使用した予測に要する時間と ImageNet 検証精度を比較します。

ヒント

転移学習を始めるには、SqueezeNet や GoogLeNet など、高速なニューラルネットワークのいずれかを選択してみてください。繰り返しを迅速に実行でき、データの前処理手順や学習オプションなどのさまざまな設定を試すことができます。適切に機能する設定の感触を得てから、Inception-v3 や ResNet などのより正確なニューラルネットワークを試し、結果が改善されるか確認します。

Comparison of the accuracy and relative prediction time of the pretrained neural networks. As the accuracy of the pretrained neural networks increases, so does the relative prediction time.

メモ

以上のプロットは、さまざまなニューラルネットワークの相対速度の指標のみを示しています。厳密な予測と学習の反復回数は、使用するハードウェアとミニバッチサイズによって異なります。

精度が高く高速なものが優れたニューラルネットワークです。プロットには、最新の GPU (NVIDIA^® Tesla^® P100) およびサイズが 128 のミニバッチを使用した場合の、予測時間に対する分類精度が表示されています。予測時間は、最も高速なニューラルネットワークを基準にして測定されます。各マーカーの面積は、ディスク上でのニューラルネットワークのサイズに比例します。

ImageNet 検証セットでの分類精度は、ImageNet で学習させたニューラルネットワークの精度を測定する最も一般的な方法です。多くの場合、ImageNet において正確なニューラルネットワークは、転移学習または特徴抽出を使用して他の自然イメージデータセットに適用した場合にも正確です。このような汎化が可能である理由として、これらのニューラルネットワークが自然イメージから強力で情報量の多い特徴を抽出するよう学習済みであり、それらの特徴が他の類似データセットに汎化される点が挙げられます。ただし、ImageNet での高い精度は、必ずしも他のタスクにそのまま移行されないため、複数のニューラルネットワークを試すことをお勧めします。

制約のあるハードウェアを使用して予測を実行する場合やインターネットを介してニューラルネットワークを分散させる場合は、ディスクやメモリ上でのニューラルネットワークのサイズも考慮してください。

ニューラルネットワークの精度

ImageNet 検証セットでの分類精度を計算するには複数の方法があり、ソースによって異なる方法が使用されます。複数モデルのアンサンブルを使用する場合もあれば、複数のトリミングを使用して各イメージを複数回評価する場合もあります。場合によっては、標準的な (最上位の) 精度ではなく、上位 5 つの精度を見積もります。このような違いがあるため、異なるソースでの精度を直接比較することができないことがよくあります。Deep Learning Toolbox™ の事前学習済みのニューラルネットワークの精度は、単一モデルとイメージの中心での単一のトリミングを使用した、標準的な (最上位の) 精度です。

事前学習済みのニューラルネットワークの読み込み

SqueezeNet ニューラルネットワークを読み込むには、関数 imagePretrainedNetwork を使用します。

[net,classNames] = imagePretrainedNetwork;

他のニューラルネットワークの場合は、関数 imagePretrainedNetwork の最初の引数を使用してモデルを指定します。ネットワークに必要なサポートパッケージがない場合、この関数は、ダウンロードするためのリンクを表示します。あるいは、アドオンエクスプローラーから事前学習済みのニューラルネットワークをダウンロードすることもできます。

次の表に、ImageNet で学習させた利用可能な事前学習済みのニューラルネットワークとそれらのプロパティの一部を示します。ニューラルネットワークの深さは、ネットワーク入力からネットワーク出力までのパスにある逐次畳み込み層または全結合層の最大数として定義されます。すべてのニューラルネットワークの入力は RGB イメージです。

`imagePretrainedNetwork` のモデル名引数	ニューラルネットワーク名	深さ	パラメーターメモリ	パラメーター数 (100 万個単位)	イメージ入力サイズ	入力値の範囲	入力層の正規化	必要なサポートパッケージ
`"squeezenet"`	SqueezeNet [2]	18	4.7 MB	1.24	227-by-227	[0, 255]	`"zerocenter"`	なし
`"googlenet"`	GoogLeNet [3][4]	22	27 MB	7.0	224-by-224	[0, 255]	`"zerocenter"`	Deep Learning Toolbox Model for GoogLeNet Network
`"googlenet-places365"`	GoogLeNet [3][4]	22	24 MB	6.3	224-by-224	[0, 255]	`"zerocenter"`	Deep Learning Toolbox Model for GoogLeNet Network
`"inceptionv3"`	Inception-v3 [5]	48	91 MB	23.9	299-by-299	[0, 255]	`"rescale-symmetric"`	Deep Learning Toolbox Model for Inception-v3 Network
`"densenet201"`	DenseNet-201 [6]	201	77 MB	20.0	224-by-224	[0, 255]	`"zscore"`	Deep Learning Toolbox Model for DenseNet-201 Network
`"mobilenetv2"`	MobileNet-v2 [7]	53	14 MB	3.5	224-by-224	[0, 255]	`"zscore"`	Deep Learning Toolbox Model for MobileNet-v2 Network
`"resnet18"`	ResNet-18 [8]	18	45 MB	11.7	224-by-224	[0, 255]	`"zscore"`	Deep Learning Toolbox Model for ResNet-18 Network
`"resnet50"`	ResNet-50 [8]	50	98 MB	25.6	224-by-224	[0, 255]	`"zscore"`	Deep Learning Toolbox Model for ResNet-50 Network
`"resnet101"`	ResNet-101 [8]	101	171 MB	44.6	224-by-224	[0, 255]	`"zerocenter"`	Deep Learning Toolbox Model for ResNet-101 Network
`"xception"`	Xception [9]	71	88 MB	22.9	299-by-299	[0, 255]	`"rescale-symmetric"`	Deep Learning Toolbox Model for Xception Network
`"inceptionresnetv2"`	Inception-ResNet-v2 [10]	164	213 MB	55.9	299-by-299	[0, 255]	`"rescale-symmetric"`	Deep Learning Toolbox Model for Inception-ResNet-v2 Network
`"shufflenet"`	ShuffleNet [11]	50	5.5 MB	1.4	224-by-224	[0, 255]	`"zscore"`	Deep Learning Toolbox Model for ShuffleNet Network
`"nasnetmobile"`	NASNet-Mobile [12]	*	20 MB	5.3	224-by-224	[0, 255]	`"rescale-symmetric"`	Deep Learning Toolbox Model for NASNet-Mobile Network
`"nasnetlarge"`	NASNet-Large [12]	*	340 MB	88.9	331-by-331	[0, 255]	`"rescale-symmetric"`	Deep Learning Toolbox Model for NASNet-Large Network
`"darknet19"`	DarkNet-19 [13]	19	80 MB	20.8	256 x 256	[0, 255]	`"rescale-zero-one"`	Deep Learning Toolbox Model for DarkNet-19 Network
`"darknet53"`	DarkNet-53 [13]	53	159 MB	41.6	256 x 256	[0, 255]	`"rescale-zero-one"`	Deep Learning Toolbox Model for DarkNet-53 Network
`"efficientnetb0"`	EfficientNet-b0 [14]	82	20 MB	5.3	224-by-224	[0, 255]	`"zscore"`	Deep Learning Toolbox Model for EfficientNet-b0 Network
`"alexnet"`	AlexNet [15]	8	233 MB	61.0	227-by-227	[0, 255]	`"zerocenter"`	Deep Learning Toolbox Model for AlexNet Network
`"vgg16"`	VGG-16 [16]	16	528 MB	138	224-by-224	[0, 255]	`"zerocenter"`	Deep Learning Toolbox Model for VGG-16 Network
`"vgg19"`	VGG-19 [16]	19	548 MB	144	224-by-224	[0, 255]	`"zerocenter"`	Deep Learning Toolbox Model for VGG-19 Network

*NASNet-Mobile ニューラルネットワークおよび NASNet-Large ニューラルネットワークは、モジュールの線形シーケンスで構成されていません。

Places365 で学習させた GoogLeNet

標準の GoogLeNet ニューラルネットワークは ImageNet データセットで学習していますが、Places365 データセット[18][4]で学習させたニューラルネットワークを読み込むこともできます。Places365 で学習させたニューラルネットワークは、イメージを 365 個の異なる場所カテゴリ (野原、公園、滑走路、ロビーなど) に分類します。Places365 データセットで学習させた事前学習済みの GoogLeNet ニューラルネットワークを読み込むには、imagePretrainedNetwork("googlenet-places365") を使用します。新しいタスク用に転移学習を実行する場合、最も一般的な方法は、ImageNet で事前学習させたニューラルネットワークを使用することです。新しいタスクがシーンの分類に似ている場合は、Places365 で学習させたニューラルネットワークを使用すると精度を改善できることがあります。

オーディオタスクに適した事前学習済みのニューラルネットワークの詳細については、オーディオアプリケーション用の事前学習済みのニューラルネットワークを参照してください。

事前学習済みのニューラルネットワークの可視化

ディープネットワークデザイナーを使用し、事前学習済みのニューラルネットワークを読み込んで可視化できます。

[net,classNames] = imagePretrainedNetwork;
deepNetworkDesigner(net)

Deep Network Designer displaying a pretrained SqueezeNet neural network

層のプロパティを表示して編集するには、層を選択します。層のプロパティに関する情報については、層の名前の横にあるヘルプアイコンをクリックしてください。

Cross channel normalization layer selected in Deep Network Designer. The PROPERTIES pane shows the properties of the layer.

ディープネットワークデザイナーで [新規] をクリックし、事前学習済みの他のニューラルネットワークを探索します。

Deep Network Designer start page showing available pretrained neural networks

ニューラルネットワークをダウンロードする必要がある場合は、目的のニューラルネットワークで [インストール] をクリックしてアドオンエクスプローラーを開きます。

特徴抽出

特徴抽出は、ニューラルネットワーク全体の学習に時間や手間をかけずに深層学習の能力を活用できる簡単で高速な方法です。これが必要とするものは学習イメージを一巡する 1 つのパスのみであるため、GPU がない場合、特に便利です。事前学習済みのニューラルネットワークから学習済みのイメージの特徴を抽出し、fitcsvm (Statistics and Machine Learning Toolbox) を使用するサポートベクターマシンなどの分類器の学習でそれらの特徴を使用できます。

新しいデータセットの規模が非常に小さい場合、特徴抽出を試みてください。抽出された特徴についてシンプルな分類器に学習させるだけであるため、学習は高速です。また、学習するデータがほとんどないため、ニューラルネットワークの深い層を微調整しても精度が改善される可能性はあまりありません。

使用するデータが元のデータと非常によく似ている場合は、ニューラルネットワークの深い部分で抽出された、より具体的な特徴が、その新しいタスクに役立つ可能性が高くなります。
使用するデータが元のデータと大きく異なる場合、ニューラルネットワークの深い部分で抽出された特徴は、目的のタスクにあまり役立たない可能性があります。初期のニューラルネットワーク層から抽出された、より一般的な特徴について最後の分類器の学習を試みてください。新しいデータセットの規模が大きい場合、ゼロからのニューラルネットワークの学習を試みることもできます。

ResNet ニューラルネットワークは、多くの場合に適切な特徴抽出器です。事前学習済みのニューラルネットワークを特徴抽出に使用する方法を示す例については、事前学習済みのネットワークを使用したイメージの特徴の抽出を参照してください。

転移学習

事前学習済みのニューラルネットワークを開始点として、新しいデータセットについてニューラルネットワークに学習させることによって、ニューラルネットワークの深い層を微調整できます。多くの場合、転移学習を伴うニューラルネットワークを微調整する方が、新しいニューラルネットワークを構築して学習させるよりも簡単で時間がかかりません。このニューラルネットワークはイメージの特徴を既に多数学習していますが、ニューラルネットワークを微調整すると、新しいデータセットに固有の特徴をニューラルネットワークに学習させることができます。データセットが非常に大規模な場合、転移学習はゼロから学習する場合に比べて速くならない可能性があります。

ヒント

ニューラルネットワークを微調整すると、多くの場合、精度を最大限に高められます。非常に小さいデータセット (クラスごとのイメージ数が約 20 未満) の場合、代わりに特徴抽出を試みてください。

ニューラルネットワークの微調整は、単純な特徴抽出よりも時間と手間がかかりますが、ニューラルネットワークにさまざまな特徴セットの抽出を学習させることができるため、多くの場合に最終的なニューラルネットワークの精度が向上します。ニューラルネットワークには新しい特徴を学習するためのデータがあるので、新しいデータセットの規模があまり小さくなければ、通常は特徴抽出よりも微調整がうまく機能します。転移学習の実行方法を示す例は、ディープネットワークデザイナーを使用した転移学習用のネットワークの準備および新しいイメージを分類するためのニューラルネットワークの再学習を参照してください。

Transfer learning workflow

ニューラルネットワークのインポートとエクスポート

TensorFlow™ 2、TensorFlow-Keras、Keras 3、PyTorch^®、および ONNX™ (Open Neural Network Exchange) の各モデル形式からニューラルネットワークをインポートできます。Deep Learning Toolbox のニューラルネットワークを TensorFlow 2 および ONNX モデル形式にエクスポートすることもできます。

ヒント

ディープネットワークデザイナーアプリを使用して、外部プラットフォームからモデルをインポートできます。インポート時に、アプリは注意が必要な問題の詳細を含むインポートレポートを表示します。

インポート関数

外部の深層学習プラットフォームとモデルの形式	`dlnetwork` としてのモデルのインポート
TensorFlow ニューラルネットワーク、`SavedModel` 形式の TensorFlow-Keras ニューラルネットワーク、または Keras 3 ニューラルネットワーク	ディープネットワークデザイナーまたは `importNetworkFromTensorFlow` または `importNetworkFromKeras`
`.pt` ファイルに含まれるトレースされた PyTorch モデル	ディープネットワークデザイナーまたは `importNetworkFromPyTorch`
ONNX モデル形式のニューラルネットワーク	`importNetworkFromONNX`

ソフトウェアによって組み込みの MATLAB^® 層に変換できない TensorFlow 層、PyTorch 層、または ONNX 演算子を含むモデルがインポートされた場合、ソフトウェアはネットワークのインポート時にカスタム層を自動的に生成します。ソフトウェアは、自動的に生成されたカスタム層を現在のフォルダー内のパッケージに保存します。詳細については、自動生成されるカスタム層を参照してください。

エクスポート関数

外部の深層学習プラットフォームとモデルの形式	ニューラルネットワークまたは層グラフのエクスポート
Python^® パッケージに含まれる TensorFlow 2 モデル	`exportNetworkToTensorFlow`
ONNX モデル形式	`exportONNXNetwork`

関数 exportNetworkToTensorFlow は、Deep Learning Toolbox のニューラルネットワークを Python パッケージに含まれる TensorFlow モデルとして保存します。エクスポートされたモデルを読み込んで SavedModel 形式として保存する方法の詳細については、エクスポートされた TensorFlow モデルの読み込みおよびTensorFlow モデルの保存を参照してください。

ONNX を中間形式として使用することで、ONNX モデルのエクスポートまたはインポートをサポートしている他の深層学習フレームワークと相互運用できます。

Import neural networks from and export neural networks to external deep learning platforms.

オーディオアプリケーション用の事前学習済みのニューラルネットワーク

Audio Toolbox™ には、事前学習済みのオーディオ深層学習ネットワーク向けの MATLAB および Simulink^® のサポートが用意されています。事前学習済みのネットワークを使用して、YAMNet で音を分類し、CREPE でピッチを推定し、VGGish または OpenL3 で特徴埋め込みを抽出し、VADNet で音声区間検出 (VAD) を実行します。ディープネットワークデザイナーを使用し、事前学習済みのオーディオニューラルネットワークをインポートして可視化することもできます。

関数 audioPretrainedNetwork (Audio Toolbox) を使用して、事前学習済みのオーディオネットワークを読み込みます。オーディオの前処理、ネットワーク推論、およびネットワーク出力の後処理を扱うエンドツーエンド関数の 1 つを使用することもできます。次の表は、利用可能な事前学習済みオーディオニューラルネットワークの一覧です。

`audioPretrainedNetwork` のモデル名引数	ニューラルネットワーク名	前処理関数および後処理関数	エンドツーエンド関数	Simulink ブロック
`"yamnet"`	YAMNet	`yamnetPreprocess` (Audio Toolbox)	`classifySound` (Audio Toolbox)	YAMNet (Audio Toolbox), Sound Classifier (Audio Toolbox)
`"vggish"`	VGGish	`vggishPreprocess` (Audio Toolbox)	`vggishEmbeddings` (Audio Toolbox)	VGGish (Audio Toolbox), VGGish Embeddings (Audio Toolbox)
`"openl3"`	OpenL3	`openl3Preprocess` (Audio Toolbox)	`openl3Embeddings` (Audio Toolbox)	OpenL3 (Audio Toolbox), OpenL3 Embeddings (Audio Toolbox)
`"crepe"`	CREPE	`crepePreprocess` (Audio Toolbox), `crepePostprocess` (Audio Toolbox)	`pitchnn` (Audio Toolbox)	CREPE (Audio Toolbox), Deep Pitch Estimator (Audio Toolbox)
`"vadnet"`	VADNet	`vadnetPreprocess` (Audio Toolbox), `vadnetPostprocess` (Audio Toolbox)	`detectspeechnn` (Audio Toolbox)	なし

事前学習済みのオーディオニューラルネットワークを新しいタスクに適応させる方法を示す例については、Transfer Learning with Pretrained Audio Networks (Audio Toolbox)およびAdapt Pretrained Audio Network for New Data Using Deep Network Designerを参照してください。

オーディオアプリケーション用の深層学習の使用に関する詳細については、Deep Learning for Audio Applications (Audio Toolbox)を参照してください。

コンピュータービジョンのアプリケーション用の事前学習済みニューラルネットワーク

Computer Vision Toolbox™ には、オブジェクト検出用の事前学習済みの深層学習ネットワーク向けに MATLAB のサポートが用意されています。事前学習済みのネットワークを使用し、テストイメージに対する既成の推論処理やカスタムデータセットに基づく転移学習を実行することができます。ディープネットワークデザイナーアプリを使用し、オブジェクト検出用の事前学習済みのニューラルネットワークをインポートして可視化することもできます。

事前学習済みのオブジェクト検出ネットワークを使用するには、必要なサポートパッケージをダウンロードしてインストールします。アドオンエクスプローラーを使用し、事前学習済みのモデルサポートパッケージをダウンロードしてインストールできます。アドオンのインストールの詳細については、アドオンの取得と管理を参照してください。

yoloxObjectDetector (Computer Vision Toolbox) などのオブジェクト検出モデルを使用し、オブジェクト検出用の対応する事前学習済みネットワークを指定します。オブジェクト検出モデルを選択するには、オブジェクト検出器の選択 (Computer Vision Toolbox)を参照してください。オブジェクト検出の詳細については、深層学習を使用したオブジェクト検出入門 (Computer Vision Toolbox)を参照してください。

事前学習済みオブジェクト検出ネットワーク名の引数	オブジェクト検出モデル	必要なサポートパッケージ
`"darknet19-coco"` `"tiny-yolov2-coco"`	YOLO v2 – `yolov2ObjectDetector` (Computer Vision Toolbox)	Computer Vision Toolbox Model for YOLO v2 Object Detection
`"darknet53-coco"` `"tiny-yolov3-coco"`	YOLO v3 – `yolov3ObjectDetector` (Computer Vision Toolbox)	Computer Vision Toolbox Model for YOLO v3 Object Detection
`"csp-darknet53-coco"` `"tiny-yolov4-coco"`	YOLO v4 – `yolov4ObjectDetector` (Computer Vision Toolbox)	Computer Vision Toolbox Model for YOLO v4 Object Detection
`"nano-coco"` `"tiny-coco"` `"small-coco"` `"medium-coco"` `"large-coco"`	YOLOX – `yoloxObjectDetector` (Computer Vision Toolbox)	Automated Visual Inspection Library for Computer Vision Toolbox
`"tiny-network-coco"` `"small-network-coco"` `"medium-network-coco"` `"large-network-coco"`	RTMDet – `rtmdetObjectDetector` (Computer Vision Toolbox)	Computer Vision Toolbox Model for RTMDet Object Detection

GitHub の事前学習済みモデル

最新の事前学習済みモデルを見つけるには、MATLAB Deep Learning Model Hub を参照してください。

以下に例を示します。

GPT-2、BERT、FinBERT などのテキストベースの変換器モデルについては、Transformer Models for MATLAB の GitHub^® リポジトリを参照してください。
事前学習済みの EfficientDet-D0 オブジェクト検出モデルについては、Pretrained EfficientDet Network For Object Detection の GitHub リポジトリを参照してください。

参照

[1] ImageNet. http://www.image-net.org.

[2] Iandola, Forrest N., Song Han, Matthew W. Moskewicz, Khalid Ashraf, William J. Dally, and Kurt Keutzer. “SqueezeNet: AlexNet-Level Accuracy with 50x Fewer Parameters and <0.5MB Model Size.” Preprint, submitted November 4, 2016. https://arxiv.org/abs/1602.07360.

[3] Szegedy, Christian, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, and Andrew Rabinovich. “Going Deeper with Convolutions.” In 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 1–9. Boston, MA, USA: IEEE, 2015. https://doi.org/10.1109/CVPR.2015.7298594.

[4] Places. http://places2.csail.mit.edu/

[5] Szegedy, Christian, Vincent Vanhoucke, Sergey Ioffe, Jon Shlens, and Zbigniew Wojna. “Rethinking the Inception Architecture for Computer Vision.” In 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2818–26. Las Vegas, NV, USA: IEEE, 2016. https://doi.org/10.1109/CVPR.2016.308.

[6] Huang, Gao, Zhuang Liu, Laurens Van Der Maaten, and Kilian Q. Weinberger. “Densely Connected Convolutional Networks.” In 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2261–69. Honolulu, HI: IEEE, 2017. https://doi.org/10.1109/CVPR.2017.243.

[7] Sandler, Mark, Andrew Howard, Menglong Zhu, Andrey Zhmoginov, and Liang-Chieh Chen. “MobileNetV2: Inverted Residuals and Linear Bottlenecks.” In 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, 4510–20. Salt Lake City, UT: IEEE, 2018. https://doi.org/10.1109/CVPR.2018.00474.

[8] He, Kaiming, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. “Deep Residual Learning for Image Recognition.” In 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 770–78. Las Vegas, NV, USA: IEEE, 2016. https://doi.org/10.1109/CVPR.2016.90.

[9] Chollet, François. “Xception: Deep Learning with Depthwise Separable Convolutions.” Preprint, submitted in 2016. https://doi.org/10.48550/ARXIV.1610.02357.

[10] Szegedy, Christian, Sergey Ioffe, Vincent Vanhoucke, and Alexander Alemi. “Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning.” Proceedings of the AAAI Conference on Artificial Intelligence 31, no. 1 (February 12, 2017). https://doi.org/10.1609/aaai.v31i1.11231.

[11] Zhang, Xiangyu, Xinyu Zhou, Mengxiao Lin, and Jian Sun. “ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices.” Preprint, submitted July 4, 2017. http://arxiv.org/abs/1707.01083.

[12] Zoph, Barret, Vijay Vasudevan, Jonathon Shlens, and Quoc V. Le. “Learning Transferable Architectures for Scalable Image Recognition.” Preprint, submitted in 2017. https://doi.org/10.48550/ARXIV.1707.07012.

[13] Redmon, Joseph. “Darknet: Open Source Neural Networks in C.” https://pjreddie.com/darknet.

[14] Tan, Mingxing, and Quoc V. Le. “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks.” Preprint, submitted in 2019. https://doi.org/10.48550/ARXIV.1905.11946.

[15] Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton. "ImageNet Classification with Deep Convolutional Neural Networks." Communications of the ACM 60, no. 6 (May 24, 2017): 84–90. https://doi.org/10.1145/3065386.

[16] Simonyan, Karen, and Andrew Zisserman. “Very Deep Convolutional Networks for Large-Scale Image Recognition.” Preprint, submitted in 2014. https://doi.org/10.48550/ARXIV.1409.1556.

[17] Russakovsky, O., Deng, J., Su, H., et al. “ImageNet Large Scale Visual Recognition Challenge.” International Journal of Computer Vision (IJCV). Vol 115, Issue 3, 2015, pp. 211–252

[18] Zhou, Bolei, Aditya Khosla, Agata Lapedriza, Antonio Torralba, and Aude Oliva. "Places: An image database for deep scene understanding." arXiv preprint arXiv:1610.02055 (2016).

参考

トピック

外部の Web サイト

MATLAB Deep Learning Model Hub

事前学習済みの深層ニューラル ネットワーク

事前学習済みのニューラル ネットワークの比較

ニューラル ネットワークの精度

事前学習済みのニューラル ネットワークの読み込み

Places365 で学習させた GoogLeNet

事前学習済みのニューラル ネットワークの可視化

特徴抽出

転移学習

ニューラル ネットワークのインポートとエクスポート

オーディオ アプリケーション用の事前学習済みのニューラル ネットワーク

コンピューター ビジョンのアプリケーション用の事前学習済みニューラル ネットワーク

GitHub の事前学習済みモデル

参照

参考

トピック

外部の Web サイト

事前学習済みの深層ニューラルネットワーク

事前学習済みのニューラルネットワークの比較

ニューラルネットワークの精度

事前学習済みのニューラルネットワークの読み込み

事前学習済みのニューラルネットワークの可視化

ニューラルネットワークのインポートとエクスポート

オーディオアプリケーション用の事前学習済みのニューラルネットワーク

コンピュータービジョンのアプリケーション用の事前学習済みニューラルネットワーク