trainBERTDocumentClassifier

BERT 文書分類器の学習

R2023b 以降

構文

mdlTrained = trainBERTDocumentClassifier(documents,targets,mdl,options)

mdlTrained = trainBERTDocumentClassifier(tbl,mdl,options)

説明

Bidirectional Encoder Representations from Transformer (BERT) モデルは、文書分類やセンチメント分析などの自然言語処理タスクに合わせて微調整できるトランスフォーマーニューラルネットワークです。このネットワークは、注意層を使用してコンテキスト内のテキストを解析し、単語間の長距離依存関係を取得します。

mdlTrained = trainBERTDocumentClassifier(documents,targets,mdl,options) は、指定したテキストデータとターゲットを使用して BERT 文書分類器に学習させます。

例

mdlTrained = trainBERTDocumentClassifier(tbl,mdl,options) は、指定した table 内のテキストデータとターゲットを使用して BERT 文書分類器に学習させます。

例

すべて折りたたむ

BERT 文書分類器の学習

この例では次を使用します。

ライブスクリプトを開く

CSV ファイル factoryReports から学習データを読み取ります。このファイルには、各レポートの説明テキストとカテゴリカルラベルを含む工場レポートが格納されています。

filename = "factoryReports.csv";
data = readtable(filename,TextType="string");
head(data)

                                 Description                                       Category          Urgency          Resolution         Cost 
    _____________________________________________________________________    ____________________    ________    ____________________    _____

    "Items are occasionally getting stuck in the scanner spools."            "Mechanical Failure"    "Medium"    "Readjust Machine"         45
    "Loud rattling and banging sounds are coming from assembler pistons."    "Mechanical Failure"    "Medium"    "Readjust Machine"         35
    "There are cuts to the power when starting the plant."                   "Electronic Failure"    "High"      "Full Replacement"      16200
    "Fried capacitors in the assembler."                                     "Electronic Failure"    "High"      "Replace Components"      352
    "Mixer tripped the fuses."                                               "Electronic Failure"    "Low"       "Add to Watch List"        55
    "Burst pipe in the constructing agent is spraying coolant."              "Leak"                  "High"      "Replace Components"      371
    "A fuse is blown in the mixer."                                          "Electronic Failure"    "Low"       "Replace Components"      441
    "Things continue to tumble off of the belt."                             "Mechanical Failure"    "Low"       "Readjust Machine"         38

table の Category 列のラベルを categorical 値に変換します。

data.Category = categorical(data.Category);

データを学習セットとテストセットに分割します。ホールドアウトの割合を 10% に指定します。

cvp = cvpartition(data.Category,Holdout=0.1);
dataTrain = data(cvp.training,:);
dataTest = data(cvp.test,:);

table からテキストデータとラベルを抽出します。

textDataTrain = dataTrain.Description;
textDataTest = dataTest.Description;
TTrain = dataTrain.Category;
TTest = dataTest.Category;

bertDocumentClassifier 関数を使用して、事前学習済みの BERT-Base 文書分類器を読み込みます。

classNames = categories(data.Category);
mdl = bertDocumentClassifier(ClassNames=classNames)

mdl = 
  bertDocumentClassifier with properties:

       Network: [1×1 dlnetwork]
     Tokenizer: [1×1 bertTokenizer]
    ClassNames: ["Electronic Failure"    "Leak"    "Mechanical Failure"    "Software Failure"]

学習オプションを指定します。学習オプションの中から選択するには、経験的解析が必要です。実験を実行してさまざまな学習オプションの構成を調べるには、実験マネージャー (Deep Learning Toolbox)アプリを使用できます。

Adam オプティマイザーを使用して学習させます。
学習を 8 エポック行います。
微調整を行うため、学習率を下げます。学習率 0.0001 を使用して学習させます。
すべてのエポックでデータをシャッフルします。
学習の進行状況をプロットで監視し、精度メトリクスを監視します。
詳細出力を無効にします。

options = trainingOptions("adam", ...
    MaxEpochs=8, ...
    InitialLearnRate=1e-4, ...
    Shuffle="every-epoch", ...  
    Plots="training-progress", ...
    Metrics="accuracy", ...
    Verbose=false);

trainBERTDocumentClassifier 関数を使用してニューラルネットワークに学習させます。既定では、trainBERTDocumentClassifier 関数は利用可能な GPU がある場合にそれを使用します。GPU での学習には、Parallel Computing Toolbox™ ライセンスとサポートされている GPU デバイスが必要です。サポートされているデバイスの詳細については、GPU 計算の要件 (Parallel Computing Toolbox)を参照してください。そうでない場合、関数 trainBERTDocumentClassifier は CPU を使用します。実行環境を指定するには、ExecutionEnvironment 学習オプションを使用します。

mdl = trainBERTDocumentClassifier(textDataTrain,TTrain,mdl,options);

テストデータを使用して予測を行います。

YTest = classify(mdl,textDataTest);

テスト予測の分類精度を計算します。

accuracy = mean(TTest == YTest)

accuracy = 0.9375

入力引数

すべて折りたたむ

`documents` — 学習文書
string 配列 | 文字ベクトルの cell 配列 | `tokenizedDocument` 配列

学習文書。string 配列、文字ベクトルの cell 配列、または tokenizedDocument 配列として指定します。

documents と targets の要素の数は一致しなければなりません。

`targets` — 学習ターゲット
categorical 配列 | string 配列 | 文字ベクトルの cell 配列

学習ターゲット。categorical 配列、string 配列、または文字ベクトルの cell 配列として指定します。

`tbl` — 学習文書と学習ターゲット
table

学習文書と学習ターゲット。2 列の table として指定します。最初の列には、string または文字ベクトルとして指定したテキストデータを格納します。2 番目の列には、categorical 値、string、または文字ベクトルとして指定したターゲットを格納します。

データ型: table

`mdl` — BERT 文書分類器のモデル
`bertDocumentClassifier` オブジェクト

BERT 文書分類器のモデル。bertDocumentClassifier オブジェクトとして指定します。

`options` — 学習オプション
`TrainingOptionsSGDM` オブジェクト | `TrainingOptionsRMSProp` オブジェクト | `TrainingOptionsADAM` オブジェクト

学習オプション。関数 trainingOptions (Deep Learning Toolbox) によって返される TrainingOptionsSGDM、TrainingOptionsRMSProp、または TrainingOptionsADAM オブジェクトとして指定します。オブジェクトを作成するには、ソルバーをそれぞれ "sgdm"、"rmsprop"、および "adam" に設定します。

出力引数

すべて折りたたむ

`mdlTrained` — 学習済みの BERT 文書分類器のモデル
`bertDocumentClassifier` オブジェクト

BERT 文書分類器のモデル。bertDocumentClassifier オブジェクトとして返されます。

参照

[1] Devlin, Jacob, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova. "BERT: Pre-Training of Deep Bidirectional Transformers for Language Understanding" Preprint, submitted May 24, 2019. https://doi.org/10.48550/arXiv.1810.04805.

[2] Srivastava, Nitish, Geoffrey Hinton, Alex Krizhevsky, Ilya Sutskever, and Ruslan Salakhutdinov. "Dropout: A Simple Way to Prevent Neural Networks from Overfitting." The Journal of Machine Learning Research 15, no. 1 (January 1, 2014): 1929–58

[3] Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton. "ImageNet Classification with Deep Convolutional Neural Networks." Communications of the ACM 60, no. 6 (May 24, 2017): 84–90. https://doi.org/10.1145/3065386.

バージョン履歴

R2023b で導入

参考

classify | bertDocumentClassifier | bert | dlnetwork (Deep Learning Toolbox) | bertTokenizer

trainBERTDocumentClassifier

構文

説明

例

BERT 文書分類器の学習

入力引数

documents — 学習文書 string 配列 | 文字ベクトルの cell 配列 | tokenizedDocument 配列

targets — 学習ターゲット categorical 配列 | string 配列 | 文字ベクトルの cell 配列

tbl — 学習文書と学習ターゲット table

mdl — BERT 文書分類器のモデル bertDocumentClassifier オブジェクト

options — 学習オプション TrainingOptionsSGDM オブジェクト | TrainingOptionsRMSProp オブジェクト | TrainingOptionsADAM オブジェクト

出力引数

mdlTrained — 学習済みの BERT 文書分類器のモデル bertDocumentClassifier オブジェクト

参照

バージョン履歴

参考

トピック

`documents` — 学習文書
string 配列 | 文字ベクトルの cell 配列 | `tokenizedDocument` 配列

`targets` — 学習ターゲット
categorical 配列 | string 配列 | 文字ベクトルの cell 配列

`tbl` — 学習文書と学習ターゲット
table

`mdl` — BERT 文書分類器のモデル
`bertDocumentClassifier` オブジェクト

`options` — 学習オプション
`TrainingOptionsSGDM` オブジェクト | `TrainingOptionsRMSProp` オブジェクト | `TrainingOptionsADAM` オブジェクト

`mdlTrained` — 学習済みの BERT 文書分類器のモデル
`bertDocumentClassifier` オブジェクト