Main Content

readWordEmbedding

ファイルからの単語埋め込みの読み取り

説明

emb = readWordEmbedding(filename) は、テキスト ファイルまたは zip ファイル filename に格納されている事前学習済みの単語埋め込みを読み取ります。入力ファイルは、word2vec または GloVe のテキスト埋め込み形式の UTF-8 エンコードのテキスト ファイル、またはこの形式のテキスト ファイルを含む zip ファイルでなければなりません。

単語埋め込みファイルに重複する単語が含まれている場合、ソフトウェアは最後の重複エントリに対応する単語ベクトルを使用します。

すべて折りたたむ

単語の埋め込みの例を読み取ります。このモデルは、Wikipedia のテキストを解析して派生させました。

filename = "exampleWordEmbedding.vec";
emb = readWordEmbedding(filename)
emb = 
  wordEmbedding with properties:

     Dimension: 50
    Vocabulary: ["utc"    "first"    "new"    "two"    "time"    "up"    "school"    "article"    "world"    "years"    "university"    "talk"    "many"    "national"    "later"    "state"    "made"    "born"    "city"    "de"    ...    ] (1x9999 string)

word2vecvec2word を使用して単語埋め込みを調査します。

king = word2vec(emb,"king");
man = word2vec(emb,"man");
woman = word2vec(emb,"woman");
word = vec2word(emb,king - man + woman)
word = 
"queen"

入力引数

すべて折りたたむ

ファイルの名前。string スカラー、文字ベクトル、または文字ベクトルを含む 1 行 1 列の cell 配列として指定します。

データ型: string | char | cell

出力引数

すべて折りたたむ

出力の単語埋め込み。wordEmbedding オブジェクトとして返されます。

バージョン履歴

R2017b で導入