readWordEmbedding

ファイルからの単語埋め込みの読み取り

構文

emb = readWordEmbedding(filename)

説明

emb = readWordEmbedding(filename) は、テキストファイルまたは zip ファイル filename に格納されている事前学習済みの単語埋め込みを読み取ります。入力ファイルは、word2vec または GloVe のテキスト埋め込み形式の UTF-8 エンコードのテキストファイル、またはこの形式のテキストファイルを含む zip ファイルでなければなりません。

単語埋め込みファイルに重複する単語が含まれている場合、ソフトウェアは最後の重複エントリに対応する単語ベクトルを使用します。

例

すべて折りたたむ

テキストファイルからの単語埋め込みの読み取り

ライブスクリプトを開く

単語の埋め込みの例を読み取ります。このモデルは、Wikipedia のテキストを解析して派生させました。

filename = "exampleWordEmbedding.vec";
emb = readWordEmbedding(filename)

emb = 
  wordEmbedding with properties:

     Dimension: 50
    Vocabulary: ["utc"    "first"    "new"    "two"    "time"    "up"    "school"    "article"    "world"    "years"    "university"    "talk"    "many"    "national"    "later"    "state"    "made"    "born"    "city"    "de"    …    ] (1×9999 string)

word2vec と vec2word を使用して単語埋め込みを調査します。

king = word2vec(emb,"king");
man = word2vec(emb,"man");
woman = word2vec(emb,"woman");
word = vec2word(emb,king - man + woman)

word = 
"queen"

入力引数

すべて折りたたむ

`filename` — ファイルの名前
string スカラー | 文字ベクトル | 文字ベクトルを含む 1 行 1 列の cell 配列

ファイルの名前。string スカラー、文字ベクトル、または文字ベクトルを含む 1 行 1 列の cell 配列として指定します。

データ型: string | char | cell

出力引数

すべて折りたたむ

`emb` — 出力の単語埋め込み
単語埋め込み

出力の単語埋め込み。wordEmbedding オブジェクトとして返されます。

バージョン履歴

R2017b で導入

参考

readWordEmbedding

構文

説明

例

テキスト ファイルからの単語埋め込みの読み取り

入力引数

filename — ファイルの名前 string スカラー | 文字ベクトル | 文字ベクトルを含む 1 行 1 列の cell 配列

出力引数

emb — 出力の単語埋め込み 単語埋め込み

バージョン履歴

参考

トピック

テキストファイルからの単語埋め込みの読み取り

`filename` — ファイルの名前
string スカラー | 文字ベクトル | 文字ベクトルを含む 1 行 1 列の cell 配列

`emb` — 出力の単語埋め込み
単語埋め込み