言語サポート

Text Analytics Toolbox™ での言語サポートに関する情報

Text Analytics Toolbox は、英語、日本語、ドイツ語、および韓国語の言語をサポートしています。Text Analytics Toolbox のほとんどの関数は、他の言語のテキストでも動作します。詳細については、言語に関する考慮事項を参照してください。

関数

すべて展開する

文書の前処理

`tokenizedDocument`	テキスト解析用のトークン化された文書の配列
`removeStopWords`	文書からのストップワードの削除
`normalizeWords`	単語のステミングまたはレンマ化
`stopWords`	ストップワードのリスト
`mecabOptions`	Options for MeCab tokenization

トークン、文、および品詞

`tokenDetails`	トークン化された文書の配列内のトークンの詳細
`addSentenceDetails`	Add sentence numbers to documents
`addPartOfSpeechDetails`	Add part-of-speech tags to documents
`addEntityDetails`	Add entity tags to documents
`addLemmaDetails`	文書に対するトークンのレンマの形式の追加
`addLanguageDetails`	Add language identifiers to documents
`corpusLanguage`	テキストの言語の検出

トピック

英語

テキストデータの準備
テキストデータを MATLAB^® にインポートして、解析のために前処理する
モデル化と予測
トピックモデルと単語埋め込みを使用して予測モデルを開発する
表示とプレゼンテーション
ワードクラウドとテキスト散布図を使用してテキストデータとモデルを可視化する

日本語

日本語言語サポート
Text Analytics Toolbox での日本語サポートに関する情報。
日本語のテキストデータの解析
この例では、トピックモデルを使用して、日本語のテキストデータをインポート、準備、および解析する方法を示します。

ドイツ語

ドイツ語サポート
Text Analytics Toolbox におけるドイツ語サポートに関する情報。
Analyze German Text Data
This example shows how to import, prepare, and analyze German text data using a topic model.

韓国語

韓国語サポート
Text Analytics Toolbox の韓国語サポートに関する情報。

その他の言語

言語に関する考慮事項
他の言語向けの、Text Analytics Toolbox の機能の使用に関する情報。
言語に依存しない機能
言語の詳細に依存しない Text Analytics Toolbox の機能

注目の例

日本語のテキストデータの解析

日本語のテキストデータの解析

この例では、トピックモデルを使用して、日本語のテキストデータをインポート、準備、および解析する方法を示します。

ライブスクリプトを開く

Analyze German Text Data

Analyze German Text Data

Import, prepare, and analyze German text data using a topic model.

ライブスクリプトを開く