Main Content

言語サポート

Text Analytics Toolbox™ での言語サポートに関する情報

Text Analytics Toolbox は、英語、日本語、ドイツ語、および韓国語の言語をサポートしています。Text Analytics Toolbox のほとんどの関数は、他の言語のテキストでも動作します。詳細については、言語に関する考慮事項を参照してください。

関数

すべて展開する

tokenizedDocumentテキスト解析用のトークン化された文書の配列
removeStopWords文書からのストップ ワードの削除
normalizeWords単語のステミングまたはレンマ化
stopWordsストップ ワードのリスト
mecabOptionsOptions for MeCab tokenization (R2019b 以降)
tokenDetailsDetails of tokens in tokenized document array
addSentenceDetailsAdd sentence numbers to documents
addPartOfSpeechDetailsAdd part-of-speech tags to documents
addEntityDetailsAdd entity tags to documents (R2019a 以降)
addLemmaDetailsAdd lemma forms of tokens to documents
addLanguageDetailsAdd language identifiers to documents
corpusLanguageテキストの言語の検出

トピック

英語

日本語

ドイツ語

韓国語

その他の言語