Text Analytics Toolbox の分かち書きで、カスタム辞書を追加できますか?

2 ビュー (過去 30 日間)
MathWorks Support Team
MathWorks Support Team 2023 年 3 月 19 日
編集済み: MathWorks Support Team 2023 年 4 月 13 日
Text Analytics Toolbox では、日本語の辞書として MeCab を使用しているようですが、既存の辞書にカスタム辞書を追加させる方法を教えてください。
例えば、現代文ではなく、古文の解析を行うための辞書や医療系用語の辞書を追加したいです。
 

採用された回答

MathWorks Support Team
MathWorks Support Team 2023 年 4 月 13 日
編集済み: MathWorks Support Team 2023 年 4 月 13 日
カスタム辞書を追加させたい場合、mecabOptions 関数を使用することが可能です。
・mecabOptions
以下は、中古和文Unidic を用いた例です。辞書の保存先を、"C:\temp\dict\UniDic-wabun_1603" としています。
str = "いづれの御時にか、女御、更衣あまたさぶらひたまひけるなかに、いとやむごとなき際にはあらぬが、すぐれて時めきたまふありけり。"
options = mecabOptions('Model','C:\temp\dict\UniDic-wabun_1603'); % カスタム辞書のフォルダ指定
documents = tokenizedDocument(str,'TokenizeMethod',options)
tkns = tokenDetails(documents)

その他の回答 (0 件)

カテゴリ

Help Center および File ExchangeConvert Image Type についてさらに検索

製品


リリース

R2020a

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!