「テキストデータ解析のワークフローとその応用例」のビデオでは,テキスト解析の二つの例を紹介しています.
1. 車の故障原因の抽出 (1_VehicleRepairAnalysis)
対象データ: 英語テキスト
車の修理ログからメンテナンスを実施した理由を分析するために,テキストデータの数値化や不要な文字を取り除く前処理を行い,潜在的ディリクレ配分法 (Latent Dirichlet Allocation; LDA) を使用して修理ログのトピックモデリングを行う例です.
vehicleRepairAnalysis_jp.mlx がメインファイルです.
2. 観光地の類似度判定 (2_SightSimilarity)
対象データ: 日本語テキスト
観光地の説明文書から,それぞれの観光地の類似度を計算し,潜在意味解析 (Latent Semantic Analysis; LSA) を使用してある観光地に類似した観光地を見つけ出したり,単語の分散表現 (word2vec) を使用して特定の状況に関連する単語を発見する例です.
sight_analysis_live.mlx がメインファイルです.
MeCab の設定については,ref フォルダにあります mecab_x64_build_procedure_for_MATLAB.pdf に従ってください.
引用
mizuki (2024). テキストデータ解析のワークフローとその応用例 (Text Analytics Workflow and Applications) (https://www.mathworks.com/matlabcentral/fileexchange/66559-text-analytics-workflow-and-applications), MATLAB Central File Exchange. に取得済み.
MATLAB リリースの互換性
プラットフォームの互換性
Windows macOS Linuxカテゴリ
- MATLAB > Mathematics > Linear Algebra >
タグ
謝辞
ヒントを得たファイル: Simple Text Miner for Japanese
Community Treasure Hunt
Find the treasures in MATLAB Central and discover how the community can help you!
Start Hunting!TextAnalytics_FEX/1_VehicleRepairAnalysis/
TextAnalytics_FEX/2_SightSimilarity/
TextAnalytics_FEX/1_VehicleRepairAnalysis/
TextAnalytics_FEX/1_VehicleRepairAnalysis/ref/
TextAnalytics_FEX/2_SightSimilarity/
バージョン | 公開済み | リリース ノート | |
---|---|---|---|
1.0.0.0 | Added copywrite |