addDependencyDetails

文書への文法的依存関係の詳細の追加

R2022b 以降

構文

updatedDocuments = addDependencyDetails(documents)

説明

addDependencyDetails を使用して、文法的依存関係の詳細を文書に追加します。

この関数には、Deep Learning Toolbox™ と Text Analytics Toolbox™ Model for UDify Data サポートパッケージが必要です。関数は、英語、日本語、ドイツ語、および韓国語のテキストをサポートしています。

updatedDocuments = addDependencyDetails(documents) は、文法的依存関係の詳細を documents に追加し、トークンの詳細を更新します。updatedDocuments から依存関係の詳細を取得するには、tokenDetails を使用します。

例

すべて折りたたむ

文書への文法的依存関係の詳細の追加

ライブスクリプトを開く

1 つの文を含むトークン化された文書オブジェクトを作成します。

str = "The quick brown fox jumped over the lazy dog.";
document = tokenizedDocument(str)

document = 
  tokenizedDocument:

   10 tokens: The quick brown fox jumped over the lazy dog .

文書に文法的依存関係の詳細を追加します。関数 addDependencyDetails には、Text Analytics Toolbox™ Model for UDify Data サポートパッケージが必要です。このサポートパッケージがインストールされていない場合、関数によってダウンロードリンクが提供されます。

document = addDependencyDetails(document);

関数 tokenDetails を使用してトークンの詳細を表示します。table の変数 Head と変数 Dependency は、依存関係の詳細のツリー構造を形成します。たとえば、この文では "lazy" という単語が "dog" という単語を修飾しているため、トークン詳細の table には、トークン "lazy" の主辞として "dog" のトークン番号がリストされます。

details = tokenDetails(document)

details=10×8 table
    "The"    1    1    1    letters    en    4    det
    "quick"    1    1    1    letters    en    4    amod
    "brown"    1    1    1    letters    en    4    amod
    "fox"    1    1    1    letters    en    5    nsubj
    "jumped"    1    1    1    letters    en    0    root
    "over"    1    1    1    letters    en    9    case
    "the"    1    1    1    letters    en    9    det
    "lazy"    1    1    1    letters    en    9    amod
    "dog"    1    1    1    letters    en    5    obl
    "."    1    1    1    punctuation    en    5    punct

依存関係の詳細をセンテンスチャートで可視化します。実線は依存関係を示し、点線はサブツリーラベルを示しています。

figure
sentenceChart(document)

Figure contains an object of type textanalytics.chart.dependencychart.

入力引数

すべて折りたたむ

`documents` — 入力文書
`tokenizedDocument` 配列

入力文書。tokenizedDocument 配列として指定します。

出力引数

すべて折りたたむ

`updatedDocuments` — 更新された文書
`tokenizedDocument` 配列

更新された文書。tokenizedDocument 配列として返されます。updatedDocuments からトークンの詳細を取得するには、tokenDetails を使用します。

アルゴリズム

すべて折りたたむ

文法的依存関係の解析

関数 addDependencyDetails は、関数 tokenDetails によって返された table に文法的依存関係タグを追加します。この関数は、Universal Dependencies[1]によって定義されたカテゴリカルタグで各トークンにタグを付けます。

ここにリストされている依存関係タイプはサブセットにすぎません。サブタイプを含む依存関係タイプの完全なリストについては、[1]を参照してください。

acl — 名詞の節修飾語 (連体節)
advcl — 副詞的修飾節
advmod — 副詞修飾語
amod — 形容詞修飾語
appos — 同格修飾語
aux — 補助動詞
case — 格の付与
cc — 等位接続詞
ccomp — 節補部
clf — 類別詞
compound — 複合
conj — 接続要素
cop — コピュラ
csubj — 節主語
dep — 不明な依存関係
det — 限定詞
discourse — 談話要素
dislocated — 転移要素
expl — 虚辞
fixed — 固定的な複合表現
flat — 平板型の複合表現
goeswith — 単語区切り誤り
iobj — 間接目的語
list — リスト
mark — マーカー
nmod — 名詞修飾語
nsubj — 名詞句主語
nummod — 数値修飾語
obj — 目的語
obl — 斜格名詞
orphan — 主辞がない語
parataxis — 並置
punct — 句読点
reparandum — 言い直しによる非流暢性
root — 根
vocative — 呼格
xcomp — 開いた節補部

参照

[1] Universal Dependency Relations https://universaldependencies.org/u/dep/index.html.

バージョン履歴

R2022b で導入

参考

addDependencyDetails

構文

説明

例

文書への文法的依存関係の詳細の追加

入力引数

documents — 入力文書 tokenizedDocument 配列

出力引数

updatedDocuments — 更新された文書 tokenizedDocument 配列

アルゴリズム

文法的依存関係の解析

参照

バージョン履歴

参考

トピック

`documents` — 入力文書
`tokenizedDocument` 配列

`updatedDocuments` — 更新された文書
`tokenizedDocument` 配列