メインコンテンツ

addDependencyDetails

文書への文法的依存関係の詳細の追加

R2022b 以降

    説明

    addDependencyDetails を使用して、文法的依存関係の詳細を文書に追加します。

    この関数には、Deep Learning Toolbox™ と Text Analytics Toolbox™ Model for UDify Data サポート パッケージが必要です。関数は、英語、日本語、ドイツ語、および韓国語のテキストをサポートしています。

    updatedDocuments = addDependencyDetails(documents) は、文法的依存関係の詳細を documents に追加し、トークンの詳細を更新します。updatedDocuments から依存関係の詳細を取得するには、tokenDetails を使用します。

    すべて折りたたむ

    1 つの文を含むトークン化された文書オブジェクトを作成します。

    str = "The quick brown fox jumped over the lazy dog.";
    document = tokenizedDocument(str)
    document = 
      tokenizedDocument:
    
       10 tokens: The quick brown fox jumped over the lazy dog .
    
    

    文書に文法的依存関係の詳細を追加します。関数 addDependencyDetails には、Text Analytics Toolbox™ Model for UDify Data サポート パッケージが必要です。このサポート パッケージがインストールされていない場合、関数によってダウンロード リンクが提供されます。

    document = addDependencyDetails(document);

    関数 tokenDetails を使用してトークンの詳細を表示します。table の変数 Head と変数 Dependency は、依存関係の詳細のツリー構造を形成します。たとえば、この文では "lazy" という単語が "dog" という単語を修飾しているため、トークン詳細の table には、トークン "lazy" の主辞として "dog" のトークン番号がリストされます。

    details = tokenDetails(document)
    details=10×8 table
        "The"    1    1    1    letters    en    4    det
        "quick"    1    1    1    letters    en    4    amod
        "brown"    1    1    1    letters    en    4    amod
        "fox"    1    1    1    letters    en    5    nsubj
        "jumped"    1    1    1    letters    en    0    root
        "over"    1    1    1    letters    en    9    case
        "the"    1    1    1    letters    en    9    det
        "lazy"    1    1    1    letters    en    9    amod
        "dog"    1    1    1    letters    en    5    obl
        "."    1    1    1    punctuation    en    5    punct
    
    

    依存関係の詳細をセンテンス チャートで可視化します。実線は依存関係を示し、点線はサブツリー ラベルを示しています。

    figure
    sentenceChart(document)

    Figure contains an object of type textanalytics.chart.dependencychart.

    入力引数

    すべて折りたたむ

    入力文書。tokenizedDocument 配列として指定します。

    出力引数

    すべて折りたたむ

    更新された文書。tokenizedDocument 配列として返されます。updatedDocuments からトークンの詳細を取得するには、tokenDetails を使用します。

    アルゴリズム

    すべて折りたたむ

    参照

    [1] Universal Dependency Relations https://universaldependencies.org/u/dep/index.html.

    バージョン履歴

    R2022b で導入