Main Content

このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。

addDependencyDetails

文書への文法的依存関係の詳細の追加

R2022b 以降

    説明

    addDependencyDetails を使用して、文法的依存関係の詳細を文書に追加します。

    この関数には、Deep Learning Toolbox™ と Text Analytics Toolbox™ Model for UDify Data サポート パッケージが必要です。関数は、英語、日本語、ドイツ語、および韓国語のテキストをサポートしています。

    updatedDocuments = addDependencyDetails(documents) は、文法的依存関係の詳細を documents に追加し、トークンの詳細を更新します。updatedDocuments から依存関係の詳細を取得するには、tokenDetails を使用します。

    すべて折りたたむ

    1 つの文を含むトークン化された文書オブジェクトを作成します。

    str = "The quick brown fox jumped over the lazy dog.";
    document = tokenizedDocument(str)
    document = 
      tokenizedDocument:
    
       10 tokens: The quick brown fox jumped over the lazy dog .
    
    

    文書に文法的依存関係の詳細を追加します。関数 addDependencyDetails には、Text Analytics Toolbox™ Model for UDify Data サポート パッケージが必要です。このサポート パッケージがインストールされていない場合、関数によってダウンロード リンクが提供されます。

    document = addDependencyDetails(document);

    関数 tokenDetails を使用してトークンの詳細を表示します。table の変数 Head と変数 Dependency は、依存関係の詳細のツリー構造を形成します。たとえば、この文では "lazy" という単語が "dog" という単語を修飾しているため、トークン詳細の table には、トークン "lazy" の主辞として "dog" のトークン番号がリストされます。

    details = tokenDetails(document)
    details=10×8 table
         Token      DocumentNumber    SentenceNumber    LineNumber       Type        Language    Head    Dependency
        ________    ______________    ______________    __________    ___________    ________    ____    __________
    
        "The"             1                 1               1         letters           en        4        det     
        "quick"           1                 1               1         letters           en        4        amod    
        "brown"           1                 1               1         letters           en        4        amod    
        "fox"             1                 1               1         letters           en        5        nsubj   
        "jumped"          1                 1               1         letters           en        0        root    
        "over"            1                 1               1         letters           en        9        case    
        "the"             1                 1               1         letters           en        9        det     
        "lazy"            1                 1               1         letters           en        9        amod    
        "dog"             1                 1               1         letters           en        5        obl     
        "."               1                 1               1         punctuation       en        5        punct   
    
    

    依存関係の詳細をセンテンス チャートで可視化します。実線は依存関係を示し、点線はサブツリー ラベルを示しています。

    figure
    sentenceChart(document)

    入力引数

    すべて折りたたむ

    入力文書。tokenizedDocument 配列として指定します。

    出力引数

    すべて折りたたむ

    更新された文書。tokenizedDocument 配列として返されます。updatedDocuments からトークンの詳細を取得するには、tokenDetails を使用します。

    アルゴリズム

    すべて折りたたむ

    文法的依存関係の解析

    関数 addDependencyDetails は、関数 tokenDetails によって返された table に文法的依存関係タグを追加します。この関数は、Universal Dependencies[1]によって定義されたカテゴリカル タグで各トークンにタグを付けます。

    ここにリストされている依存関係タイプはサブセットにすぎません。サブタイプを含む依存関係タイプの完全なリストについては、[1]を参照してください。

    • acl — 名詞の節修飾語 (連体節)

    • advcl — 副詞的修飾節

    • advmod — 副詞修飾語

    • amod — 形容詞修飾語

    • appos — 同格修飾語

    • aux — 補助動詞

    • case — 格の付与

    • cc — 等位接続詞

    • ccomp — 節補部

    • clf — 類別詞

    • compound — 複合

    • conj — 接続要素

    • cop — コピュラ

    • csubj — 節主語

    • dep — 不明な依存関係

    • det — 限定詞

    • discourse — 談話要素

    • dislocated — 転移要素

    • expl — 虚辞

    • fixed — 固定的な複合表現

    • flat — 平板型の複合表現

    • goeswith — 単語区切り誤り

    • iobj — 間接目的語

    • list — リスト

    • mark — マーカー

    • nmod — 名詞修飾語

    • nsubj — 名詞句主語

    • nummod — 数値修飾語

    • obj — 目的語

    • obl — 斜格名詞

    • orphan — 主辞がない語

    • parataxis — 並置

    • punct — 句読点

    • reparandum — 言い直しによる非流暢性

    • root — 根

    • vocative — 呼格

    • xcomp — 開いた節補部

    参照

    [1] Universal Dependency Relations https://universaldependencies.org/u/dep/index.html.

    バージョン履歴

    R2022b で導入