Main Content

abbreviations

一般的な略語の table

説明

"appt."、"Dr."、"fig." などのピリオドを含む略語は文の検出に影響します。関数 addSentenceDetails および関数 addPartOfSpeechDetails は、略語の table を使用して文の境界を検出します。関数 abbreviations は、これらの関数で使用される既定の table を出力します。略語のカスタム テーブルを作成し、文の検出動作を指定するために、この table を使用できます。

関数は、英語、日本語、ドイツ語、および韓国語をサポートしています。日本語と韓国語の略語リストは空です。これらの言語では、通常、略語が文の検出に影響を与えないためです。

tbl = abbreviations は、英語の一般的な略語の table を返します。

tbl = abbreviations('Language',language) は略語の言語を指定します。

すべて折りたたむ

略語の table を表示します。addSentenceDetails を使用するときに、この table を使用して略語と文を検出できます。

tbl = abbreviations;
head(tbl)
    Abbreviation     Usage 
    ____________    _______

       "ATS"        regular
       "Ao"         regular
       "BEF"        regular
       "Ba"         regular
       "Bd"         regular
       "Bi"         regular
       "Bq"         regular
       "Cent"       regular

ドイツ語の略語の table を表示します。addSentenceDetails を使用するときに、この table を使用して、文を検出するための略語のカスタム テーブルを作成できます。

tbl = abbreviations('Language','de');
head(tbl)
    Abbreviation     Usage 
    ____________    _______

       "A.T"        regular
       "ABl"        regular
       "Abb"        regular
       "Abdr"       regular
       "Abf"        regular
       "Abfl"       regular
       "Abh"        regular
       "Abk"        regular

入力引数

すべて折りたたむ

略語の言語。次のいずれかとして指定します。

  • 'en' – 英語

  • 'ja' – 日本語

  • 'de' – ドイツ語

  • 'ko' – 韓国語

'ja' または 'ko' を指定した場合、関数は空の table を返します。Text Analytics Toolbox™ での言語サポートの詳細については、言語に関する考慮事項を参照してください。

出力引数

すべて折りたたむ

略語の table。既定では、関数 addSentenceDetails および関数 splitSentences は、この table を使用して文の境界を検出します。この table には、通常ピリオドと共に記述された略語のみが含まれています。

table は 2 つの変数をもちます。

  • Abbreviation – 略語 (string として指定)

  • Usage – 略語のタイプ (categorical スカラーとして指定)

次の table では、Usage が取り得る値と、これらのタイプの略語を観測する際の addSentenceDetails および splitSentences の動作について説明しています。

Usage動作略語の例サンプル テキスト検出される文
regular次の単語が大文字で始まる場合、末尾のピリオドで区切る。それ以外の場合、末尾のピリオドで区切らない。"appt.""Book an appt. We'll meet then."

"Book an appt."

"We'll meet then."

"Book an appt. today.""Book an appt. today."
inner末尾のピリオドの後で区切らない。"Dr.""Dr. Smith.""Dr. Smith."
reference次のトークンが数字でない場合、末尾のピリオドで区切る。次のトークンが数字だった場合、末尾のピリオドで区切らない。"fig.""See fig. 3.""See fig. 3."
"Try a fig. They are nice."

"Try a fig."

"They are nice."

unit前の単語が数字で、次の単語が大文字で始まる場合、末尾のピリオドで区切る。"in.""The height is 30 in. The width is 10 in."

"The height is 30 in."

"The width is 10 in."

前の単語が数字で、次の単語が大文字でない場合、末尾のピリオドで区切らない。"The item is 10 in. wide.""The item is 10 in. wide."
前の単語が数字でない場合、末尾のピリオドで区切る。"Come in. Sit down."

"Come in."

"Sit down."

日本語と韓国語の略語リストは空です。これらの言語では、通常、略語が文の検出に影響を与えないためです。

バージョン履歴

R2018a で導入