abbreviations

一般的な略語の table

構文

tbl = abbreviations

tbl = abbreviations('Language',language)

説明

"appt."、"Dr."、"fig." などのピリオドを含む略語は文の検出に影響します。関数 addSentenceDetails および関数 addPartOfSpeechDetails は、略語の table を使用して文の境界を検出します。関数 abbreviations は、これらの関数で使用される既定の table を出力します。略語のカスタムテーブルを作成し、文の検出動作を指定するために、この table を使用できます。

関数は、英語、日本語、ドイツ語、および韓国語をサポートしています。日本語と韓国語の略語リストは空です。これらの言語では、通常、略語が文の検出に影響を与えないためです。

tbl = abbreviations は、英語の一般的な略語の table を返します。

例

tbl = abbreviations('Language',language) は略語の言語を指定します。

例

すべて折りたたむ

略語の table

ライブスクリプトを開く

略語の table を表示します。addSentenceDetails を使用するときに、この table を使用して略語と文を検出できます。

tbl = abbreviations;
head(tbl)

    Abbreviation     Usage 
    ____________    _______

       "ATS"        regular
       "Ao"         regular
       "BEF"        regular
       "Ba"         regular
       "Bd"         regular
       "Bi"         regular
       "Bq"         regular
       "Cent"       regular

ドイツ語の略語の table

ライブスクリプトを開く

ドイツ語の略語の table を表示します。addSentenceDetails を使用するときに、この table を使用して、文を検出するための略語のカスタムテーブルを作成できます。

tbl = abbreviations('Language','de');
head(tbl)

    Abbreviation     Usage 
    ____________    _______

       "A.T"        regular
       "ABl"        regular
       "Abb"        regular
       "Abdr"       regular
       "Abf"        regular
       "Abfl"       regular
       "Abh"        regular
       "Abk"        regular

入力引数

すべて折りたたむ

`language` — 略語の言語
`'en'` (既定値) | `'ja'` | `'de'` | `'ko'`

略語の言語。次のいずれかとして指定します。

'en' – 英語
'ja' – 日本語
'de' – ドイツ語
'ko' – 韓国語

'ja' または 'ko' を指定した場合、関数は空の table を返します。Text Analytics Toolbox™ での言語サポートの詳細については、言語に関する考慮事項を参照してください。

出力引数

すべて折りたたむ

`tbl` — 略語の table
table

略語の table。既定では、関数 addSentenceDetails および関数 splitSentences は、この table を使用して文の境界を検出します。この table には、通常ピリオドと共に記述された略語のみが含まれています。

table は 2 つの変数をもちます。

Abbreviation – 略語 (string として指定)
Usage – 略語のタイプ (categorical スカラーとして指定)

次の table では、Usage が取り得る値と、これらのタイプの略語を観測する際の addSentenceDetails および splitSentences の動作について説明しています。

Usage	動作	略語の例	サンプルテキスト	検出される文
`regular`	次の単語が大文字で始まる場合、末尾のピリオドで区切る。それ以外の場合、末尾のピリオドで区切らない。	"appt."	`"Book an appt. We'll meet then."`	`"Book an appt."` `"We'll meet then."`
`regular`	次の単語が大文字で始まる場合、末尾のピリオドで区切る。それ以外の場合、末尾のピリオドで区切らない。	"appt."	`"Book an appt. today."`	`"Book an appt. today."`
`inner`	末尾のピリオドの後で区切らない。	"Dr."	`"Dr. Smith."`	`"Dr. Smith."`
`reference`	次のトークンが数字でない場合、末尾のピリオドで区切る。次のトークンが数字だった場合、末尾のピリオドで区切らない。	"fig."	`"See fig. 3."`	`"See fig. 3."`
`reference`	次のトークンが数字でない場合、末尾のピリオドで区切る。次のトークンが数字だった場合、末尾のピリオドで区切らない。	"fig."	`"Try a fig. They are nice."`	`"Try a fig."` `"They are nice."`
`unit`	前の単語が数字で、次の単語が大文字で始まる場合、末尾のピリオドで区切る。	"in."	`"The height is 30 in. The width is 10 in."`	`"The height is 30 in."` `"The width is 10 in."`
	前の単語が数字で、次の単語が大文字でない場合、末尾のピリオドで区切らない。		`"The item is 10 in. wide."`	`"The item is 10 in. wide."`
	前の単語が数字でない場合、末尾のピリオドで区切る。		`"Come in. Sit down."`	`"Come in."` `"Sit down."`

日本語と韓国語の略語リストは空です。これらの言語では、通常、略語が文の検出に影響を与えないためです。

バージョン履歴

R2018a で導入

参考

tokenDetails | addSentenceDetails | addPartOfSpeechDetails | tokenizedDocument

abbreviations

構文

説明

例

略語の table

ドイツ語の略語の table

入力引数

language — 略語の言語 'en' (既定値) | 'ja' | 'de' | 'ko'

出力引数

tbl — 略語の table table

バージョン履歴

参考

トピック

`language` — 略語の言語
`'en'` (既定値) | `'ja'` | `'de'` | `'ko'`

`tbl` — 略語の table
table