Main Content

lettersPattern

文字に一致

R2020b 以降

説明

pat = lettersPattern は、1 つ以上の文字から成るテキストに一致するパターンを作成します。lettersPattern は、Unicode 標準で定義されている文字を受け入れます。

pat = lettersPattern(N) は、ちょうど N 個の文字から成るテキストに一致します。

pat = lettersPattern(minCharacters,maxCharacters) は、minCharacters 個以上、maxCharacters 個以下の文字から成るテキストに一致します。inf は、maxLetter に対する有効な値です。lettersPattern"最長一致" であり、maxCharacters にできるだけ近い数の文字に一致します。

すべて折りたたむ

lettersPattern を使用して、文字、数字、空白、句読点を含む string から単語を抽出します。

txt を string として作成します。lettersPattern を使用して、pat を文字に一致する pattern オブジェクトとして作成します。txt からパターンを抽出します。

txt = "The 2 parties agreed. The meeting would occur at 1 PM.";
pat = lettersPattern;
words = extract(txt,pat)
words = 9x1 string
    "The"
    "parties"
    "agreed"
    "The"
    "meeting"
    "would"
    "occur"
    "at"
    "PM"

lettersPattern を使用して、1 行のテキストに含まれる個別の文字の出現回数をカウントします。

txt を string として作成します。lettersPattern を使用して、pat を個別の文字に一致する pattern オブジェクトとして作成します。パターンを抽出します。各文字の出現回数のヒストグラムを表示します。

txt = "What are the letters in this sentence?";
pat = lettersPattern(1);
letters = extract(txt,pat);
letters = categorical(letters);
histogram(letters)

lettersPattern を使用して、5 文字を超える単語を抽出します。

lettersPattern を使用して、pat を 5 文字以上のグループに一致する pattern として作成します。パターンを抽出します。

txt = "Some of these words are longer than others.";
pat = lettersPattern(5,inf);
extract(txt,pat)
ans = 4x1 string
    "these"
    "words"
    "longer"
    "others"

入力引数

すべて折りたたむ

一致する文字数。非負の整数スカラーとして指定します。

データ型: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

一致する最小文字数。非負の整数スカラーとして指定します。

データ型: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

一致する最大文字数。非負の整数スカラーとして指定します。

データ型: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

出力引数

すべて折りたたむ

パターン式。patternオブジェクトとして返されます。

拡張機能

スレッドベースの環境
MATLAB® の backgroundPool を使用してバックグラウンドでコードを実行するか、Parallel Computing Toolbox™ の ThreadPool を使用してコードを高速化します。

バージョン履歴

R2020b で導入