Main Content

unicode2native

Unicode 文字表現の数値バイトへの変換

構文

bytes = unicode2native(unicodestr)
bytes = unicode2native(unicodestr,encoding)

説明

bytes = unicode2native(unicodestr) は、Unicode® 文字表現として入力された unicodestr をユーザーの既定エンコードに変換し、uint8 ベクトルである bytes としてバイト数を返します。出力ベクトル bytes は、unicodestr 入力と同じ一般的な配列の形になります。関数 fwrite を使用して、unicode2native の出力をファイルに保存できます。unicodestr には文字ベクトルまたは string スカラーを指定できます。

bytes = unicode2native(unicodestr,encoding) は、unicodestrencoding で指定された文字エンコード スキームに変換します。入力引数 encoding は、文字がない状態である ('') か、エンコード スキームの名前またはエイリアスでなければなりません。たとえば、'UTF-8''latin1''US-ASCII''Shift_JIS' などです。encoding が指定されていないか文字を含まない ('') 場合は、既定のエンコード スキームが使用されます。encoding には文字ベクトルまたは string スカラーを指定できます。

この例は、Unicode 文字表現を含む 2 つの文字ベクトルから始めます。str1 は、西ヨーロッパ言語のテキストを含み、str2 は、日本語のテキストを含むとします。例は、1 番目の文字ベクトルに ISO-8859-1 文字エンコード スキームを使用し、2 番目の文字ベクトルに Shift-JIS エンコード スキームを使用して、両方の文字ベクトルを同じファイルに記述します。例では、str1 および str2 を適切なエンコード スキームへ変換するために、関数 unicode2native を使用します。

fid = fopen('mixed.txt', 'w');
bytes1 = unicode2native(str1, 'ISO-8859-1');
fwrite(fid, bytes1, 'uint8');
bytes2 = unicode2native(str2, 'Shift_JIS');
fwrite(fid, bytes2, 'uint8');
fclose(fid);

拡張機能

バージョン履歴

R2006a より前に導入