unicode2native
Unicode 文字表現の数値バイトへの変換
構文
bytes = unicode2native(unicodestr)
bytes = unicode2native(unicodestr,encoding)
説明
bytes = unicode2native(unicodestr) は、Unicode® 文字表現として入力された unicodestr をユーザーの既定エンコードに変換し、uint8 ベクトルである bytes としてバイト数を返します。出力ベクトル bytes は、unicodestr 入力と同じ一般的な配列の形になります。関数 fwrite を使用して、unicode2native の出力をファイルに保存できます。unicodestr には文字ベクトルまたは string スカラーを指定できます。
bytes = unicode2native(unicodestr,encoding) は、unicodestr を encoding で指定された文字エンコード スキームに変換します。入力引数 encoding は、文字がない状態である ('') か、エンコード スキームの名前またはエイリアスでなければなりません。たとえば、'UTF-8'、'latin1'、'US-ASCII'、'Shift_JIS' などです。encoding が指定されていないか文字を含まない ('') 場合は、既定のエンコード スキームが使用されます。encoding には文字ベクトルまたは string スカラーを指定できます。
例
この例は、Unicode 文字表現を含む 2 つの文字ベクトルから始めます。str1 は、西ヨーロッパ言語のテキストを含み、str2 は、日本語のテキストを含むとします。例は、1 番目の文字ベクトルに ISO-8859-1 文字エンコード スキームを使用し、2 番目の文字ベクトルに Shift-JIS エンコード スキームを使用して、両方の文字ベクトルを同じファイルに記述します。例では、str1 および str2 を適切なエンコード スキームへ変換するために、関数 unicode2native を使用します。
fid = fopen('mixed.txt', 'w');
bytes1 = unicode2native(str1, 'ISO-8859-1');
fwrite(fid, bytes1, 'uint8');
bytes2 = unicode2native(str2, 'Shift_JIS');
fwrite(fid, bytes2, 'uint8');
fclose(fid);
拡張機能
バージョン履歴
R2006a より前に導入