native2unicode
数値バイトの Unicode 文字表現への変換
構文
unicodestr = native2unicode(bytes)
unicodestr = native2unicode(bytes, encoding)
説明
unicodestr = native2unicode(bytes) は、数値ベクトル bytes をユーザー既定のエンコードから Unicode® 文字表現に変換します。native2unicode は bytes を 8 ビット バイトのベクトルとして扱い、各値は [0,255] の範囲内になければなりません。出力引数 unicodestr は、bytes と同じ一般的な配列の形状をした文字ベクトルです。
unicodestr = native2unicode(bytes, encoding) は、bytes を Unicode 表現に変換します。このとき、bytes は encoding によって指定された文字エンコード スキームに従っているものと仮定されます。入力引数 encoding は、文字を含まない ('') か、エンコードスキームの名前またはエイリアスでなければなりません。たとえば、'UTF-8'、'latin1'、'US-ASCII'、'Shift_JIS' などです。encoding が指定されていないか文字を含まない ('') 場合は、既定のエンコード スキームが使用されます。encoding には文字ベクトルまたは string スカラーを指定できます。
メモ
bytes が文字ベクトルまたは string スカラーの場合は、変更されずに返されます。
例
この例は、未定義の文字エンコード スキームのバイト ベクトルを使用して始めます。ユーザー定義の関数 detect_encoding は、エンコード スキームを特定します。処理が成功すると、この関数は、エンコード スキーム名またはエイリアスを文字ベクトルで返します。処理が失敗すると、MException オブジェクト ME で表されるエラーをスローします。例は、native2unicode を呼び出して、バイトを Unicode 表現に変換します。
try
enc = detect_encoding(bytes);
str = native2unicode(bytes, enc);
disp(str);
catch ME
rethrow(ME);
end検出されたエンコード スキームの言語で出力 disp(str) を正しくテキスト表示するように、コンピューターが設定されていることを確認してください。
拡張機能
バージョン履歴
R2006a より前に導入