Main Content

native2unicode

数値バイトの Unicode 文字表現への変換

構文

unicodestr = native2unicode(bytes)
unicodestr = native2unicode(bytes, encoding)

説明

unicodestr = native2unicode(bytes) は、数値ベクトル bytes をユーザー既定のエンコードから Unicode® 文字表現に変換します。native2unicodebytes を 8 ビット バイトのベクトルとして扱い、各値は [0,255] の範囲内になければなりません。出力引数 unicodestr は、bytes と同じ一般的な配列の形状をした文字ベクトルです。

unicodestr = native2unicode(bytes, encoding) は、bytes を Unicode 表現に変換します。このとき、bytesencoding によって指定された文字エンコード スキームに従っているものと仮定されます。入力引数 encoding は、文字を含まない ('') か、エンコードスキームの名前またはエイリアスでなければなりません。たとえば、'UTF-8''latin1''US-ASCII''Shift_JIS' などです。encoding が指定されていないか文字を含まない ('') 場合は、既定のエンコード スキームが使用されます。encoding には文字ベクトルまたは string スカラーを指定できます。

メモ

bytes が文字ベクトルまたは string スカラーの場合は、変更されずに返されます。

この例は、未定義の文字エンコード スキームのバイト ベクトルを使用して始めます。ユーザー定義の関数 detect_encoding は、エンコード スキームを特定します。処理が成功すると、この関数は、エンコード スキーム名またはエイリアスを文字ベクトルで返します。処理が失敗すると、MException オブジェクト ME で表されるエラーをスローします。例は、native2unicode を呼び出して、バイトを Unicode 表現に変換します。

try
    enc = detect_encoding(bytes);
    str = native2unicode(bytes, enc);
    disp(str);
catch ME
    rethrow(ME);
end

検出されたエンコード スキームの言語で出力 disp(str) を正しくテキスト表示するように、コンピューターが設定されていることを確認してください。

拡張機能

バージョン履歴

R2006a より前に導入