native2unicode
数値バイトの Unicode 文字表現への変換
構文
unicodestr = native2unicode(bytes)
unicodestr = native2unicode(bytes, encoding)
説明
unicodestr = native2unicode(bytes)
は、数値ベクトル bytes
をユーザー既定のエンコードから Unicode® 文字表現に変換します。native2unicode
は bytes
を 8 ビット バイトのベクトルとして扱い、各値は [0,255] の範囲内になければなりません。出力引数 unicodestr
は、bytes
と同じ一般的な配列の形状をした文字ベクトルです。
unicodestr = native2unicode(bytes, encoding)
は、bytes
を Unicode 表現に変換します。このとき、bytes
は encoding
によって指定された文字エンコード スキームに従っているものと仮定されます。入力引数 encoding
は、文字を含まない (''
) か、エンコードスキームの名前またはエイリアスでなければなりません。たとえば、'UTF-8'
、'latin1'
、'US-ASCII'
、'Shift_JIS'
などです。encoding
が指定されていないか文字を含まない (''
) 場合は、既定のエンコード スキームが使用されます。encoding
には文字ベクトルまたは string スカラーを指定できます。
メモ
bytes
が文字ベクトルまたは string スカラーの場合は、変更されずに返されます。
例
この例は、未定義の文字エンコード スキームのバイト ベクトルを使用して始めます。ユーザー定義の関数 detect_encoding
は、エンコード スキームを特定します。処理が成功すると、この関数は、エンコード スキーム名またはエイリアスを文字ベクトルで返します。処理が失敗すると、MException オブジェクト ME
で表されるエラーをスローします。例は、native2unicode
を呼び出して、バイトを Unicode 表現に変換します。
try enc = detect_encoding(bytes); str = native2unicode(bytes, enc); disp(str); catch ME rethrow(ME); end
検出されたエンコード スキームの言語で出力 disp(str)
を正しくテキスト表示するように、コンピューターが設定されていることを確認してください。
拡張機能
バージョン履歴
R2006a より前に導入