x = (1:100) + 50*cos((1:100)*2*pi/40).^3;
X = dct(x);
[XX,ind] = sort(abs(X),"descend");
i = 1;
while (norm(X(ind(1:i)))/norm(X))^2 < 0.99
   i = i + 1;
end
needed = i;

信号を再構成し、元の信号と比較します。

X(ind(needed+1:end)) = 0;
xx = idct(X);

plot([x;xx]')
legend("Original","Reconstructed, N = " + needed, ...
       Location='SouthEast')

Figure contains an axes object. The axes object contains 2 objects of type line. These objects represent Original, Reconstructed, N = 4.

イメージデータの圧縮

ライブスクリプトを開く

米国の 1 セント銅貨を鋳造するために使用される型の深さの測定値を含むファイルを読み込みます。米国国立標準技術研究所で取得されたこのデータは、128 行 128 列のグリッド上でサンプリングされています。データを表示します。

load penny

surf(P)
view(2)
colormap copper
shading interp
axis ij square off

Figure contains an axes object. The hidden axes object contains an object of type surface.

イメージデータの離散コサイン変換を計算します。最初に行、次に列に沿って動作します。

Q = dct(P,[],1);
R = dct(Q,[],2);

DCT 係数のどれくらいの部分にイメージの 99.98% のエネルギーが含まれるかを求めます。

X = R(:);

[~,ind] = sort(abs(X),"descend");
coeffs = 1;
while (norm(X(ind(1:coeffs)))/norm(X))^2 < 0.9998
   coeffs = coeffs + 1;
end
disp(coeffs + " of " + numel(R) + " coefficients are sufficient")

5215 of 16384 coefficients are sufficient

必要な係数のみを使用してイメージを再構成します。

R(abs(R) < abs(X(ind(coeffs)))) = 0;

S = idct(R,[],2);
T = idct(S,[],1);

再構成されたイメージを表示します。

surf(T)
view(2)
shading interp
axis ij square off

Figure contains an axes object. The hidden axes object contains an object of type surface.

イメージのサイズ変更

ライブスクリプトを開く

load penny

surf(P)
colormap copper
shading interp
view(2)
axis ij square off

Figure contains an axes object. The hidden axes object contains an object of type surface.

DCT-1 バリアントを使用して、イメージデータの離散コサイン変換を計算します。最初に行、次に列に沿って動作します。

Q = dct(P,[],1,Type=1);
R = dct(Q,[],2,Type=1);

逆変換を行います。逆変換を切り捨てて、再構成後のイメージの各次元が元の 1/2 の長さになるようにします。

S = idct(R,size(P,2)/2,2,Type=1);
T = idct(S,size(P,1)/2,1,Type=1);

再度、逆変換を行います。逆変換にゼロを付加し、再構成後のイメージの各次元が元の 2 倍の長さになるようにします。

U = idct(R,size(P,2)*2,2,Type=1);
V = idct(U,size(P,1)*2,1,Type=1);

元のイメージと再構成後のイメージを表示します。

surf(V)
hold on
surf(P)
surf(T)
hold off

shading interp
view(2)
axis ij equal off

Figure contains an axes object. The hidden axes object contains 3 objects of type surface.

入力引数

すべて折りたたむ

`x` — 入力配列
ベクトル | 行列 | N 次元配列

入力配列。実数値または複素数値のベクトル、行列、または N 次元配列として指定します。

例: sin(2*pi*(0:255)/4) は、正弦波を行ベクトルとして指定します。

例: sin(2*pi*[0.1;0.3]*(0:39))' は、2 チャネルの正弦波を指定します。

データ型: single | double
複素数のサポート: あり

`n` — 変換の長さ
正の整数スカラー

変換の長さ。正の整数スカラーで指定します。

データ型: single | double

`dim` — 動作する対象の次元
正の整数スカラー

動作する対象の次元。正の整数スカラーとして指定します。

データ型: single | double

`dcttype` — 離散コサイン変換のタイプ
`2` (既定値) | `1` | `3` | `4`

離散コサイン変換のタイプ。1 ～ 4 の正の整数スカラーとして指定します。DCT のさまざまなタイプの定義については、離散コサイン変換を参照してください。

データ型: single | double

出力引数

すべて折りたたむ

`y` — 離散コサイン変換
ベクトル | 行列 | N 次元配列

離散コサイン変換。実数値または複素数値のベクトル、行列、または N 次元配列として返されます。

詳細

すべて折りたたむ

離散コサイン変換

離散コサイン変換 (DCT) は離散フーリエ変換と密接に関連しています。多くの場合、わずか数個の DCT 係数から、きわめて正確にシーケンスを復元することができます。これは、データ量の圧縮を必要とするアプリケーションで役立つ特性です。

DCT には 4 つの標準バリアントがあります。長さ N の信号 x およびクロネッカーデルタ δ_kℓ を使うと、変換は以下のように定義されます。

DCT-1:

$y (k) = \sqrt{\frac{2}{N - 1}} \sum_{n = 1}^{N} x (n) \frac{1}{\sqrt{1 + δ_{n 1} + δ_{n N}}} \frac{1}{\sqrt{1 + δ_{k 1} + δ_{k N}}} \cos (\frac{π}{N - 1} (n - 1) (k - 1))$
DCT-2:

$y (k) = \sqrt{\frac{2}{N}} \sum_{n = 1}^{N} x (n) \frac{1}{\sqrt{1 + δ_{k 1}}} \cos (\frac{π}{2 N} (2 n - 1) (k - 1))$
DCT-3:

$y (k) = \sqrt{\frac{2}{N}} \sum_{n = 1}^{N} x (n) \frac{1}{\sqrt{1 + δ_{n 1}}} \cos (\frac{π}{2 N} (n - 1) (2 k - 1))$
DCT-4:

$y (k) = \sqrt{\frac{2}{N}} \sum_{n = 1}^{N} x (n) \cos (\frac{π}{4 N} (2 n - 1) (2 k - 1))$

MATLAB^® のベクトルは 0 から N – 1 ではなく 1 から N であるため、この級数には通常の n = 0 および k = 0 の代わりに、n = 1 および k = 1 のインデックスが付けられます。

DCT のすべてのバリアントは "単項" (または、"直交" と同等) です。その逆変換を求めるには、各定義で k と n を切り替えます。DCT-1 と DCT-4 はそれ自体の逆変換です。DCT-2 と DCT-3 は互いの逆変換です。

参照

[1] Jain, A. K. Fundamentals of Digital Image Processing. Englewood Cliffs, NJ: Prentice-Hall, 1989.

[2] Oppenheim, Alan V., Ronald W. Schafer, and John R. Buck. Discrete-Time Signal Processing. 2nd Ed. Upper Saddle River, NJ: Prentice Hall, 1999.

[3] Pennebaker, W. B., and J. L. Mitchell. JPEG Still Image Data Compression Standard. New York: Van Nostrand Reinhold, 1993.

拡張機能

すべて展開する

C/C++ コード生成
MATLAB® Coder™ を使用して C および C++ コードを生成します。

使用上の注意および制限:

dct の C および C++ コード生成には DSP System Toolbox™ ソフトウェアが必要です。
変換次元の長さは 2 のべき乗でなければなりません。付加や切り捨てを指定する場合、その値は定数でなければなりません。式や変数は、その値が変化しない限りは使用できます。
入力は倍精度でなければなりません。
DCT-2 のみが使用できます。

スレッドベースの環境
MATLAB® の `backgroundPool` を使用してバックグラウンドでコードを実行するか、Parallel Computing Toolbox™ の `ThreadPool` を使用してコードを高速化します。

この関数は、スレッドベースの環境を完全にサポートします。詳細については、スレッドベースの環境での MATLAB 関数の実行を参照してください。

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。

dct 関数は GPU 配列入力をサポートしますが、次の使用上の注意および制限があります。

N 次元入力配列はサポートされません。
入力引数 dim および dcttype はサポートされません。

詳細については、GPU での MATLAB 関数の実行 (Parallel Computing Toolbox)を参照してください。

バージョン履歴

R2006a より前に導入

参考

fft | idct | dct2 (Image Processing Toolbox) | idct2 (Image Processing Toolbox)

トピック

音声信号圧縮のための DCT

dct

構文

説明

例

DCT 係数に含まれる蓄積されたエネルギー

イメージ データの圧縮

イメージのサイズ変更

入力引数

x — 入力配列 ベクトル | 行列 | N 次元配列

n — 変換の長さ 正の整数スカラー

dim — 動作する対象の次元 正の整数スカラー

dcttype — 離散コサイン変換のタイプ 2 (既定値) | 1 | 3 | 4

出力引数

y — 離散コサイン変換 ベクトル | 行列 | N 次元配列

詳細

離散コサイン変換

参照

拡張機能

C/C++ コード生成 MATLAB® Coder™ を使用して C および C++ コードを生成します。

スレッドベースの環境 MATLAB® の backgroundPool を使用してバックグラウンドでコードを実行するか、Parallel Computing Toolbox™ の ThreadPool を使用してコードを高速化します。

GPU 配列 Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。

バージョン履歴

参考

トピック

イメージデータの圧縮

`x` — 入力配列
ベクトル | 行列 | N 次元配列

`n` — 変換の長さ
正の整数スカラー

`dim` — 動作する対象の次元
正の整数スカラー

`dcttype` — 離散コサイン変換のタイプ
`2` (既定値) | `1` | `3` | `4`

`y` — 離散コサイン変換
ベクトル | 行列 | N 次元配列

C/C++ コード生成
MATLAB® Coder™ を使用して C および C++ コードを生成します。

スレッドベースの環境
MATLAB® の `backgroundPool` を使用してバックグラウンドでコードを実行するか、Parallel Computing Toolbox™ の `ThreadPool` を使用してコードを高速化します。

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。