spectrogram

s = spectrogram(x) は、入力信号 x の短時間フーリエ変換 (STFT) を返します。s の各列は、x の短時間の、時間が局所化された周波数成分の推定を含みます。s の振幅の 2 乗は、x の "スペクトログラム" 時間-周波数表現と呼ばれます[1]。

s = spectrogram(x,window) は、window を使用して信号をセグメントに分割し、ウィンドウ処理を実行します。

s = spectrogram(x,window,noverlap) は、隣り合ったセグメント間で noverlap 個のサンプルのオーバーラップを使用します。

s = spectrogram(x,window,noverlap,nfft) は、nfft サンプリング点を使用して離散フーリエ変換を計算します。

[s,w,t] = spectrogram(___) は、正規化周波数 w のベクトルと STFT を計算した時点 t のベクトルを返します。この構文には、前の構文の入力引数を任意に組み合わせて含めることができます。

[s,f,t] = spectrogram(___,fs) は、巡回周波数 f のベクトルをサンプルレート fs で表して返します。fs は spectrogram の 5 番目の入力でなければなりません。サンプルレートを入力した場合でも、前のオプション引数の既定値を使用するには、これらの引数を空 [] として指定します。

[s,w,t] = spectrogram(x,window,noverlap,w) は、w で指定した正規化周波数における STFT を返します。w は少なくとも 2 つの要素をもたなければなりません。そうでない場合は、関数が nfft として解釈するためです。

[s,f,t] = spectrogram(x,window,noverlap,f,fs) は、f で指定した巡回周波数における STFT を返します。f は少なくとも 2 つの要素をもたなければなりません。そうでない場合は、関数が nfft として解釈するためです。

また、[___,ps] = spectrogram(___,spectrumtype) は x のスペクトログラムに比例する行列 ps も返します。

spectrumtype を "psd" として指定すると、ps の各列には、ウィンドウが適用されたセグメントのパワースペクトル密度 (PSD) の推定が格納されます。
spectrumtype を "power" として指定すると、ps の各列には、ウィンドウが適用されたセグメントのパワースペクトルの推定が格納されます。

[___] = spectrogram(___,"reassigned") は、各 PSD またはパワースペクトル推定を、そのエネルギーの中心の位置に再代入します。十分に局所化された時相成分またはスペクトル成分が信号に含まれる場合、このオプションは、よりシャープなスペクトログラムを生成します。

[___,ps,fc,tc] = spectrogram(___) は、各 PSD またはパワースペクトル推定のエネルギー中心における周波数および時間を含む 2 つの行列 fc および tc も返します。

[___] = spectrogram(___,freqrange) は、freqrange で指定した周波数範囲での PSD またはパワースペクトル推定を返します。freqrange の有効なオプションは、"onesided"、"twosided" および "centered" です。

[___] = spectrogram(___,Name=Value) は、名前と値の引数を使用して追加オプションを指定します。オプションには、最小しきい値と出力時間次元が含まれます。

出力引数なしで spectrogram(___) を使用すると、現在の Figure ウィンドウに ps がデシベル単位でプロットされます。

spectrogram(___,freqloc) では、周波数をプロットする軸を指定します。

例

スペクトログラムの既定値

正弦波の和から構成される信号のサンプルを $N_{x} = 1024$ 個生成します。正弦波の正規化周波数は、 $2 π / 5$ ラジアン/サンプルおよび $4 π / 5$ ラジアン/サンプルです。高周波数の正弦波の振幅は、他の正弦波の振幅の 10 倍です。

N = 1024;
n = 0:N-1;

w0 = 2*pi/5;
x = sin(w0*n)+10*sin(2*w0*n);

関数の既定の設定を使用して、短時間フーリエ変換を計算します。スペクトログラムをプロットします。

s = spectrogram(x);

spectrogram(x,'yaxis')

Figure contains an axes object. The axes object with xlabel Samples, ylabel Normalized Frequency ( times pi blank radians/sample) contains an object of type image.

計算を繰り返します。

長さ $n s c = ⌊ N_{x} / 4.5 ⌋$ のセクションに信号を分割します。
ハミングウィンドウを使用して、セクションにウィンドウを適用します。
隣接するセクション間で 50% のオーバーラップを指定します。
FFT を計算するには、 $\max (256, 2^{p})$ 点を使用します。ここで、 $p = ⌈ \log_{2} n s c ⌉$ です。

2 つの方法の結果が同じになることを確認します。

Nx = length(x);
nsc = floor(Nx/4.5);
nov = floor(nsc/2);
nff = max(256,2^nextpow2(nsc));

t = spectrogram(x,hamming(nsc),nov,nff);

maxerr = max(abs(abs(t(:))-abs(s(:))))

maxerr = 0

長さが等しく、セクション間のオーバーラップが 50% である 8 つのセクションに信号を分割します。前のステップと同じ FFT 長を指定します。短時間フーリエ変換を計算し、前の 2 つの手順と結果が同じであることを確認します。

ns = 8;
ov = 0.5;
lsc = floor(Nx/(ns-(ns-1)*ov));

t = spectrogram(x,lsc,floor(ov*lsc),nff);

maxerr = max(abs(abs(t(:))-abs(s(:))))

maxerr = 0

関数 `spectrogram` と STFT 定義の比較

600 Hz で 2 秒間サンプリングされた複素数値凸 2 次チャープで構成される信号を生成します。チャープの初期周波数は 250 Hz、最終周波数は 50 Hz です。

fs = 6e2;
ts = 0:1/fs:2;
x = chirp(ts,250,ts(end),50,"quadratic",0,"convex","complex");

関数 spectrogram

関数 spectrogram を使用して信号の STFT を計算します。

信号を、それぞれ $M = 49$ サンプルの長さのセグメントに分割します。
隣接するセグメント間に $L = 11$ 個のサンプルのオーバーラップを指定します。
最後の短いセグメントを破棄します。
各セグメントにバートレットウィンドウを適用します。
$N_{DFT} = 1024$ 点で各セグメントの離散フーリエ変換を評価します。既定では、複素数値信号の場合、spectrogram は両側変換を計算します。

M = 49;
L = 11;
g = bartlett(M);
Ndft = 1024;

[s,f,t] = spectrogram(x,g,L,Ndft,fs);

関数 waterplot を使用して、STFT の振幅の 2 乗として定義されるスペクトログラムを計算し、表示します。

waterplot(s,f,t)

Figure contains an axes object. The axes object with xlabel Frequency (Hz), ylabel Time (s) contains an object of type patch.

STFT の定義

定義を使用して $N_{x}$ サンプルの信号の STFT を計算します。信号を $⌊ \frac{N_{x} - L}{M - L} ⌋$ 個のオーバーラップセグメントに分割します。各セグメントにウィンドウを適用し、それぞれについて、 $N_{DFT}$ 点での離散フーリエ変換を評価します。

[segs,~] = buffer(1:length(x),M,L,"nodelay");

X = fft(x(segs).*g,Ndft);

STFT の時間範囲と周波数範囲を計算します。

時間値を求めるには、時間ベクトルをオーバーラップセグメントに分割します。時間値は、下端でオープンの区間として扱われる各セグメントの中間点です。
周波数値を求めるには、ゼロ周波数でクローズ、下端でオープンとなるナイキスト区間を指定します。

tbuf = ts(segs);
tint = mean(tbuf(2:end,:));

fint = 0:fs/Ndft:fs-fs/Ndft;

spectrogram の出力を定義と比較します。スペクトログラムを表示します。

maxdiff = max(max(abs(s-X)))

maxdiff = 0

waterplot(X,fint,tint)

Figure contains an axes object. The axes object with xlabel Frequency (Hz), ylabel Time (s) contains an object of type patch.

function waterplot(s,f,t)
% Waterfall plot of spectrogram
    waterfall(f,t,abs(s)'.^2)
    set(gca,XDir="reverse",View=[30 50])
    xlabel("Frequency (Hz)")
    ylabel("Time (s)")
end

関数 `spectrogram` と `stft` の比較

1.4 kHz で 2 秒間サンプリングされたチャープで構成される信号を生成します。チャープの周波数は、測定時間中に 600 Hz から 100 Hz に線形的に減少します。

fs = 1400;
x = chirp(0:1/fs:2,600,2,100);

stft 既定

関数 spectrogram と stft を使用して信号の STFT を計算します。関数 stft の既定の値を使用します。

信号を 128 サンプルのセグメントに分割し、各セグメントに周期的ハンウィンドウを適用します。
隣接するセグメント間に 96 個のサンプルのオーバーラップを指定します。この長さはウィンドウの長さの 75% と等価です。
128 の DFT 点を指定し、STFT の中央を周波数ゼロに揃え、周波数は Hz 単位で表します。

2 つの結果が等価であることを確認します。

M = 128;
g = hann(M,"periodic");
L = 0.75*M;
Ndft = 128;

[sp,fp,tp] = spectrogram(x,g,L,Ndft,fs,"centered");

[s,f,t] = stft(x,fs);

dff = max(max(abs(sp-s)))

dff = 0

関数 mesh を使用して、2 つの出力をプロットします。

nexttile
mesh(tp,fp,abs(sp).^2)
title("spectrogram")
view(2), axis tight

nexttile
mesh(t,f,abs(s).^2)
title("stft")
view(2), axis tight

Figure contains 2 axes objects. Axes object 1 with title spectrogram contains an object of type surface. Axes object 2 with title stft contains an object of type surface.

spectrogram 既定

関数 spectrogram の既定の値を使用して計算を繰り返します。

信号を $M = ⌊ N_{x} / 4.5 ⌋$ の長さのセグメントに分割します。ここで、 $N_{x}$ は信号の長さです。各セグメントにハミングウィンドウを適用します。
セグメント間で 50% のオーバーラップを指定します。
FFT を計算するには、 $\max (256, 2^{⌈ \log_{2} M ⌉})$ 点を使用します。正の正規化周波数のみ、スペクトログラムを計算します。

M = floor(length(x)/4.5);
g = hamming(M);
L = floor(M/2);
Ndft = max(256,2^nextpow2(M));

[sx,fx,tx] = spectrogram(x);

[st,ft,tt] = stft(x,Window=g,OverlapLength=L, ...
    FFTLength=Ndft,FrequencyRange="onesided");

dff = max(max(sx-st))

dff = 0

関数 waterplot を使用して、2 つの出力をプロットします。どちらの場合も、周波数軸を $π$ で除算します。stft 出力の場合、サンプル数を有効なサンプルレート $2 π$ で除算します。

figure
nexttile
waterplot(sx,fx/pi,tx)
title("spectrogram")

nexttile
waterplot(st,ft/pi,tt/(2*pi))
title("stft")

$Figure contains 2 axes objects. Axes object 1 with title spectrogram, xlabel Frequency/\pi, ylabel Samples contains an object of type patch. Axes object 2 with title stft, xlabel Frequency/\pi, ylabel Samples contains an object of type patch.$

function waterplot(s,f,t)
% Waterfall plot of spectrogram
    waterfall(f,t,abs(s)'.^2)
    set(gca,XDir="reverse",View=[30 50])
    xlabel("Frequency/\pi")
    ylabel("Samples")
end

スペクトログラムと瞬時周波数

関数 spectrogram を使用して信号の瞬時周波数を測定し、追跡します。

1 kHz で 2 秒間サンプリングされた 2 次チャープを生成します。初期周波数が 100 Hz で、1 秒後には 200 Hz に増加するようにチャープを指定します。

fs = 1000;
t = 0:1/fs:2-1/fs;
y = chirp(t,100,1,200,'quadratic');

関数 spectrogram に実装された短時間フーリエ変換を使用して、チャープのスペクトルを推定します。信号にハミングウィンドウを適用し、長さ 100 のセクションに分割します。隣り合ったセクション間のオーバーラップのサンプル 80 個を指定し、周波数 $⌊ 100 / 2 + 1 ⌋ = 51$ におけるスペクトルを評価します。

spectrogram(y,100,80,100,fs,'yaxis')

Figure contains an axes object. The axes object with xlabel Time (s), ylabel Frequency (Hz) contains an object of type image.

$⌊ (2000 - 80) / (100 - 80) ⌋ = 96$ の時間点にわたる最大エネルギーをもつ時間-周波数リッジを検出することにより、チャープの周波数を追跡します。スペクトログラムプロットに瞬時周波数を重ね合わせます。

[~,f,t,p] = spectrogram(y,100,80,100,fs);

[fridge,~,lr] = tfridge(p,f);

hold on
plot3(t,fridge,abs(p(lr)),'LineWidth',4)
hold off

Figure contains an axes object. The axes object with xlabel Time (s), ylabel Frequency (Hz) contains 2 objects of type image, line.

複素信号のスペクトログラム

正弦関数的に変化する周波数成分をもつチャープのサンプルを 512 個生成します。

N = 512;
n = 0:N-1;

x = exp(1j*pi*sin(8*n/N)*32);

チャープの中央揃えの短時間フーリエ変換を計算します。信号を 16 サンプルがオーバーラップする 32 サンプルのセグメントに分割します。64 個の DFT ポイントを指定します。スペクトログラムをプロットします。

[scalar,fs,ts] = spectrogram(x,32,16,64,'centered');

spectrogram(x,32,16,64,'centered','yaxis')

Figure contains an axes object. The axes object with xlabel Samples, ylabel Normalized Frequency ( times pi blank radians/sample) contains an object of type image.

区間 $(- π, π]$ に対して 64 等間隔周波数のスペクトログラムを計算すると、同じ結果が得られます。'centered' オプションは必要ありません。

fintv = -pi+pi/32:pi/32:pi;

[vector,fv,tv] = spectrogram(x,32,16,fintv);

spectrogram(x,32,16,fintv,'yaxis')

Figure contains an axes object. The axes object with xlabel Samples, ylabel Normalized Frequency ( times pi blank radians/sample) contains an object of type image.

関数 `spectrogram` と `pspectrum` の比較

電圧制御発振器と 3 つのガウス原子で構成される信号を生成します。信号は $f_{s} = 2$ kHz で 2 秒間サンプリングされます。

fs = 2000;
tx = 0:1/fs:2;
gaussFun = @(A,x,mu,f) exp(-(x-mu).^2/(2*0.03^2)).*sin(2*pi*f.*x)*A';
s = gaussFun([1 1 1],tx',[0.1 0.65 1],[2 6 2]*100)*1.5;
x = vco(chirp(tx+.1,0,tx(end),3).*exp(-2*(tx-1).^2),[0.1 0.4]*fs,fs);
x = s+x';

短時間フーリエ変換

関数 pspectrum を使用して STFT を計算します。

$N_{x}$ サンプル信号を、 $80 / 2000 = 40$ ミリ秒の時間分解能に対応する長さ $M = 80$ のサンプルのセグメントに分割します。
$L = 16$ 個のサンプル、または隣接するセグメント間の 20% のオーバーラップを指定します。
カイザーウィンドウを使用して各セグメントにウィンドウを適用し、漏れには $ℓ = 0.7$ を指定します。

M = 80;
L = 16;
lk = 0.7;

[S,F,T] = pspectrum(x,fs,"spectrogram", ...
    TimeResolution=M/fs,OverlapPercent=L/M*100, ...
    Leakage=lk);

関数 spectrogram で得られた結果と比較します。

ウィンドウの長さとオーバーラップをサンプル単位で直接指定します。
pspectrum は常にカイザーウィンドウを $g (n)$ として使用します。漏れ $ℓ$ とウィンドウの形状係数 $β$ は、 $β = 40 \times (1 - ℓ)$ の関係にあります。
pspectrum は、離散フーリエ変換の計算に常に $N_{DFT} = 1024$ 個の点を使用します。両側または中央揃えの周波数範囲の変換を計算したい場合にこの数値を指定することができます。一方、実信号の既定値である片側変換の場合、spectrogram は $1024 / 2 + 1 = 513$ 個の点を使用します。あるいは、この例にあるように、変換を計算したい周波数のベクトルを指定することができます。
信号を $k = ⌊ \frac{N_{x} - L}{M - L} ⌋$ 個のセグメントに厳密に分割できない場合、spectrogram は信号を切り捨て、pspectrum は信号をゼロでパディングして追加のセグメントを作成します。出力を等価にするには、最後のセグメントと時間ベクトルの最後の要素を削除します。
spectrogram は、振幅の 2 乗をスペクトログラムとする STFT を返します。pspectrum は、あらかじめ係数 $\sum_{n} g (n)$ で除算してから 2 乗した各セグメントのパワースペクトルを返します。
片側変換の場合、pspectrum はスペクトログラムに追加の係数 2 を追加します。

g = kaiser(M,40*(1-lk));

k = (length(x)-L)/(M-L);
if k~=floor(k)
    S = S(:,1:floor(k));
    T = T(1:floor(k));
end

[s,f,t] = spectrogram(x/sum(g)*sqrt(2),g,L,F,fs);

関数 waterplot を使用して、これら 2 つの関数によって計算されたスペクトログラムを表示します。

subplot(2,1,1)
waterplot(sqrt(S),F,T)
title("pspectrum")

subplot(2,1,2)
waterplot(s,f,t)
title("spectrogram")

Figure contains 2 axes objects. Axes object 1 with title pspectrum, xlabel Frequency (Hz), ylabel Time (s) contains an object of type patch. Axes object 2 with title spectrogram, xlabel Frequency (Hz), ylabel Time (s) contains an object of type patch.

maxd = max(max(abs(abs(s).^2-S)))

maxd = 2.4419e-08

パワースペクトルと簡易プロット

関数 spectrogram は、各セグメントのパワースペクトルまたはパワースペクトル密度に対応する 4 番目の引数をもちます。pspectrum の出力と同様、ps 引数はあらかじめ 2 乗されており、正規化係数 $\sum_{n} g (n)$ を含みます。実信号の片側スペクトログラムの場合も、追加の係数 2 を含める必要があります。関数のスケーリング引数を "power" に設定します。

[~,~,~,ps] = spectrogram(x*sqrt(2),g,L,F,fs,"power");

max(abs(S(:)-ps(:)))

ans = 2.4419e-08

pspectrum と spectrogram は、出力引数なしで呼び出された場合に、信号のスペクトログラムをデシベル単位でプロットします。片側スペクトログラムの場合は係数 2 を含めます。両方のプロットで同じになるようにカラーマップを設定します。x の範囲を同じ値に設定して、pspectrum プロットの最後にある追加のセグメントが表示されるようにします。spectrogram プロットの y 軸に周波数を表示します。

subplot(2,1,1)
pspectrum(x,fs,"spectrogram", ...
    TimeResolution=M/fs,OverlapPercent=L/M*100, ...
    Leakage=lk)
title("pspectrum")
cc = clim;
xl = xlim;

subplot(2,1,2)
spectrogram(x*sqrt(2),g,L,F,fs,"power","yaxis")
title("spectrogram")
clim(cc)
xlim(xl)

Figure contains 2 axes objects. Axes object 1 with title pspectrum, xlabel Time (s), ylabel Frequency (kHz) contains an object of type image. Axes object 2 with title spectrogram, xlabel Time (s), ylabel Frequency (kHz) contains an object of type image.

function waterplot(s,f,t)
% Waterfall plot of spectrogram
    waterfall(f,t,abs(s)'.^2)
    set(gca,XDir="reverse",View=[30 50])
    xlabel("Frequency (Hz)")
    ylabel("Time (s)")
end

再割り当てされた 2 次チャープのスペクトログラム

1 kHz で 2 秒間サンプリングされたチャープ信号を生成します。初期周波数が 100 Hz で、1 秒後には 200 Hz に増加するようにチャープを指定します。

fs = 1000;
t = 0:1/fs:2;
y = chirp(t,100,1,200,"quadratic");

再割り当てされた信号のスペクトログラムを推定します。

信号に形状パラメーター $β = 18$ のカイザーウィンドウを適用し、長さ 128 のセクションに分割します。
隣り合ったセクション間のオーバーラップのサンプルを 120 個に指定します。
$⌊ 128 / 2 ⌋ = 65$ 周波数および $⌊ (l e n g t h (x) - 120) / (128 - 120) ⌋ = 235$ 時間ビンでスペクトルを評価します。

出力引数なしで関数 spectrogram を使用して、再割り当てされたスペクトログラムをプロットします。y 軸に周波数、x 軸に時間を表示します。

spectrogram(y,kaiser(128,18),120,128,fs, ...
    "reassigned","yaxis")

Figure contains an axes object. The axes object with xlabel Time (s), ylabel Frequency (Hz) contains an object of type image.

関数 imagesc を使用してプロットをやり直します。周波数値が下から上に増加するように、y 軸の方向を指定します。デシベル変換時に負の無限大となることを避けるため、再割り当てされたスペクトログラムに eps を追加します。

[~,fr,tr,pxx] = spectrogram(y,kaiser(128,18),120,128,fs, ...
    "reassigned");

imagesc(tr,fr,pow2db(pxx+eps))
axis xy
xlabel("Time (s)")
ylabel("Frequency (Hz)")
colorbar

Figure contains an axes object. The axes object with xlabel Time (s), ylabel Frequency (Hz) contains an object of type image.

しきい値を使用したスペクトログラム

1 kHz で 2 秒間サンプリングされたチャープ信号を生成します。初期周波数が 100 Hz で、1 秒後には 200 Hz に増加するようにチャープを指定します。

Fs = 1000;
t = 0:1/Fs:2;
y = chirp(t,100,1,200,'quadratic');

信号の時間依存のパワースペクトル密度 (PSD) を推定します。

信号に形状パラメーター $β = 18$ のカイザーウィンドウを適用し、長さ 128 のセクションに分割します。
隣り合ったセクション間のオーバーラップのサンプルを 120 個に指定します。
$⌊ 128 / 2 ⌋ = 65$ 周波数および $⌊ (l e n g t h (x) - 120) / (128 - 120) ⌋ = 235$ 時間ビンでスペクトルを評価します。

各 PSD 推定の重心の周波数および時間を出力します。 $- 30$ dB より小さい PSD の要素をゼロに設定します。

[~,~,~,pxx,fc,tc] = spectrogram(y,kaiser(128,18),120,128,Fs, ...
    'MinThreshold',-30);

重心の周波数および時間の関数として非ゼロの要素をプロットします。

plot(tc(pxx>0),fc(pxx>0),'.')

Figure contains an axes object. The axes contains a line object which displays its values using only markers.

中央揃えのスペクトログラムと片側スペクトログラムの計算

2 kHz で 2 秒間サンプリングされた実数値のチャープで構成される信号を生成します。

fs = 2000;
tx = 0:1/fs:2;
x = vco(-chirp(tx,0,tx(end),2).*exp(-3*(tx-1).^2), ...
    [0.1 0.4]*fs,fs).*hann(length(tx))';

両側スペクトログラム

信号の両側 STFT を計算してプロットします。

信号を、それぞれ $M = 73$ サンプルの長さのセグメントに分割します。
隣接するセグメント間に $L = 24$ 個のサンプルのオーバーラップを指定します。
最後の短いセグメントを破棄します。
各セグメントにフラットトップウィンドウを適用します。
$N_{DFT} = 895$ 点で各セグメントの離散フーリエ変換を評価します。このとき、点の数が奇数であることに注意します。

M = 73;
L = 24;
g = flattopwin(M);
Ndft = 895;
neven = ~mod(Ndft,2);

[stwo,f,t] = spectrogram(x,g,L,Ndft,fs,"twosided");

出力引数なしで関数 spectrogram を使用し、両側スペクトログラムをプロットします。

spectrogram(x,g,L,Ndft,fs,"twosided","power","yaxis")

Figure contains an axes object. The axes object with xlabel Time (s), ylabel Frequency (kHz) contains an object of type image.

定義を使用して両側スペクトログラムを計算します。隣接するセグメント間で $L$ サンプルがオーバーラップする $M$ サンプルのセグメントに信号を分割します。各セグメントにウィンドウを適用し、それぞれについて、 $N_{DFT}$ 点での離散フーリエ変換を計算します。

[segs,~] = buffer(1:length(x),M,L,"nodelay");

Xtwo = fft(x(segs).*g,Ndft);

時間範囲と周波数範囲を計算します。

時間値を求めるには、時間ベクトルをオーバーラップセグメントに分割します。時間値は、下端でオープンの区間として扱われる各セグメントの中間点です。
周波数値を求めるには、ゼロ周波数でクローズ、上端でオープンとなるナイキスト区間を指定します。

tbuf = tx(segs);
ttwo = mean(tbuf(2:end,:));

ftwo = 0:fs/Ndft:fs*(1-1/Ndft);

spectrogram の出力を定義と比較します。関数 waterplot を使用して、スペクトログラムを表示します。

diffs = [max(max(abs(stwo-Xtwo))) max(abs(f-ftwo')) max(abs(t-ttwo))]

diffs = 1×3
10^-12 ×

         0    0.2274    0.0002

figure
nexttile
waterplot(Xtwo,ftwo,ttwo)
title("Two-Sided, Definition")

nexttile
waterplot(stwo,f,t)
title("Two-Sided, spectrogram Function")

Figure contains 2 axes objects. Axes object 1 with title Two-Sided, Definition, xlabel Frequency (Hz), ylabel Time (s) contains an object of type patch. Axes object 2 with title Two-Sided, spectrogram Function, xlabel Frequency (Hz), ylabel Time (s) contains an object of type patch.

中央揃えのスペクトログラム

信号の中央揃えのスペクトログラムを計算します。

両側 STFT で使用したのと同じ時間値を使用します。
関数 fftshift を使用して、STFT のゼロ周波数成分をスペクトルの中央にシフトします。
$N_{DFT}$ が奇数の場合、周波数範囲は両側でオープンとなります。 $N_{DFT}$ が偶数の場合、周波数範囲は下端でオープン、上端でクローズとなります。

出力を比較してスペクトログラムを表示します。

tcen = ttwo;

if ~neven
    Xcen = fftshift(Xtwo,1);
    fcen = -fs/2*(1-1/Ndft):fs/Ndft:fs/2;
else
    Xcen = fftshift(circshift(Xtwo,-1),1);
    fcen = (-fs/2*(1-1/Ndft):fs/Ndft:fs/2)+fs/Ndft/2;
end

[scen,f,t] = spectrogram(x,g,L,Ndft,fs,"centered");

diffs = [max(max(abs(scen-Xcen))) max(abs(f-fcen')) max(abs(t-tcen))]

diffs = 1×3
10^-12 ×

         0    0.2274    0.0002

figure
nexttile
waterplot(Xcen,fcen,tcen)
title("Centered, Definition")

nexttile
waterplot(scen,f,t)
title("Centered, spectrogram Function")

Figure contains 2 axes objects. Axes object 1 with title Centered, Definition, xlabel Frequency (Hz), ylabel Time (s) contains an object of type patch. Axes object 2 with title Centered, spectrogram Function, xlabel Frequency (Hz), ylabel Time (s) contains an object of type patch.

片側スペクトログラム

信号の片側スペクトログラムを計算します。

両側 STFT で使用したのと同じ時間値を使用します。
$N_{DFT}$ が奇数の場合、片側 STFT は両側 STFT の最初の $(N_{DFT} + 1) / 2$ 行により構成されます。 $N_{DFT}$ が偶数の場合、片側 STFT は両側 STFT の最初の $N_{DFT} / 2 + 1$ 行により構成されます。
$N_{DFT}$ が奇数の場合、周波数範囲はゼロ周波数でクローズ、ナイキスト周波数でオープンとなります。 $N_{DFT}$ が偶数の場合、周波数範囲は両側でクローズとなります。

出力を比較してスペクトログラムを表示します。実数値信号の場合、"onesided" 引数はオプションです。

tone = ttwo;

if ~neven
    Xone = Xtwo(1:(Ndft+1)/2,:);
else
    Xone = Xtwo(1:Ndft/2+1,:);
end

fone = 0:fs/Ndft:fs/2;

[sone,f,t] = spectrogram(x,g,L,Ndft,fs);

diffs = [max(max(abs(sone-Xone))) max(abs(f-fone')) max(abs(t-tone))]

diffs = 1×3
10^-12 ×

         0    0.1137    0.0002

figure
nexttile
waterplot(Xone,fone,tone)
title("One-Sided, Definition")

nexttile
waterplot(sone,f,t)
title("One-Sided, spectrogram Function")

Figure contains 2 axes objects. Axes object 1 with title One-Sided, Definition, xlabel Frequency (Hz), ylabel Time (s) contains an object of type patch. Axes object 2 with title One-Sided, spectrogram Function, xlabel Frequency (Hz), ylabel Time (s) contains an object of type patch.

function waterplot(s,f,t)
% Waterfall plot of spectrogram
waterfall(f,t,abs(s)'.^2)
set(gca,XDir="reverse",View=[30 50])
xlabel("Frequency (Hz)")
ylabel("Time (s)")
end

セグメントの PSD とパワースペクトルの計算

関数 spectrogram は、4 番目の出力引数として、各セグメントのパワースペクトル密度 (PSD) またはパワースペクトルのいずれかを含む行列をもちます。パワースペクトルは、PSD にウィンドウの等価ノイズ帯域幅 (ENBW) を乗算した値と等価です。

1 kHz で 1 秒間サンプリングされた対数チャープで構成される信号を生成します。チャープの初期周波数は 400 Hz で、測定の最後には 10 Hz に減少します。

fs = 1000;
tt = 0:1/fs:1-1/fs;
y = chirp(tt,400,tt(end),10,"logarithmic");

サンプルレートによる PSD とパワースペクトルのセグメント化

信号を 102 サンプルのセグメントに分割し、各セグメントにハンウィンドウを適用します。隣り合ったセグメント間のオーバーラップを 12 サンプル、DFT 点を 1024 に指定します。

M = 102;
g = hann(M);
L = 12;
Ndft = 1024;

既定の PSD スペクトルタイプで信号のスペクトログラムを計算します。STFT、およびセグメントのパワースペクトル密度の配列を出力します。

[s,f,t,p] = spectrogram(y,g,L,Ndft,fs);

スペクトルタイプを "power" に指定して計算を繰り返します。STFT、およびセグメントのパワースペクトルの配列を出力します。

[r,~,~,q] = spectrogram(y,g,L,Ndft,fs,"power");

どちらの場合もスペクトログラムが同じになることを確認します。周波数に対数スケールを使用して、スペクトログラムをプロットします。

max(max(abs(s).^2-abs(r).^2))

ans = 0

waterfall(f,t,abs(s)'.^2)
set(gca,XScale="log",...
    XDir="reverse",View=[30 50])

Figure contains an axes object. The axes object contains an object of type patch.

パワースペクトルが、パワースペクトル密度にウィンドウの ENBW を乗算した値と等価であることを確認します。

max(max(abs(q-p*enbw(g,fs))))

ans = 1.1102e-16

セグメントのパワースペクトルの行列が、スペクトログラムに比例していることを確認します。比例係数は、ウィンドウ要素の和の 2 乗です。

max(max(abs(s).^2-q*sum(g)^2))

ans = 3.4694e-18

正規化周波数による PSD とパワースペクトルのセグメント化

計算を繰り返しますが、今度は正規化周波数で計算します。サンプルレートを $2 π$ として指定した場合、結果は同じになります。

[~,~,~,pn] = spectrogram(y,g,L,Ndft);
[~,~,~,qn] = spectrogram(y,g,L,Ndft,"power");

max(max(abs(qn-pn*enbw(g,2*pi))))

ans = 1.1102e-16

オーディオ信号のチャープの追跡

減少する 2 つのチャープと広帯域のスプラッター音を含むオーディオ信号を読み込みます。短時間フーリエ変換を計算します。波形を 300 サンプルがオーバーラップする 400 サンプルのセグメントに分割します。スペクトログラムをプロットします。

load splat

% To hear, type soundsc(y,Fs)

sg = 400;
ov = 300;

spectrogram(y,sg,ov,[],Fs,"yaxis")
colormap bone

Figure contains an axes object. The axes object with xlabel Time (s), ylabel Frequency (kHz) contains an object of type image.

関数 spectrogram を使用し、信号のパワースペクトル密度 (PSD) を出力します。

[s,f,t,p] = spectrogram(y,sg,ov,[],Fs);

関数 medfreq を使用して 2 つのチャープを追跡します。より強い低周波のチャープを検出するには、探索を 100 Hz より高い周波数と広帯域音が始まる前の時間に制限します。

f1 = f > 100;
t1 = t < 0.75;

m1 = medfreq(p(f1,t1),f(f1));

微弱な高周波のチャープを検出するには、探索を 2500 Hz より高い周波数と 0.3 秒～ 0.65 秒の時間に制限します。

f2 = f > 2500;
t2 = t > 0.3 & t < 0.65;

m2 = medfreq(p(f2,t2),f(f2));

結果をスペクトログラムに重ね合わせます。kHz の単位で表すために周波数の値を 1000 で除算します。

hold on
plot(t(t1),m1/1000,LineWidth=4)
plot(t(t2),m2/1000,LineWidth=4)
hold off

Figure contains an axes object. The axes object with xlabel Time (s), ylabel Frequency (kHz) contains 3 objects of type image, line.

3D スペクトログラムの可視化

10 kHz でサンプリングされた 2 秒間の信号を生成します。信号の瞬時周波数を時間の三角形関数として指定します。

fs = 10e3;
t = 0:1/fs:2;
x1 = vco(sawtooth(2*pi*t,0.5),[0.1 0.4]*fs,fs);

信号のスペクトログラムを計算してプロットします。長さ 256 で形状パラメーター $β = 5$ のカイザーウィンドウを使用します。セクション間のオーバーラップのサンプル 220 個と DFT 点 512 個を指定します。周波数を y 軸にプロットします。既定のカラーマップとビューを使用します。

spectrogram(x1,kaiser(256,5),220,512,fs,'yaxis')

Figure contains an axes object. The axes object with xlabel Time (s), ylabel Frequency (kHz) contains an object of type image.

スペクトログラムをウォーターフォールプロットとして表示するようにビューを変更します。カラーマップを bone に設定します。

view(-45,65)
colormap bone

Figure contains an axes object. The axes object with xlabel Time (s), ylabel Frequency (kHz) contains an object of type surface.

入力引数

`x` — 入力信号
ベクトル

入力信号。行ベクトルまたは列ベクトルとして指定します。

例: cos(pi/4*(0:159))+randn(1,160) は、ホワイトガウスノイズに含まれる正弦波を指定します。

データ型: single | double
複素数のサポート: あり

`window` — ウィンドウ
正の整数 | ベクトル | `[]`

ウィンドウ。正の整数、あるいは行ベクトルまたは列ベクトルとして指定します。window は信号をセグメントに分割するために使用します。

window が整数の場合、spectrogram は x を長さ window のセグメントに分割し、各セグメントにその長さのハミングウィンドウを適用します。
window がベクトルの場合、spectrogram は x をベクトルと同じ長さのセグメントに分割し、window を使用して各セグメントにウィンドウを適用します。

x の長さが noverlap 個のオーバーラップサンプルをもつ整数個のセグメントに厳密に分割できない場合、x はそれに応じた長さで打ち切られます。

window を空として指定した場合、spectrogram は、x が noverlap 個のオーバーラップサンプルをもつ 8 個のセグメントに分割されているハミングウィンドウを使用します。

利用可能なウィンドウのリストについては、ウィンドウを参照してください。

例: hann(N+1) と (1-cos(2*pi*(0:N)'/N))/2 は、いずれも長さ N + 1 のハンウィンドウを指定します。

`noverlap` — オーバーラップするサンプルの数
非負の整数 | `[]`

オーバーラップするサンプルの数。非負の整数として指定します。

window がスカラーの場合、noverlap は window より小さくなければなりません。
window がベクトルの場合、noverlap は window の長さより小さくなければなりません。

noverlap を空として指定した場合、spectrogram はセグメント間で 50% のオーバーラップが発生する数を使用します。セグメントの長さを指定していない場合、関数により noverlap が ⌊N_x/4.5⌋ に設定されます。ここで、N_x は入力信号の長さで、⌊⌋ 記号は床関数を表します。

`nfft` — DFT 点の数
正の整数 | `[]`

DFT 点の数。正の整数スカラーとして指定します。nfft を空として指定した場合、spectrogram によりパラメーターが max(256,2^p) に設定されます。ここで p = ⌈log₂ N_w⌉ で、⌈⌉ 記号は天井関数を表し、

window がスカラーの場合は、N_w = window です。
window がベクトルの場合は、N_w = length(window) です。

`w` — 正規化周波数
ベクトル

正規化周波数。ベクトルとして指定します。w は少なくとも 2 つの要素をもたなければなりません。そうでない場合は、関数が nfft として解釈するためです。正規化周波数の単位はラジアン/サンプルです。

例: pi./[2 4]

データ型: single | double

`f` — 巡回周波数
ベクトル

巡回周波数。ベクトルとして指定します。f は少なくとも 2 つの要素をもたなければなりません。そうでない場合は、関数が nfft として解釈するためです。f の単位はサンプルレート fs により指定されます。

データ型: single | double

`fs` — サンプルレート
1 Hz (既定値) | 正のスカラー

サンプルレート。正のスカラーで指定します。サンプルレートは単位時間あたりのサンプル数です。時間の単位が秒の場合、サンプルレートの単位は Hz です。

`freqrange` — PSD 推定の周波数範囲
`"onesided"` | `"twosided"` | `"centered"`

PSD 推定の周波数範囲。"onesided"、"twosided" または "centered" で指定します。実数値信号の場合、既定の設定は "onesided" です。複素数値信号の場合、既定の設定は "twosided" で、"onesided" を指定するとエラーになります。

"onesided" — 実数の入力信号の片側スペクトログラムを返します。nfft が偶数の場合、ps は nfft/2 + 1 行をもち、計算区間は [0, π] ラジアン/サンプルです。nfft が奇数の場合、ps は (nfft + 1)/2 行をもち、計算区間は [0, π) ラジアン/サンプルです。fs を指定すると、それぞれの場合の計算区間は [0, fs/2] サイクル/単位時間、[0, fs/2) サイクル/単位時間となります。
"twosided" — 実信号または複素数値信号の両側スペクトログラムを返します。ps は nfft 行をもち、計算区間は [0, 2π) ラジアン/サンプルです。fs を指定した場合、計算区間は [0, fs) サイクル/単位時間となります。
"centered" — 中央に揃えた、実信号または複素数値信号の両側スペクトログラムを返します。ps は nfft 行をもちます。nfft が偶数の場合、ps の計算区間は (–π, π] ラジアン/サンプルです。nfft が奇数の場合、ps の計算区間は (–π, π) ラジアン/サンプルです。fs を指定すると、それぞれの場合の計算区間は (–fs/2, fs/2] サイクル/単位時間、(–fs/2, fs/2) サイクル/単位時間となります。

データ型: char | string

`spectrumtype` — パワースペクトルのスケーリング
`"psd"` (既定値) | `"power"`

パワースペクトルのスケーリング。"psd" または "power" で指定します。

spectrumtype を省略するか、"psd" を指定すると、パワースペクトル密度が返されます。
"power" を指定すると、ウィンドウの等価ノイズ帯域幅ごとに PSD 推定をスケーリングします。結果は、各周波数のパワーの推定です。"reassigned" オプションがオンの場合、関数は、再代入の前に PSD を各周波数ビンの幅で積分します。

データ型: char | string

`freqloc` — 周波数の表示軸
`"xaxis"` (既定値) | `"yaxis"`

周波数の表示軸。"xaxis" または "yaxis" で指定します。

"xaxis" — 周波数が x 軸に、時間が y 軸に表示されます。
"yaxis" — 周波数が y 軸に、時間が x 軸に表示されます。

この引数は出力引数で spectrogram を呼び出している場合に無視されます。

データ型: char | string

名前と値の引数

オプションの引数のペアを Name1=Value1,...,NameN=ValueN として指定します。ここで、Name は引数名で、Value は対応する値です。名前と値の引数は他の引数の後に指定しなければなりませんが、ペアの順序は重要ではありません。

例: spectrogram(x,100,OutputTimeDimension="downrows") は x を長さ 100 のセグメントに分割し、各セグメントにその長さのハミングウィンドウを適用します。スペクトログラムの出力には、行方向に沿った時間次元があります。

R2021a より前では、コンマを使用して名前と値をそれぞれ区切り、Name を引用符で囲みます。

例: spectrogram(x,100,'OutputTimeDimension','downrows') は x を長さ 100 のセグメントに分割し、各セグメントにその長さのハミングウィンドウを適用します。スペクトログラムの出力には、行方向に沿った時間次元があります。

`MinThreshold` — しきい値
`-Inf` (既定値) | 実数スカラー

しきい値。デシベル単位で表される実数スカラーとして指定します。spectrogram は、10 log₁₀(s) ≤ thresh となる s の要素をゼロに設定します。

`OutputTimeDimension` — 出力時間次元
`"acrosscolumns"` (既定値) | `"downrows"`

出力時間次元。"acrosscolumns" または "downrows" として指定します。行に沿った s、ps、fc、および tc の時間次元と、列に沿った周波数次元が必要な場合は、この値を "downrows" に設定します。列に沿った s、ps、fc、および tc の時間次元と、行に沿った周波数次元が必要な場合は、この値を "acrosscolumns" に設定します。関数が出力引数なしで呼び出された場合、この入力は無視されます。

データ型: char | string

出力引数

`s` — 短時間フーリエ変換
行列

短時間フーリエ変換。行列として返されます。時間は s の列方向に、周波数は行方向に下がって 0 から増加します。

x が長さ N_x の信号の場合、s は k 列になります。ここで
- window がスカラーの場合は、k = ⌊(N_x – noverlap)/(window – noverlap)⌋。
- window がベクトルの場合は、k = ⌊(N_x – noverlap)/(length(window) – noverlap)⌋。
x が実数で nfft が偶数の場合、s は (nfft/2 + 1) 行になります。
x が実数で nfft が奇数の場合、s は (nfft + 1)/2 行になります。
x が複素数値の場合、s は nfft 行になります。

メモ

freqrange が "onesided" に設定されている場合、spectrogram は、正のナイキスト範囲の s 値を合計パワーを保存せずに出力します。

s は "reassigned" オプションの影響は受けません。

`w` — 正規化周波数
ベクトル

正規化周波数。ベクトルとして返されます。w の長さは s の行数と等しくなります。

`t` — 時点
ベクトル

時点。ベクトルとして返されます。t の時間値は、各セグメントの中間点に対応します。

`f` — 巡回周波数
ベクトル

巡回周波数。ベクトルとして返されます。f の長さは s の行数と等しくなります。

`ps` — パワースペクトル密度またはパワースペクトル
行列

パワースペクトル密度 (PSD) またはパワースペクトル。行列として返されます。

x が実数で freqrange が指定されない場合、または "onesided" に設定されている場合、ps は各セグメントの PSD またはパワースペクトルの片側修正ピリオドグラム推定を含みます。この関数は 0 とナイキスト周波数以外のすべての周波数でパワーを 2 倍にして、合計パワーを保存します。
x が複素数値の場合、もしくは freqrange が "twosided" または "centered" に設定されている場合、ps は各セグメントの PSD またはパワースペクトルの両側修正ピリオドグラム推定を含みます。
w に正規化周波数のベクトルを指定した場合、または f に巡回周波数のベクトルを指定した場合、ps は入力周波数で評価された各セグメントの PSD またはパワースペクトルの修正ピリオドグラム推定を含みます。

`fc`, `tc` — エネルギー中心の周波数および時間
行列

エネルギー中心の周波数および時間。短時間フーリエ変換と同じサイズの行列として返されます。サンプルレートを指定しない場合、fc の要素は正規化周波数として返されます。

詳細