技術情報

MATLAB オーディオ処理アルゴリズムを使用した絶滅の危機に瀕したフクロウ種の保護

著者 富士通九州ネットワークテクノロジーズ株式会社 斎藤 睦巳氏


シマフクロウ (図 1) は、世界で最も珍しい鳥の 1 つです。日本の現在の個体数は 200 羽未満と推定され、環境省はシマフクロウを絶滅の危険性が最も高い種として挙げています。

図 1. シマフクロウ。これは、フクロウの中で最も大きい種です。(写真提供:日本野鳥の会)

図 1. シマフクロウ。これは、フクロウの中で最も大きい種です。(写真提供:日本野鳥の会)

この種の個体数が急速に減少したのは、生息地の河畔林が大幅に失われたためです。シマフクロウの保護とその個体数の増加を目指して、日本野鳥の会 (WBSJ:Wild Bird Society of Japan) は、このフクロウの生息状況の調査を実施しています。この結果を利用して、今後の減少を防ぐ対策を実施する自然保護活動が行われます。

この調査を支援するために、富士通九州ネットワークテクノロジーズはシマフクロウの鳴き声の独特なオーディオ パターンを自動的に認識する MATLAB® アプリケーションを開発しました。通常、オスとメスのフクロウはつがいとなり、夜に鳴き交わします。MATLAB アプリケーションを使用すると、森で録音したオーディオからその鳴き声を正確に識別できます。これまでは、研究者が録音を聞くのに録音時間と同じ時間がかかっていました。MATLAB アプリケーションを使用すると、同じ録音からすべてのフクロウの鳴き声を 2、3 分で識別できます。

主観的で多大な労力を要するプロセスの自動化

WBSJ がプロジェクトを開始したとき、研究者は森の中で数時間フクロウの鳴き声を聞いていました。このアプローチは困難であることがわかり、研究者は戦略を切り替えて、多くの地点で音を記録するために森の中に多数のデジタル レコーダーを設置しました。

数千時間ものオーディオ、つまり数百ギガバイトのデータが季節ごとに記録されるため、フクロウの鳴き声を識別するプロセスには時間がかかり、それぞれの研究者のスキルに大きく依存していました。デバイスから遠く離れた場所にいるフクロウの鳴き声を検出するのはほぼ不可能でした。さらにアプローチを自動化する必要があるのは明らかでした。

その当時、富士通は WBSJ によるタンチョウの保護活動を支援していました。このコラボレーションの間に構築された関係に基づいて、WBSJ はデジタル録音を解析して、シマフクロウの鳴き声を自動的に認識できるソフトウェアの開発を富士通に依頼しました。この依頼は、IT ソリューションの生物多様性保全への適用を促進するという富士通グループの生物多様性行動指針に沿っていたため、シマフクロウの保護活動を支援するためにソフトウェアを開発することになりました。

鳴き声識別アルゴリズムの開発

このソフトウェア開発の最初のステップは、フォーマット変換とフィルター処理を行ってスペクトル解析向けの音データを用意することでした。デジタル レコーダーは 44.1kHz のサンプリング レートで音データを記録し、それを WAV または MP3 ファイルとして保存しています。MP3 ファイル内のデータは圧縮されているため、MATLAB を使用してこれを非圧縮のパルス符号変調 (PCM) に再フォーマットしました。

フクロウの鳴き声の範囲は 200 ~ 300 Hz です。鳴き声の検出を容易にするために、DSP System Toolbox™ の SampleRateConverter System object を使用して 44.1kHz データをサンプリングレート変換しました。

次にすべきことはスペクトル解析でした。MATLAB で、データをセグメントに分割して、各セグメントに対してフーリエ変換を実行して周波数特性を解析するアルゴリズムを開発しました。次に、スペクトル パターンを分析してピーク周波数を決定します (図 2)。

図 2. フクロウの鳴き声の周波数特性を解析するプロセス。

図 2. フクロウの鳴き声の周波数特性を解析するプロセス。

アルゴリズムは、入力データのピーク周波数の時変パターンと、実際のシマフクロウのオーディオ データの処理から得られる参照パターンを比較します。測定されたパターンが参照パターンと十分に類似している場合、アルゴリズムは WBSJ の研究者が今後参照できるように、オーディオ セグメントのタイムスタンプをログに記録します。

スタンドアロン アプリケーションによる結果の検証と可視化

WBSJ の研究者が自動化された検出アルゴリズムを容易に使用できるようにするために、グラフィカル インターフェイスを開発して、MATLAB Compiler™ を使用して調査者がどのような PC 上でも、MATLAB がインストールされていなくても実行できるスタンドアロン アプリケーションを作成しました。このインターフェイスを使用して、はじめに研究者は解析対象の録音されたオーディオ ファイルを選択します。アルゴリズムによって音声解析が行われ、フクロウの鳴き声のタイム スタンプのリストが生成されると、研究者は各ログ エントリをレビューして実際の鳴き声であることを確認できます。このインターフェイスを使用して、研究者はそれぞれの鳴き声の録音を再生して、Signal Processing Toolbox™ を使用して作成された、シマフクロウの鳴き声に特徴的な "m" 形状を示す鳴き声のスペクトログラムを表示できます (図 3)。

図 3. MATLAB で開発された、シマフクロウの鳴き声の検出、可視化および確認を行うインターフェイス。

図 3. MATLAB で開発された、シマフクロウの鳴き声の検出、可視化および確認を行うインターフェイス。

個々のシマフクロウとその他の種の識別

WBSJ の研究者は、シマフクロウの鳴き声の確認のためにこのソフトウェアを既に使用していますが、個々のシマフクロウの鳴き声を識別するためのアルゴリズムの変更依頼を受けています。この依頼に応じて、現在 MATLAB でアルゴリズムを調整しています。生物多様性保護活動をさらに支援するために、富士通九州ネットワークテクノロジーズは鳥の鳴き声の自動認識を別の種に対しても拡張することを計画しています。

公開年 2017 - 92949v00