田辺三菱製薬が創薬を加速させるデータ解析ツールを開発
課題
薬理や安全性、薬物動態 (DMPK)などの研究にお けるデータ解析を合理化して、医薬候補品の選択 プロセスを改善
ソリューション
MATLAB を使用して定量的なデータ解析アルゴリ ズムを開発し、MathWorks コンサルタントと協力 して、実験系研究員に配布するスタンドアロンの解 析アプリケーションを作成
結果
- アルゴリズム開発を 4 分の 1 の時間で完了
- 解析期間を75% 短縮し、複数の薬剤を素早く解析、比較
- アプリケーション開発における作業工数を 83% 削減
製薬会社では、動物を用いた各種試験を通じて薬物動態学 (DMPK)、薬理および安全性に関する事象を段階的にチェックしながら有望なリード化合物を創出し、臨床試験でその有用性を確認して、最終的に規制当局に申請します。しかしながら、解析アルゴリズムを開発するデータサイエンティストと、それらのツールを使用して自ら取得したデータを解析し、創薬研究を推進する生物学や化学の実験系研究員との連携は必須ですが、両者の間には技術的なギャップが存在することがよくあります。このギャップにより、全体の業務効率が著しく損なわれることが多くありました。
田辺三菱製薬株式会社(以下、田辺三菱製薬)は、 MathWorks 技術コンサルティングサービスと連携してこのギャップを埋めるために、解析プロセスを簡便化し、医薬候補品の選択を効率化しました。すなわち、田辺三菱製薬は、MATLAB® ベースのユーザーフレンドリーなデータ解析ツールを開発することで、解析アルゴリズムの開発期間を短縮するだけでなく、実験系研究員の解析作業を効率化し、定量的に評価する医薬候補品の数を増やすことで、創薬プロセスを加速させました。
田辺三菱製薬でバイオインフォマティクスの研究員を務める齊藤隆太氏は次のように述べています。「当社の実験系研究員は、我々がMATLAB で開発したツールを使って、定量的な解析結果を自動的に取得するだけでなく、ヒューマンエラーを減らし、解析を再現よく実施できるようになりました。その結果、評価できる化合物の数が増え、以前まではコストやリソースの面から見過ごされてきた化合物についても解析できるようになり、有望な医薬候補品を迅速に見出すことが可能になりました。」
課題
田辺三菱製薬では通常、新しい手技や機器を用いた動物実験でデータを取得した際に、以下の2ステップでそのデータを解析しています。
最初のステップでは一部のデータを用いて、プログラミングの経験をもつデータサイエンティストが、画像処理およびデータ解析アルゴリズムの開発を行います。データサイエンティストは Java ®、Perl、R および Python を用いたデータ解析やアルゴリズム開発には慣れていましたが、いくつかの欠点がありました。1 つ目は、広く知られている画像処理手法であっても一からコードを記述するため、開発に時間がかかることでした。2 つ目は、さまざまな形式のファイルからデータを読み込み、自動的に処理することが困難なことでした。3 つ目は、開発されたアルゴリズムは実験系研究員にとって使いにくいと感じることが多く、使いやすくするためのアルゴリズムの改良やツール開発を別途行う必要がありました。
次のステップでは、実験系研究員がアルゴリズムを使用して元の全てのデータセットや異なる実験でのデータセットを解析しますが、このステップにもいくつかの欠点がありました。1つ目は、実験系研究員がスプレッドシートへのデータのコピー、フォルダーの管理、特定の画像解析用のファイルの作成、大量の画像ファイルにおける解析領域の特定など、多くの煩雑でミスの起こり易い手作業をする必要があることでした。2つ目は、パラメータやオプションの設定などの解析方法が担当者に依存し、担当者によって解析結果が異なることでした。
田辺三菱製薬は、この両方のステップを効率化し、生物学データの解析プロセスにおける精度、再現性、迅速性を高めることを目指しました。
ソリューション
田辺三菱製薬は、MATLAB、Image Processing Toolbox™、Bioinformatics Toolbox™ および Statistics and Machine Learning Toolbox™ を使って生物学的データの解析アルゴリズムを開発し、MathWorks コンサルタントの協力を得ながらユーザーフレンドリーなグラフィカル ユーザー インターフェースを作成し、MATLAB Compiler™ でそれをアプリケーションとして展開しました。
データサイエンティストは、MATLAB およびツールボックスを使用して、画像のセグメント化、動画でのオブジェクト追跡、アライメントなどのアルゴリズムを開発しました。開発したアルゴリズムは、画像、動画およびゲノムなどのデータを読み込んで前処理が可能であり、また、曲線の平滑化、ノイズ除去、ピーク検出、モルフォロジー演算、画像定量化などのさまざまなオブジェクト指向の実行関数で構成されているので、解析の目的やデータの特徴に応じて自由に呼び出すことができます。
データサイエンティストのチームは、一部のサンプルデータを用いてアルゴリズムを最適化した後に、アルゴリズムを一連のグラフィカル アプリケーションに取り込み、実験系研究員が注目臓器の障害度の診断、動物行動パターンの分析あるいは遺伝子発現のプロファイリングに使用できるようにしました。
アルゴリズムを最適化した後、MATLAB Compiler を使用して、これらのアプリケーションをスタンドアロンで実行できるように配布用バージョンを作成し、MATLAB を持っていない実験系研究員でも使用できるようにしました。
実験系研究員はこのアプリケーションを用いて、自分で自ら取得したデータセットの解析を、各種パラメータ値やアルゴリズムのオプションを調整しながら実施できるようにしました。また、最適なパラメータ値とオプションの組み合わせを特定した後に、より大規模な異なるデータセットに対して、簡便に自動で同じ解析を実施できるようにしました。
田辺三菱製薬の実験系研究員は、MathWorks社の 技術コンサルタントと共同開発した MATLAB ベースのアプリケーションを使用することで、有望な開発候補品を見い出すことができました。
結果
- アルゴリズム開発を 4 分の 1 の時間で完了. 齊藤氏は次のように述べています。「組み込み関数、対話型環境および複数のデータ形式を統合できる機能を備えた MATLAB を使用することで、1ヶ月かけて C/C++ やPerl、Java に実装していたアルゴリズムが、MATLAB では数日から1週間で開発できるようになりました。」
- 解析期間を75% 短縮し、複数の薬剤を素早く解析、比較. 齊藤氏は次のように述べています。「MathWorksの技術コンサルタントの協力を得て開発したMATLABベースの解析ツールを使うことで、当社の実験系研究員はこれまで 12 時間かかっていたデータ解析をわずか 2.5 時間で完了できました。また、複数の薬剤の効果を同時に評価、比較できるようになりました。」
- アプリケーション開発における作業工数を 83% 削減. 齊藤氏は次のように述べています。「MathWorks の技術コンサルタントは、我々が MATLAB で作成したアルゴリズムをベースに、当社の実験系研究員が使用する上で有用なアプリケーションを開発してくれました。そのおかげで、当社の研究員がアプリケーション開発に要する工数 (FTE) は 83% 削減されました。技術コンサルタントは当社のデータサイエンティストおよび実験系研究員と緊密に連携して当社の要件を把握し、当社だけで行うよりもはるかに早くアプリケーション開発を完了させることができました。」