理化学研究所、CNNを非画像データに適用する手法を開発

MATLABはディープラーニングや機械学習に便利な機能を備えています。コーディングに時間をかけることなく、研究をスピーディーに進めることができます。

主な成果

  • CNNを非画像データに適用し、特徴抽出を迅速に実現
  • コーディングに要する時間を削減
  • ディープラーニングの学習と推論のために複数GPUを使用

ゲノム解析で使われるような、表現型や種別における小さな変動を検出することは重要であり難しいタスクです。データは十分にあっても、遺伝子を識別するような特徴抽出は容易ではありません。

一般的にCNNは画像データには有効な手法であることが知られていますが、遺伝研究ではRNA配列データのような非画像データを扱うため、CNNが機能しないことが課題でした。

基礎科学と応用化学の日本最大の研究機関である理化学研究所では、DeepInsightプロジェクトにて、CNNを非画像データに適用出来るように、画像形式に変換することに取り組みました。MATLAB®を使用して、データに含まれる類似の要素をクラスターに配置することで、非画像データの特徴抽出が容易になり、隠れたメカニズムを識別することができました。

謝辞