テキサス A&M 大学、MATLAB を用いて単細胞 RNA シーケンス解析を実施

プロジェクトが生命科学における量子計算応用の推進に貢献

「MATLAB は、量子計算アルゴリズムの開発においてシームレスで信頼性の高い環境を提供します。 MATLAB の量子計算パッケージは、使いやすさ、安定性、移植性の点で大きなメリットがあり、それによって我々の研究は大きく前進しました。」

主な成果

  • MATLAB の量子計算サポートパッケージにより、アルゴリズムをローカル環境で簡単にテストでき、迅速な開発や手法の検証が可能に
  • MATLAB が、使いやすさ、安定性、移植性の点で Qiskit® など他の量子計算開発ソフトに優る大きなメリットをもたらす
  • 理解しやすく体系化された MATLAB の量子計算サポートパッケージで、迅速に量子アルゴリズムを実装
胚性幹細胞から内皮細胞への細胞分化の軌跡、LASSOを用いて得られた標準化遺伝子発現の変化を擬時間に沿って示した折れ線グラフ、QUBOを用いて遺伝子発現の傾向の違いを強調したグラフを示す 3 つのプロット。

パネル C では、緑の線が LASSO 法と QUBO 法の両方で特定された 18 個の遺伝子が強調されており、強調されていない線は QUBO 法のみで特定された遺伝子を表しています。

テキサス A&M 大学の獣医学部と生物医科学部では、James Cai 教授の指揮の下、量子計算を用いて単細胞の遺伝子発現データを解析する学際的なプロジェクトが進められています。 同教授のチームは、ゲート型量子計算を用いて、遺伝子が相互に調整し合う仕組みを示すネットワークの構築に取り組んでいます。 チームでは、細胞の変化や分化に関わる重要な遺伝子を scRNA-seq データから選び出すために、二次無制約二値最適化 (QUBO) を用いたシミュレーテッド量子アニーリング (QA) という手法を採用しています。

MATLAB® のタブーサーチ実装は、QUBO 問題を解くシミュレーテッド アニーリングに使用されています。 たとえば、QUBO ベースの特徴選択アルゴリズムでは、最初に 5,000 個の中から選ばれた 50 個の特徴量のうち、非線形と思われる 10 件の遺伝子間相互作用が特定されました。 この 50 個の特徴量のうち、比較のために用いた LASSO 選択法で特定された特徴量と重複していたのはわずか 18 個でした。 これにより、QUBO-QA 手法を活用すると、主要な線形遺伝子発現だけでなく複雑な非線形遺伝子発現のパターンも捉えられることが明らかになりました。

Statistics and Machine Learning Toolbox™ はプロジェクト全体で広く使用されており、特にデータ処理ワークフローで重要な役割を果たしています。 Cai 教授は、MATLAB 環境での scRNA-seq データの解析を容易にするために scGEAToolbox を開発しました。 これには、データ正規化、特徴選択、細胞クラスタリング、細胞タイプの注釈、疑時間解析、遺伝子ネットワーク構築、仮想遺伝子ノックアウト解析、細胞間コミュニケーション解析などの包括的な機能が備わっています。 可視化や解析補助のために、Curve Fitting Toolbox™、Parallel Computing Toolbox™、Image Processing Toolbox™ も利用されています。

このプロジェクトは、量子計算がいかに生命科学に応用できるかを示す画期的な事例です。 MATLAB の活用により、共同研究チームはこの最初の研究成果を再現し、さらに発展させることで、トランスクリプトミクス研究を中心に量子計算応用を推進していくことができます。 それにより、今後、個人の遺伝子情報に基づく個別化診断や治療に向けた量子計算の活用方法が大きく変わるかもしれません。