このページは機械翻訳を使用して翻訳されました。
翻訳品質のアンケートに 1 分ご協力ください。
信頼できるロボットが新しい空間をナビゲート
新しいアルゴリズムがロボット知覚のロバスト性を向上
マサチューセッツ工科大学 (MIT) の研究員であるVasileios Tzoumas 氏は、新しい街を訪れるときにランニングをしながら散策を楽しんでいますが、時々、道に迷うことがあります。数年前、会議で大阪に滞在中に長距離をランニングしているときにも、それが当然のごとく起こりました。しかし、その後、Tzoumas 氏はホテルを出たところにあるセブンイレブンの前を通り過ぎたことを思い出しました。この認識のおかげで、彼は頭の中で「ループを閉じる」ことができ、自分が通った軌跡の途切れた部分を確実に知っている場所と結びつけることができました。こうして自分の頭の中の地図を完成させ、ホテルに戻ることができたのです。
GNC (graduated non-convexity) アルゴリズムによって、機械が陸、海、川、空、そして宇宙を越えて、その体験を伝えるために戻ってこれるようになるでしょう。
ループを閉じるというのは、実際のところ専門用語で、ロボットが新しい環境を進むときに頻繁に実行しなければならない処理のことです。これは、SLAM (Simultaneous Localization And Mapping) というプロセスの一部です。SLAM自体 は目新しいものではありません。ロボット掃除機、自動運転車、捜索救助用空中ドローンのほかに、工場、倉庫、鉱山用のロボットなどに使用されます。自律型デバイスや車両は、リビングルームから上空に至る未知の空間を進むため、移動しながら地図を構築します。また、カメラ、GPS、LIDAR などのセンサーを使用して、地図上の自分の位置を把握しなければなりません。
SLAM の用途が広がるにつれて、困難な現実世界の状況において SLAM アルゴリズムが正しい結果を生成することを保証することがこれまで以上に重要になります。SLAM アルゴリズムは、完璧なセンサーが搭載されている場合や制御された実験室環境ではうまく機能することが多いのですが、現実世界で不完全なセンサーを使用して実行すると、すぐに方向を見失ってしまいます。当然のことながら、産業界の顧客は、これらのアルゴリズムを信頼できるかどうかを頻繁に心配しています。
MIT の研究者たちは、いくつかの堅牢な SLAM アルゴリズムと、それらをどれだけ信頼できるかを数学的に証明する方法を開発しました。MIT でレオナルド・キャリア開発を担当する Luca Carlone 助教授の研究室は、SLAM 結果の確率的誤差と不確実性を低減する GNC (graduated non-convexity) アルゴリズムに関する 論文を発表しました。さらに重要なのは、既存の方法では「方向を見失って」しまうところで、このアルゴリズムは正しい結果を生成できる点です。Carlone 氏、Tzoumas 氏、そして Carlone 氏の学生である Heng Yang 氏と Pasquale Antonante 氏によるこの論文は、ロボット工学とオートメーションに関する国際会議 (ICRA) のロボットビジョン部門で最優秀論文賞を受賞した。この GNC アルゴリズムによって、機械が陸、海、川、空、そして宇宙を越えて、その体験を伝えるために戻ってこれるようになるでしょう。
すべてが整った状態
ロボットの知覚はセンサーに依存していますが、ノイズが多かったり、誤解を招くような情報を提供したりすることが多々あります。MIT の GNC アルゴリズムにより、ロボットはどのデータ ポイントを信頼し、どのデータ ポイントを破棄するかを判断できるようになります。GNC アルゴリズムの応用の 1 つには、形状の配置と呼ばれるものがあります。ロボットは 2D カメラ画像を使用して車の 3D 位置と方向を推定します。ロボットは、ヘッドライト、ホイール、ミラーなど、特徴検出アルゴリズムによってラベル付けされた多数のポイントを含むカメラ画像を受け取ります。メモリ内には車の3Dモデルも保存されています。目標は、3D モデルを拡大縮小、回転、配置して、その特徴が画像の特徴と一致するようにすることです。「特徴検出アルゴリズムが完璧に機能していれば簡単なことですが、そうなることはめったにありません」と Carlone 氏は言います。実際のアプリケーションでは、ロボットは多くの外れ値 (誤ってラベル付けされた特徴) に直面し、それが全観測値の 90% 以上を占めることがあります。ここで GNC アルゴリズムが登場し、すべての競合を上回るパフォーマンスを発揮します。
ロボットは、それぞれの特徴のペア間の距離を考慮した数学関数を用いて、この問題を解決します。たとえば、画像内の右側のヘッドライトとモデル内の右側のヘッドライトなどです。ロボットはこの関数を「最適化」しようとします。つまり、モデルを回転させて、これらの距離を最短にするように調整するわけです。特徴が多ければ多いほど、問題は複雑になります。
問題を解決する 1 つの方法は、関数のすべての可能な解を試してみて、どれが最もうまく機能するかを確認することですが、試すには数が多すぎます。Yang 氏と Antonante 氏は、より一般的な方法は「1 つの解決策を試して、モデルのヘッドライトを 2D 画像のヘッドライトにさらに合わせるなど、改善できなくなるまで微調整を続ける」ことだと説明しています。ノイズの多いデータでは、完璧ではありません。ヘッドライトは揃っていても、車輪は揃っていない可能性があります。そのため、別のソリューションからやり直し、それを可能な限り改良し、プロセスを数回繰り返して最良の結果を得ることができます。それでも、最善の解決策が見つかる可能性は低いです。
実際のアプリケーションでは、ロボットは多くの外れ値に直面し、それが全観測値の 90% 以上を占めることがあります。ここで GNC アルゴリズムが登場し、すべての競合を上回るパフォーマンスを発揮します。
![対応関係を示すメッシュと点群 (外れ値70%)](https://jp.mathworks.com/company/mathworks-stories/slam-mapping-algorithm-for-autonomous-vehicles/_jcr_content/mainParsys2/columns_1912233028_c/02542e5d-1b7b-48e6-aacb-5a47c2a43a5c/columns_963905119_co_1292323328/d2de9858-1875-47d0-b599-1cdb27f41cfa/image.adapt.full.medium.jpg/1732634026046.jpg)
![GNC-TLS による登録の成功例](https://jp.mathworks.com/company/mathworks-stories/slam-mapping-algorithm-for-autonomous-vehicles/_jcr_content/mainParsys2/columns_1912233028_c/02542e5d-1b7b-48e6-aacb-5a47c2a43a5c/columns_963905119_co_1292323328/7c1f0c4e-6d05-4d46-96bd-6ad2f58f3859/image.adapt.full.medium.jpg/1732634026063.jpg)
![一般的な SLAM アルゴリズムによる誤った登録](https://jp.mathworks.com/company/mathworks-stories/slam-mapping-algorithm-for-autonomous-vehicles/_jcr_content/mainParsys2/columns_1912233028_c/02542e5d-1b7b-48e6-aacb-5a47c2a43a5c/columns_963905119_co_1292323328/c8508251-9dda-4898-bf53-9265407696f8/image.adapt.full.medium.jpg/1732634026074.jpg)
GNC アルゴリズムは、最大 70~90% の外れ値を含むノイズの多い測定値にもかかわらず、最適なアライメントを見つけます。画像著作権: MIT
GNC の背後にある考え方は、まず問題を単純化することです。最適化しようとしている関数 (3D モデルと 2D 画像の違いを記述する関数) を、単一の最適なソリューションを持つ関数に削減します。解決策を選択してそれを微調整すると、最終的には最適な解決策が見つかるでしょう。次に、元の関数の複雑さを少し再導入し、見つけたソリューションを改良します。元の機能とその最適な解決策が得られるまで、これを続けます。ヘッドライトの位置は適切で、ホイールとバンパーも同様です。
同じ場所を巡る
この論文では、GNC アルゴリズムを形状の整合や SLAM などの問題に適用しています。SLAM の場合、ロボットはセンサーデータを用いて過去の軌跡を把握し、地図を作成します。例えば、大学キャンパスを移動するロボットは、午前8時から8時15分、8時15分から8時30分、などの時間帯ごとに、どれだけの距離を進み、どの方向に向かったかを示す計測データ (オドメトリーデータ) を収集します。また、ロボットは午前8時、午前8時15分などの時点で、LIDAR やカメラデータも取得しています。必要に応じて、ロボットはループを完了し、異なる時間帯に同じものを再び視認することがあります。これは、Tzoumas 氏が再びセブンイレブンを通り過ぎたときと同じです。
研究者らは、GNC アルゴリズムが最先端の技術よりも正確であり、より高い割合の外れ値を処理できることを発見しました。
形状の配置と同様に、解決すべき最適化の問題があります。この論文の筆頭著者である Yang 氏は次のように説明します。「SLAM の場合、3D モデルに合わせて特徴を並べるのではなく、地図上のオブジェクトと一致させるために、システムが記憶している移動軌跡をカーブさせます。」まず、すべてのセンサーは測定に誤差を持つ可能性が高いため、システムは異なるセンサーによって認識された移動間の誤差を最小限に抑えるように機能します。たとえば、ロボットの走行距離計が午前 8 時から午前 8 時 15 分の間に 100 メートル移動したことを示している場合、LIDAR やカメラの測定に基づいて更新された軌跡は、その距離またはそれに近い距離を反映するはずです。このシステムは、同じ場所のように見える場所間の距離も最小限に抑えます。ロボットが午前 8 時と午前 10 時に同じセブンイレブンを見た場合、アルゴリズムは各区間を調整しながら記憶された軌跡をカーブさせ、午前 8 時と午前 10 時の位置が一致するようにループを閉じようとします。
建物の内部をマッピングするロボット。GNC が乱雑なデータを段階的に解明していきます。比較的少ないステップで、アルゴリズムは建物の内部の正確な地図を作成します。画像著作権: MIT
一方、アルゴリズムは、外れ値 (元の手順をたどっていると思っていたが実際にはそうではなかった不良データ ポイント) を、形状の配置で誤ってラベル付けされた特徴と同様に識別して破棄します。ループは誤って閉じられることはありません。Tzoumas 氏は、メイン州の森の中を走っていたとき、見覚えのある倒れた木の幹の集まりを通り過ぎたときのことを思い出します。彼はループを閉じたと考え、この想定されるランドマークを使用して方向転換しました。20分間何も見慣れたものが見当たらなかったので、彼は自分の間違いを疑い、引き返した。
最適化前の記憶された軌跡は、絡まった糸の玉のように見えるかもしれません。解いてみると、ロボットが通ったキャンパスの通路や廊下の形状を反映した直角の線の集まりのように見えます。この SLAM プロセスは、専門的には姿勢グラフの最適化と呼ばれます。
論文では、研究者らは、形状の配置や姿勢グラフの最適化など、いくつかのアプリケーションで GNC アルゴリズムを他のアルゴリズムと比較しました。彼らは、自分たちの方法が最先端の技術よりも正確で、より高い割合の外れ値を処理できることを発見した。SLAM の場合、ループの 4 つのうち 3 つのとじ込みが間違っていたとしても機能しました。これは、実際のアプリケーションで遭遇するよりもはるかに多くの外れ値です。さらに、彼らの方法は他のアルゴリズムよりも効率的であることが多く、必要な計算ステップが少なくなります。Tzoumas 氏は、「困難の 1 つは、多くのアプリケーションで適切に機能する汎用アルゴリズムを見つけることでした」と述べています。Yang 氏は10種類以上を試したと言います。最終的に、彼らは「スイートスポット」を見つけたと Tzoumas 氏は語っています。
研究から生産への移行は、研究成果が社会に大きな変革をもたらす重要なステップになると、 MathWorks でロボティクス研究を担当する Roberto G. Valenti は言います。MathWorks は Carlone 氏の研究室と協力し、企業が商用および産業用の自律システムに SLAM を実装するために使用する Navigation Toolbox™ の一部として、GNC アルゴリズムを MATLAB に統合しています。
困難を脱して
Carlone 氏の研究室では、GNC アルゴリズムの機能を拡張する方法に取り組んでいます。たとえば、Yang 氏は正しいと認定できる認識アルゴリズムを設計することを目指しています。そして、Antonante 氏は、さまざまなアルゴリズム間の不一致を管理する方法を見つけています。自律型車両の SLAM モジュールが直線道路であると判定しているにも関わらず、車線検出モジュールが右に曲がると判定した場合に問題が発生します。
GNC アルゴリズムは、ロボットが自らのミスを検出できるようにする新しいベンチマークです。
Tzoumas 氏は、1 台のロボット内の複数のアルゴリズム間の相互作用だけでなく、複数のロボット間のコラボレーションまで拡張する方法を検討しています。以前の研究で、彼は徒歩や車で逃走しようとする犯罪者などのターゲットを追跡する飛行ドローンをプログラムしました。将来的には、複数のマシンが GNC アルゴリズムを共同で実行できるようになるかもしれません。それぞれが近隣の機械に部分的な情報を提供し、それらをまとめて地球上または他の場所の位置を示す全体図を作成します。今年、彼はミシガン大学の航空宇宙工学部に移り、戦場や他の惑星などの困難な環境でも、複数のロボットによる計画と自航を可能にする信頼性の高い自律性の研究に取り組む予定です。
「AIや認識アルゴリズムがどのように動作するか分からないことが、それらを使用する上での大きな障害となっている」と Antonante 氏は言う。彼は、ロボットによる美術館ガイドが来場者やモナ・リザに衝突する可能性があるなら、信頼されないだろうと指摘しています。「システムが環境とシステム自体の両方を深く理解し、間違いにづけるようにする必要があります。」GNC アルゴリズムは、ロボットが自らのミスに気づくことを可能にする新しいベンチマークであり、最も重要なのは、Tzoumas 氏が言うように、「困難な状況から抜け出すのに役立つ」ことです。