忘れられない 8 年間を過ごした後、私は Google DeepMind を辞めることにしました。汎用ロボット学習の夢を異端的な非主流のアイデアから正規化されたテクノロジーロードマップに変える機会を得られたことに、非常に感謝しています。私が望んでいた最も聡明で、最も親切で、最も才能のある同僚と一緒に、私たちの時代の最も困難で重要な問題に取り組むことは、一生の名誉でした。 2017 年に Google Brain の寄せ集めのチームが現実世界のアーム ファームでのエンドツーエンドの学習の可能性を探求し始めたとき、私にチャンスを与えてくれた Julian と Vincent に感謝します。コーリーとピエールとの私の「スタータープロジェクト」は、あらゆる初期条件(潜在埋め込み)からあらゆる目標状態に移行できる目標条件の模倣ポリシーに取り組むことでした。その3ヶ月のプロジェクトが2年間の努力に変わりました!しかし、研究の野心は高かったにもかかわらず、同僚やメンターは常に地に足が着いていて、デフォルトで思いやりがあります。Alex H、Karol、Julian、Sergey は、RL を大規模に同時制御するという私のビジョンをサポートしながら、私が自分の条件で創造的な研究者に成長できるスペースを与えてくれました。 チームの技術的進歩と私自身の研究の趣味は、2020年にカニシュカとカロルがチーム全体にインスピレーションを与え、1つのクレイジーなムーンショット、つまり何千もの家庭操作タスクを達成できる一般的なロボット政策に大きく賭けるよう促したとき、大幅に加速し始めました。このような前例のないグループでの取り組みは、チーム全体にとって初めてのことでしたが、厳密な科学的調査(模倣学習と強化学習のスケーリング特性の客観的な比較)と並行して、0対1の現実世界のシステムのスケーリング(ロボットフリート、テレオペレーター、スケーリングされた学習スタック)を調和してナビゲートする方法を学ぶことができ、非常に満足のいくものでした。この間、私はすべての戦友から多くのことを学び、今日に至るまで、私の研究と工学の直感の多くは、エリック、ヤオ、アレックス 1 世、キールタナ、エフゲンから学んだ教訓から得ています。 2022年から始まる次の期間は、私が貢献し、主導する機会に恵まれた想像力豊かな探求の幅広さと深さにおいて、まったく魔法のようでユニークなものでした。ロボット工学の基盤モデルの可能性を探求することで、私の研究見通しは永久に変わり、SayCan、RT-1、RT-2 などのプロジェクトは、一般的で高性能な具現化された AI の可能性がどのようなものになるかについて世界がより真剣に考え始めた最初の魔法のようにバイラルな瞬間のように感じられました。最初のジェネラリストVLAが、私たちがデータを収集しなかったタスクを確実に実行し始めたとき、それは私たちのチームと現場にとって大きなひらめきの瞬間でした。この間、私は高い主体性、マニアックな創造性、そして驚異的な反復速度が研究にどのような効果をもたらすかに大きなインスピレーションを受け、フェイ、ブライアン、アンディ、ピート、クアン、ハリス、ダニーなどの非常に親切で生産的な同僚から学びました。私は、より良いアクション表現の作成、ロボットの一般化の理解、データ品質と拡張のためのVLMの活用など、私が関心のある分野にこの非常に創造的な研究のアプローチを適用しました。チェルシー、ドーサ、ジョナサン、ウェンハオ、ティアンリ、モンセ、ショーン、オースティン、ケリー、ポールなど、これらの冒険的な探検に参加してくれたチームメイトに感謝しています。また、複数の機関によるクロスボディメント学習からオープンソースのVLA、スケーラブルなオフライン評価、ワークショップの開催に至るまで、この間のすべての学術協力に深く感謝しています。学生、インターン、友人の皆さん、ありがとうございました。特に、ソロウシュ、ジアユアン、ローラ、シュアンリン、カイル、カール、オイアー、ドゥルブ、アニー、ジェンセン、プリヤ、スニール、アイク、ホマンガ、ハオ、シュエス。 2024 年から始まる GDM でのキャリアの最終章で、私はフロンティア モデルの科学と影響、そしてそれらをロボット工学で適切に活用する方法に魅了されました。ロボット学習は、トレーニング前、トレーニング中、トレーニング後でフロンティアモデルがどのように開発されるかという洗練されたスケーリングシステムや科学ではなく、単純な分布を小さなモデルに当てはめるだけの「古典的な」機械学習のように見えることが多いことに、常に根本的に悩まされていました。その世界について学び、AGIに物理的な世界を理解させる方法を見つけたかったのです。私は私たちが成し遂げた進歩を誇りに思っており、Gemini 1.0 から今日に至るまで、私たちが解き放った研究イノベーションにより、Gemini と Gemini Robotics の両方が、基本的な世界理解と一般的な VLA 制御の両方の最前線に明確に位置づけられています。毎日を明るく、面白く、楽しいものにしてくれているEmbodied Reasoningのチームメイト、フェイ、ジャッキー、ローラ、ウェンタオ、アニー、ルイス、クセニア、モヒット、ショーン、ダニーに本当に感謝します。フロンティアモデルの方法を教えてくれたGemini Multimodalの友人、Xi、Karel、Ishita、Xudongに感謝します。革新と忍耐力があなたをどこまで連れて行ってくれるかを教えてくれたVLAのささやき者、コリーヌ、ジュリア、クラウディオ、アレックス・L、スミート、アシュウィン、スディープ、デビ、アイザーンに感謝します。カロライナ、ジエ、カニシュカ、ニコラス、ジョナサン、ピエール、ヴィンセント、カロル、セルゲイ、チェルシー、ジュリアンなど、ベロライズとインパクト、そして思いやりはゼロサムではないという輝かしい模範を示してくれた長年のメンターに感謝します。 ありがとう、ありがとう、ありがとう。それはとても信じられない冒険であり、私は、一般的で役立つ具現化された AGI が社会のいたるところにある世界に世界を変革する技術のブレークスルーを開始したクレイジーなチームの一員になれたことをとても幸運に思います。私はいつまでも #1 GDM ファンです!私自身の旅に関しては、馴染みのあるものとまったく異なる新しい冒険に乗り出す予定であり、近いうちにもっと共有できることを願っています。