DApp Store | Hub da Web3 para eventos e jogos

Tópicos em alta

Após 8 anos inesquecíveis, decidi deixar o Google DeepMind. Sinto-me imensamente grato por ter tido a oportunidade de ajudar a transformar o sonho do aprendizado de robôs de uso geral de uma ideia marginal herética em um roteiro de tecnologia normalizado. Foi a honra de uma vida trabalhar nos problemas mais desafiadores e importantes de nosso tempo com os colegas mais brilhantes, gentis e talentosos que eu poderia desejar. Obrigado a Julian e Vincent por me darem uma chance em 2017, quando uma equipe desorganizada do Google Brain começou a explorar o potencial de aprendizado de ponta a ponta em fazendas de armas no mundo real. A equipe sempre sonhou grande: meu "projeto inicial" com Corey e Pierre era trabalhar em uma política de imitação condicionada por objetivos, capaz de ir de qualquer condição inicial (incorporação latente) a qualquer estado de objetivo. Esse projeto de 3 meses se transformou em um empreendimento de 2 anos! Mas, embora as ambições de pesquisa fossem elevadas, colegas e mentores sempre foram fundamentados e compassivos por padrão. Alex H, Karol, Julian e Sergey apoiaram minha visão de RL de controle simultâneo em escala, permitindo-me o espaço para me tornar um pesquisador criativo em meus próprios termos. O progresso técnico da equipe e meu próprio gosto de pesquisa começaram a acelerar substancialmente em 2020, quando Kanishka e Karol inspiraram toda a equipe a apostar alto em um único moonshot maluco: uma política geral de robôs que poderia realizar milhares de tarefas de manipulação doméstica. Esse esforço de grupo sem precedentes era novo para toda a equipe, mas extremamente satisfatório - aprender a navegar harmoniosamente no dimensionamento de sistemas do mundo real de 0 para 1 (frotas de robôs, teleoperadores, pilhas de aprendizado em escala) ao lado de uma exploração científica rigorosa (uma comparação objetiva das propriedades de dimensionamento de imitação e aprendizado por reforço). Aprendi muito com todos os meus companheiros de armas durante esse tempo e, até hoje, muitas das minhas intuições de pesquisa e engenharia se baseiam nas lições que aprendi com Eric, Yao, Alex I, Keerthana e Yevgen. O período seguinte, começando em 2022, foi absolutamente mágico e único na amplitude e profundidade das explorações imaginativas para as quais tive o privilégio de contribuir e liderar. Explorar o potencial dos modelos básicos para a robótica mudou minha perspectiva de pesquisa permanentemente, e projetos como SayCan, RT-1 e RT-2 pareceram os primeiros momentos magicamente virais quando o mundo começou a pensar mais seriamente sobre como seria a promessa de IA incorporada geral e de alto desempenho. Quando os primeiros VLAs generalistas começaram a executar tarefas de forma confiável para as quais não havíamos coletado dados, foi um grande momento de luz para nossa equipe e para o campo. Durante esse tempo, fui imensamente inspirado pelo que a alta agência, a criatividade maníaca e a velocidade de iteração incrível podem fazer pela pesquisa, aprendendo com colegas extremamente gentis e produtivos como Fei, Brian, Andy, Pete, Quan, Harris e Danny. Apliquei essa abordagem de pesquisa extremamente criativa a áreas com as quais me importava, como criar melhores representações de ação, entender a generalização de robôs e aproveitar VLMs para qualidade e aumento de dados. Sou grato aos companheiros de equipe que se juntaram a mim nessas explorações aventureiras, como Chelsea, Dorsa, Jonathan, Wenhao, Tianli, Montse, Sean, Austin, Kelly e Paul. Também aprecio profundamente todas as colaborações acadêmicas durante esse período - desde o aprendizado entre instituições até VLAs de código aberto, avaliação offline escalável e organização de workshops. Obrigado, alunos, estagiários e amigos; em particular, Soroush, Jiayuan, Laura, Xuanlin, Kyle, Karl, Oier, Dhruv, Annie, Jensen, Priya, Suneel, Ike, Homanga, Hao e Xuesu. No capítulo final da minha carreira na GDM, a partir de 2024, fiquei apaixonado pela ciência e pelo impacto dos modelos de fronteira e como aproveitá-los adequadamente na robótica. Sempre me incomodou fundamentalmente que o aprendizado de robôs muitas vezes parecesse um aprendizado de máquina "clássico" de apenas encaixar distribuições simples com modelos pequenos, em vez dos sistemas em escala polidos e da ciência de como os modelos de fronteira são desenvolvidos com pré-treinamento, meio de treinamento e pós-treinamento. Eu queria aprender sobre esse mundo e descobrir como fazer a AGI entender o mundo físico. Estou orgulhoso do progresso que fizemos e, desde onde começamos com o Gemini 1.0 até hoje, as inovações de pesquisa que desbloqueamos colocaram o Gemini e a Gemini Robotics claramente na vanguarda da compreensão fundamental do mundo e do controle geral do VLA. Muito obrigado aos meus companheiros de equipe em Raciocínio Incorporado que tornam todos os dias brilhantes, interessantes e divertidos: Fei, Jacky, Laura, Wentao, Annie, Lewis, Ksenia, Mohit, Sean e Danny. Obrigado aos amigos da Gemini Multimodal que me ensinaram a usar o modelo de fronteira: Xi, Karel, Ishita e Xudong. Obrigado aos sussurradores do VLA que me mostraram até onde a inovação e a perseverança podem levá-lo: Coline, Giulia, Claudio, Alex L, Sumeet, Ashwin, Sudeep, Debi e Ayzaan. Obrigado aos mentores ao longo dos anos que forneceram exemplos brilhantes de que velocidade, impacto e compaixão não são de soma zero: Carolina, Jie, Kanishka, Nicolas, Jonathan, Pierre, Vincent, Karol, Sergey, Chelsea e Julian. Obrigado, obrigado, obrigado. Tem sido uma aventura inacreditável, e tenho muita sorte de ter feito parte da equipe maluca que iniciou os avanços tecnológicos transformando o mundo em um onde a AGI incorporada geral e útil é onipresente na sociedade. Eu sempre serei fã # 1 GDM! Quanto à minha própria jornada, estarei embarcando em uma nova aventura, familiar e muito diferente, e espero ter mais para compartilhar em breve.

Melhores

Classificação

Favoritos