🚨 O Alibaba acabou de abrir o código de um agente de interface gráfica que fica dentro da sua página e controla com linguagem natural. Chama-se Page Agent e não é uma extensão de navegador. É JavaScript puro, sem Python, sem Puppeteer, sem navegador headless, sem capturas de tela. Basta uma tag script e seu aplicativo web entende linguagem natural. Veja o que ele realmente faz: → Incorpore com uma <script> única tag ou instalação npm → Controle qualquer interface web com comandos em inglês simples → Manipulação de DOM baseada em texto, sem OCR, sem necessidade de modelos de visão → Traga seu próprio LLM (GPT, Claude, Qwen, qualquer coisa) → Inclui uma interface integrada com suporte para humanos no loop → Transforme fluxos de trabalho ERP/CRM de 20 cliques em uma frase única → Extensão opcional do Chrome para tarefas de agentes com múltiplas abas → Funciona em qualquer aplicativo web SaaS, painéis administrativos, ferramentas internas As empresas estão cobrando $30 por mês por copilots de IA construídos exatamente com essa ideia. São 3 linhas de código. Seus usuários. Sua interface. A camada de copiloto de IA para cada aplicativo web acabou de ser aberta de código. 1,6 mil estrelas. 100% código aberto. (Link nos comentários)