🚨 A Alibaba acaba de abrir o código de um agente GUI que vive dentro da sua página web e a controla com linguagem natural. Chama-se Page Agent e não é uma extensão de navegador. É puro JavaScript, sem Python, sem Puppeteer, sem navegador headless, sem capturas de ecrã. Basta uma tag de script e a sua aplicação web entende linguagem natural. Aqui está o que realmente faz: → Incorpore-o com uma única tag <script> ou npm install → Controle qualquer interface web com comandos em inglês simples → Manipulação de DOM baseada em texto, sem OCR, sem modelos de visão necessários → Traga o seu próprio LLM (GPT, Claude, Qwen, qualquer um) → Inclui uma UI integrada com suporte humano no loop → Transforme fluxos de trabalho de ERP/CRM de 20 cliques em uma frase → Extensão opcional do Chrome para tarefas de agente em múltiplas abas → Funciona em qualquer aplicação web SaaS, painéis de administração, ferramentas internas As empresas estão a cobrar $30/mês por copilotos de IA baseados nesta ideia exata. Isto são 3 linhas de código. Os seus utilizadores. A sua interface. A camada de copiloto de IA para cada aplicação web acaba de ser aberta ao público. 1.6K estrelas. 100% Código Aberto. (Link nos comentários)