É por isso que precisamos de benchmarks abertos para IA local. Caso contrário, vira tribalismo e xingamentos. Vamos publicar o maior banco de dados de benchmarks abertos para IA local, testado em 1.000+ configurações reais de hardware. Cada dispositivo, cada interconexão, diferentes modelos/quantizações. Temos um escritório cheio de hardware: todos os Macs com chip M, todos os iPhones, todos os RTX, DGX Spark, Strix Halo, Pi, ... Em geral, o Apple Silicon possui economia superior das unidades de memória e as GPUs possuem economia superior nas unidades de computação. O que é melhor depende da carga de trabalho e da concorrência. A verdade (que ficará evidente nos benchmarks abertos) é que o melhor é uma combinação dos dois - coloque suas coisas que consomem muita memória nos Macs, as coisas limitadas à computação nas GPUs.