MetalRT è appena diventato il primo motore di inferenza AI completo per Apple Silicon: LLM + STT + TTS di @RunAnywhereAI. Avevamo già il decodificatore LLM più veloce (658 tok/s). Ora abbiamo superato anche STT e TTS, battendo MLX su tutta la linea. I numeri di oggi su M4 Max: - Podcast di 1 ora trascritto in ~5 secondi - Riunione di 3 ore trascritta in ~15 secondi - Sottotitolazione dal vivo con zero ritardo percepibile - 714x più veloce del tempo reale per STT - 4.6x più veloce dell'MLX di Apple per il riconoscimento vocale Tutte e tre le modalità. Un motore unificato. E questo è solo i singoli componenti. L'intero pipeline AI vocale che stiamo costruendo sopra sarà il PIÙ VELOCE mai su Apple Silicon. Lancio imminente. Benchmark completi, grafici e dettagli nei commenti. #AppleSilicon #OnDeviceAI #MetalRT #STT #TTS #VoiceAI