OpenAI щойно відмовився від GPT-5.4, і ми тестували його в Cline весь тиждень. Ми помітили стрибок у використанні комп'ютера та загальних знань, і бенчмарки це підтверджують:
OSWorld (оцінка використання комп'ютера) знизилася з 47,3% → 75,0%, перевищивши людську продуктивність — 72,4%! 🧵