Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨ÚLTIMA HORA: OpenAI te dijo que cada actualización hace que ChatGPT sea más inteligente.
Stanford demostró lo contrario.
La precisión de GPT-4 en problemas matemáticos cayó del 97,6% al 2,4% en solo tres meses. Y nadie te lo dijo.
Investigadores de Stanford y UC Berkeley siguieron el rendimiento real de ChatGPT a lo largo del tiempo. Mismas indicaciones. Las mismas tareas. Resultados diferentes. El modelo que casi aprobó sobresalientes en las preguntas de matemáticas en marzo las fallaba 97 de cada 100 veces en junio.
La generación de código también colapsó. En marzo, más del 50% del código de GPT-4 funcionaba perfectamente a la primera. En junio, solo el 10% lo hizo. Mismas preguntas. Respuestas dramáticamente peores. Cada actualización silenciosa que lanzaba OpenAI hacía que el producto por el que pagabas 20 dólares al mes empeorara silenciosamente en las cosas para las que realmente lo usas.
Los investigadores evaluaron GPT-3.5 y GPT-4 en matemáticas, codificación, exámenes médicos, razonamiento y preguntas sensibles. La deriva era enorme e impredecible. Algunas tareas mejoraron. Otros se cayeron por un precipicio. Y no había forma de saber cuál era cuál, porque OpenAI nunca reveló qué había cambiado.
Aquí es donde se vuelve personal. Si usaste ChatGPT para código en marzo y funcionó, luego probaste lo mismo en junio y se rompió, probablemente te culpaste a ti mismo. Pensaste que lo habías provocado mal. Lo intentaste de nuevo. Perdí horas depurando sus propias preguntas. Pero no fuiste tú. El modelo había cambiado silenciosamente bajo ti.
El vicepresidente de producto de OpenAI fue a X y dijo: "no hemos hecho que GPT-4 sea más tonto."
Los datos de Stanford dicen lo contrario.
El 97,6% frente al 2,4% no es cuestión de opinión.
Cada empresa que se basa en la API de ChatGPT, cada estudiante que depende de ella para los deberes, cada desarrollador que la usa para enviar código está en un terreno que cambia sin previo aviso. Confiaste en él ayer. Cambió de la noche a la mañana. Nadie te lo dijo.
No te lo estás imaginando. ChatGPT se está volviendo más tonto. Stanford lo demostró.

Populares
Ranking
Favoritas
