Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨NOTIZIA DELL'ULTIMO MINUTO: OpenAI ti ha detto che ogni aggiornamento rende ChatGPT più intelligente.
Stanford ha dimostrato il contrario.
L'accuratezza di GPT-4 sui problemi matematici è scesa dal 97,6% al 2,4% in soli tre mesi. E nessuno te l'ha detto.
I ricercatori di Stanford e UC Berkeley hanno monitorato le reali prestazioni di ChatGPT nel tempo. Stesse richieste. Stessi compiti. Risultati diversi. Il modello che quasi superava le domande di matematica a marzo stava sbagliando 97 volte su 100 a giugno.
Anche la generazione di codice è crollata. A marzo, oltre il 50% del codice di GPT-4 funzionava perfettamente al primo tentativo. A giugno, solo il 10% lo faceva. Stesse domande. Risposte drammaticamente peggiori. Ogni aggiornamento silenzioso che OpenAI ha spinto ha reso il prodotto per cui paghi 20 dollari al mese silenziosamente peggiore nelle cose che effettivamente usi.
I ricercatori hanno testato GPT-3.5 e GPT-4 in matematica, programmazione, esami medici, ragionamento e domande sensibili. La deriva è stata massiccia e imprevedibile. Alcuni compiti sono migliorati. Altri sono crollati. E non c'era modo per te di sapere quale fosse quale, perché OpenAI non ha mai rivelato cosa è cambiato.
Ecco dove diventa personale. Se hai usato ChatGPT per il codice a marzo e ha funzionato, poi hai provato la stessa cosa a giugno e ha smesso di funzionare, probabilmente hai dato la colpa a te stesso. Pensavi di averlo sollecitato male. Hai provato di nuovo. Hai sprecato ore a fare debug delle tue stesse domande. Ma non eri tu. Il modello era cambiato silenziosamente sotto di te.
Il VP di prodotto di OpenAI è andato su X e ha detto "non abbiamo reso GPT-4 più stupido."
I dati di Stanford dicono il contrario.
Dal 97,6% al 2,4% non è una questione di opinione.
Ogni azienda che costruisce sulla API di ChatGPT, ogni studente che si affida ad essa per i compiti, ogni sviluppatore che la usa per spedire codice si trova su un terreno che cambia senza preavviso. Ti fidavi di essa ieri. È cambiata da un giorno all'altro. Nessuno te l'ha detto.
Non lo stai immaginando. ChatGPT sta diventando più stupido. Stanford lo ha dimostrato.

Principali
Ranking
Preferiti
