🚨UUTINEN: OpenAI kertoi, että jokainen päivitys tekee ChatGPT:stä älykkäämmän. Stanford osoittautui päinvastaiseksi. GPT-4:n tarkkuus matemaattisissa tehtävissä laski 97,6 %:sta 2,4 %:iin vain kolmessa kuukaudessa. Eikä kukaan kertonut sinulle. Stanfordin ja UC Berkeleyn tutkijat seurasivat ChatGPT:n todellista suorituskykyä ajan myötä. Samat kehotteet. Samat tehtävät. Eri tulokset. Malli, joka melkein pärjäsi matematiikan kysymyksissä maaliskuussa, sai ne väärin 97 kertaa sadasta kesäkuuhun mennessä. Koodin generointi romahti myös. Maaliskuussa yli 50 % GPT-4:n koodista toimi täydellisesti ensimmäisellä yrittämällä. Kesäkuuhun mennessä vain 10 % teki niin. Samat kysymykset. Dramaattisesti huonommat vastaukset. Jokainen OpenAI:n hiljainen päivitys teki tuotteesta, josta maksat $20 kuukaudessa, hiljaisesti huonomman niissä asioissa, joihin sitä oikeasti käytät. Tutkijat testasivat GPT-3.5:ttä ja GPT-4:ää matematiikassa, koodauksessa, lääkärintutkimuksissa, päättelyssä ja arkaluontoisissa kysymyksissä. Drift oli valtava ja arvaamaton. Jotkut tehtävät paranivat. Toiset putosivat kalliolta. Eikä ollut mitään keinoa tietää, kumpi oli kumpi, koska OpenAI ei koskaan paljastanut, mikä muuttui. Tässä kohtaa asia menee henkilökohtaiseksi. Jos käytit ChatGPT:tä koodiin maaliskuussa ja se toimi, sitten kokeilit samaa kesäkuussa ja se meni rikki, syytit todennäköisesti itseäsi. Luulit, että aiheutit sen väärin. Yritit uudelleen. Tuhlasit tunteja omien kysymystesi virheenkorjaamiseen. Mutta se et ollut sinä. Malli oli hiljaa muuttunut allasi. OpenAI:n tuotejohtaja sanoi X:ssä "emme ole tehneet GPT-4:stä tyhmempiä." Stanfordin tiedot kertovat toista. 97,6 % vastaan 2,4 % ei ole mielipidekysymys. Jokainen yritys, joka rakentaa ChatGPT:n API:n päälle, jokainen opiskelija, joka luottaa siihen koulutehtävissään, jokainen kehittäjä, joka käyttää sitä koodin lähettämiseen, seisoo maassa, joka muuttuu varoittamatta. Luotit siihen eilen. Se muuttui yhdessä yössä. Kukaan ei kertonut sinulle. Et kuvittele sitä. ChatGPT muuttuu yhä tyhmemmäksi. Stanford todisti sen.