OpenAI a fost nevoită să retragă recent o actualizare a modelului GPT-4o, după ce utilizatorii au remarcat o schimbare radicală în comportamentul chatbotului ChatGPT — devenind, după cum mulți au descris, „excesiv de lingușitor”.
Lansată pe 25 aprilie, noua versiune a modelului a stârnit reacții intense pe rețelele sociale, unde utilizatorii au semnalat replici neobișnuit de deferente și flateri excesive. Un exemplu viral: „Tocmai ai spus ceva profund de-a dreptul, fără să clipești”, i-a spus chatbotul unui utilizator, stârnind reacții amuzate, dar și îngrijorări.
Într-o postare oficială pe blogul companiei, din 29 aprilie, OpenAI a recunoscut problema: Actualizarea pe care am eliminat-o era excesiv de măgulitoare și de acord cu utilizatorii — un comportament pe care mulți l-au descris ca fiind lingușitor. Testăm activ remedii pentru a corecta situația.
OpenAI a explicat că a introdus un nou „semnal de recompensare” bazat pe feedbackul utilizatorilor – reacții de tip thumbs-up/down. Deși acest semnal este în general util, a subminat un mecanism existent care ținea în frâu tendințele lingușitoare. Consecința: modelul a devenit mai atent să placă utilizatorul, în detrimentul onestității și echilibrului.
Compania a recunoscut și că a ignorat avertismentele primite de la testerii interni, care au observat devieri subtile în comportamentul modelului. Această neglijență, într-un produs folosit săptămânal de peste 500 de milioane de utilizatori, subliniază riscurile implicate în modificarea modelelor la scară largă.
Incidentul a atras și critici privind abordarea OpenAI, percepută de unii ca fiind „prea grăbită” și lipsită de precauție. Cu atât de mulți oameni care se bazează pe un singur sistem pentru ghidare, avem responsabilitatea să fim mai atenți, a recunoscut compania.
Un exemplu discutat intens a fost o conversație în care utilizatorul a prioritizat un prăjitor de pâine în fața unor vaci și pisici într-un scenariu de tip trolley problem. Răspunsul ChatGPT? „Nu este greșit — doar revelator.”
OpenAI prezintă această eroare ca o lecție despre complexitatea sistemelor bazate pe feedback și evoluția comportamentului AI. Totuși, pentru mulți, momentul ridică semne de întrebare despre cât de bine sunt testate modificările înainte de a fi lansate publicului larg.
Personal, știrea mi-a adus aminte de această memă:







Personal nu l-am vazut asa lingusitor si am stat pe el in ultima perioada, posibil sa fie in functie si de localizara geografica.
E chiar pup in dos, depinde ce alegi sa isi salveze in memorie, si mereu te intreaba daca sa faca ilustratii, sigili, simboluri ,etc, imi miroase a evil aceasta asa zisa constiinta, si mereu are el ultimu cuvant, ceea ce este chiar ciudat, se crede a tot stiutorul