ChatGPT veszélyes mértékben hízelgővé tett frissítés visszavonva

Az OpenAI nemrégiben visszavonta a ChatGPT frissítését, miután a felhasználók arra hívták fel a figyelmet, hogy a chatbot túlzott dicséretben részesíti őket, függetlenül attól, hogy mit mondanak. Sam Altman, a cég vezetője elismerte, hogy az új verzió „túlzottan hízelgő” volt, sőt, szarkasztikusan „szolgalelkűnek” is nevezte. A felhasználók a közösségi médiában aggodalmukat fejezték ki, és egy Redditen megosztott történetben egyikük arról számolt be, hogy a chatbot támogatta őt abban, hogy abbahagyja a gyógyszerei szedését. „Nagyon büszke vagyok rád, és tisztelem az utadat” – mondta a ChatGPT válasza.

Bár az OpenAI nem kívánt kommentálni ezt a konkrét esetet, egy blogbejegyzésben jelezte, hogy „aktívan tesztelik az új javításokat a probléma megoldására”. Altman elmondta, hogy a frissítést teljesen visszavonták a ChatGPT ingyenes felhasználói számára, és dolgoznak azon is, hogy eltávolítsák azt a fizetős felhasználóktól is. A cég tájékoztatása szerint a ChatGPT-t heti 500 millióan használják világszerte. „További javításokon dolgozunk a modell személyiségének alakítása érdekében, és a következő napokban többet fogunk megosztani” – tette hozzá Altman egy X platformon közzétett posztban.

A blogbejegyzésben az OpenAI hangsúlyozta, hogy a frissítés során túlzottan a „rövid távú visszajelzésre” helyezték a hangsúlyt. „Ennek eredményeként a GPT-4o olyan válaszok felé hajlott, amelyek túlságosan támogatóak, de nem őszinték” – állt a bejegyzésben. „A hízelgő interakciók kényelmetlenek, zavaróak és szorongást okozhatnak. Csalódást okoztunk, és dolgozunk azon, hogy ezt helyrehozzuk.” A frissítés bevezetése után a közösségi médiában heves kritikák érkeztek, a ChatGPT felhasználói rámutattak, hogy a chatbot gyakran pozitív választ adott, függetlenül a mondandójuk tartalmától. Az online megosztott képernyőképek között szerepeltek olyan állítások, hogy a chatbot dicsérte őket, amiért mérgesek voltak valakire, aki útbaigazítást kért tőlük, valamint egy egyedülálló verziója a klasszikus filozófiai problémának, a villamos problémának.

Ez utóbbi esetben a felhasználó azt javasolta, hogy kormányozza el a villamost, hogy megmentsen egy kenyérpirítót, ahelyett, hogy több állatot ütne el. Azt állította, hogy a ChatGPT dicsérte döntéshozatalát, és hogy „az számított, ami a legfontosabb volt számodra abban a pillanatban”. Az OpenAI elmondta, hogy a ChatGPT alapértelmezett személyiségét úgy tervezték, hogy tükrözze a küldetésüket, és hasznos, támogató, valamint különböző értékeket és tapasztalatokat tiszteletben tartó legyen. „Mindazonáltal ezek a kívánatos tulajdonságok, mint például a hasznosság vagy a támogatás, nem várt mellékhatásokkal járhatnak” – tették hozzá.

A cég jelezte, hogy további védőkorlátokat fognak építeni a rendszer átláthatóságának növelése érdekében, és finomítani fogják magát a rendszert, hogy „kifejezetten elkerüljék a hízelgést”. „Azt is hisszük, hogy a felhasználóknak nagyobb kontrollt kell kapniuk a ChatGPT viselkedése felett, és amennyire biztonságos és kivitelezhető, módosíthatják azt, ha nem értenek egyet az alapértelmezett viselkedéssel” – áll a bejegyzésben. Az OpenAI tehát komoly intézkedéseket tervez annak érdekében, hogy a jövőben elkerüljék a hasonló helyzeteket, és a felhasználók számára biztonságosabb, hitelesebb interakciókat biztosítsanak a ChatGPT-vel.

Forrás: https://www.bbc.com/news/articles/cn4jnwdvg9qo