Az OpenAI végre kijavította a ChatGPT hírhedt kötőjel-bugját: a modell mostantól sokkal megbízhatóbban betartja, ha azt kéred tőle, hogy ne használjon em dash jellegű gondolatjeleket, ami különösen a fejlesztőknek és technikai szövegekkel dolgozó szakembereknek jelent megkönnyebbülést.
Amikor a gondolatjel „ChatGPT-ujjlenyomattá” vált
Az elmúlt években szinte mémmé vált, hogy az em dash, vagyis a hosszú gondolatjel a ChatGPT egyik legkönnyebben felismerhető stílusjegye. Rengeteg felhasználó számolt be arról, hogy ha az AI-t szabadjára engedték, a szöveg tele lett hosszú gondolatjelekkel – sokkal sűrűbben, mint ahogy azt egy átlagos emberi író tenné. A Rolling Stone-tól a Redditig mindenhol terjedtek azok a tippek, hogy aki „emberibb” szöveget akar, az próbálja kerülni ezt az írásjelet, mert sokan már automatikusan AI-gyanúval kezelik.
A fejlesztői oldalról mindez különösen zavaró volt: kódrészletekben, konfigurációs fájlokban, technikai dokumentációkban egy rossz Unicode-karakter vagy automatikusan beszúrt gondolatjel könnyen okozhat szintaktikai hibát, félreérthető példakódot vagy dokumentációs káoszt. Hiába kérte sok fejlesztő kifejezetten azt, hogy a ChatGPT ne használjon ilyen jeleket, a modell gyakran egyszerűen figyelmen kívül hagyta a kérést.
Mi volt pontosan a ChatGPT kötőjel-bugja?
A probléma két részből állt. Egyrészt a modell tréningje és finomhangolása során a rendszer rengeteg olyan forrásszövegből tanult, ahol a hosszú gondolatjel gyakori és teljesen legitim írásjel volt, így a statisztikai mintázatok alapján „túl vonzó” választásnak tűnt. Másrészt a felhasználói utasítások – például a custom instructions mezőbe írt „kérlek, ne használj gondolatjeleket” – nem kaptak elég erős súlyt a belső döntési láncban. Az eredmény: még akkor is gyakran megjelent a gondolatjel, ha a prompt egyértelműen tiltotta.
Az OpenAI szerint a hiba gyökere a tokenizálás és egy új modellverzió finomhangolása közben jelent meg. A különféle kötőjel- és gondolatjel-karakterek (rövid kötőjel, en dash, em dash, mínuszjel stb.) eltérő tokenekként való kezelése, valamint a rájuk épülő stílusminták együtt vezettek oda, hogy a modell a valóságban nem tudta tiszteletben tartani a „nincs gondolatjel” jellegű kéréseket.
Mit javított most az OpenAI?
Sam Altman, az OpenAI vezérigazgatója egy X-posztban jelentette be, hogy sikerült „megszelídíteni” ezt a furcsa nyelvi szokást. A lényege: ha a felhasználó a személyre szabási (personalization) beállításokban egyértelműen jelzi, hogy nem kér em dash típusú gondolatjeleket, akkor a ChatGPT mostantól valóban igyekszik elkerülni ezeket. A TechCrunch és más technológiai lapok beszámolói szerint a változtatás a legfrissebb modellverzió (GPT-5.1) finomhangolásával, valamint az utasításkövető réteg módosításával együtt érkezett.
Gyakorlatban ez azt jelenti, hogy a custom instructions mezőben megadott stíluspreferenciák – például a gondolatjelek kerülése, másfajta felsorolás, rövidebb mondatok – nagyobb súlyt kapnak, és a modell belső döntési logikája kifejezetten ellenőrzi, hogy ezeket az egyszerű, de kritikus elvárásokat ne írják felül a tanult nyelvi minták. A rendszer továbbra sem „tiltja be” globálisan a gondolatjeleket, de sokkal fegyelmezettebben tartja be, ha valaki kifejezetten kéri az elhagyásukat.
Miért fontos ez a fejlesztőknek és technikai felhasználóknak?
A felszínen ez apróságnak tűnhet, valójában azonban komoly produktivitási és minőségi kérdés: ha egy AI-asszisztens rendszeresen olyan karaktereket szúr be, amelyek kódban vagy konfigurációs fájlokban hibákat okoznak, akkor a fejlesztőknek manuálisan kell „kitakarítaniuk” a kódot, ami időigényes és hibaérzékeny folyamat. Márpedig egyre többen használják a ChatGPT-t kódrészletek generálására, logfájl-elemzésre, dokumentáció írására vagy éppen szerződésminták szerkesztésére.
Hasonló a helyzet a jogi, pénzügyi vagy más, szigorúan formázott dokumentumoknál: ha egy házon belüli stílusguide tiltja a hosszú gondolatjeleket, vagy egyes rendszerek nem kezelik jól a speciális Unicode-karaktereket, akkor a kényszerű kézi javítgatás rengeteg pluszmunkát jelent. Az új beállításokkal a ChatGPT sokkal jobban illeszthető a konkrét céges stílushoz, tipográfiai szabályokhoz és technikai követelményekhez.
Számok, adatok, technikai részletek
A mostani frissítés nem egy klasszikus „feature launch”, inkább egy olyan finomhangolás, amely a színfalak mögött történt. Mégis érdemes egy táblázatban összefoglalni, mit tudunk róla a nyilvános információk alapján.
| Legfontosabb paraméter | Érték |
|---|---|
| Érintett jelenség | A ChatGPT em dash / gondolatjel túlhasználata, a felhasználói tiltás figyelmen kívül hagyása |
| Fő ok | Tokenizálási sajátosságok és finomhangolás során rögzült stílusminták kombinációja |
| Érintett modellverzió | GPT-5.1 modellcsalád (frissített utasításkövető réteggel) |
| Bejelentés időpontja | 2025. november 14–16. között, Sam Altman X-posztja és az első tech cikkek alapján |
| Megoldás lényege | A személyre szabási beállításokban megadott „ne használj gondolatjelet” típusú utasítások erősebb érvényesítése |
| Közvetlen nyertesek | Fejlesztők, technikai írók, jogászok, tartalomkészítők, akik szigorú tipográfiai vagy kódolási szabályokkal dolgoznak |
Magyar vonatkozás: miért érdekes ez egy hazai cégnek vagy fejlesztőnek?
A Sg.hu beszámolója szerint a jelenség a magyar fejlesztőket és IT-szakembereket is érintette: itthon is egyre többen támaszkodnak a ChatGPT-re kódkiegészítéshez, dokumentációk és prezentációk írásához. Ha egy nagyobb szervezetnél a kódreview-k során rendszeresen fel kellett hívni a figyelmet a „rossz” gondolatjelekre, az egyrészt időt vitt el, másrészt felesleges feszültséget keltett a csapaton belül.
A mostani frissítés után a magyar vállalatok is bátrabban építhetnek olyan workflow-kat, ahol a ChatGPT szövege közel végleges minőségben kerül be a kódtárba vagy a tudástárba. Ez nem jelenti azt, hogy nem kell átnézni az outputot, de az ilyen típusú, jól körülírható formázási hibák sokkal ritkábban fognak előfordulni. Emellett az is pozitív üzenet, hogy az OpenAI kifejezetten reagált egy látszólag „apróságra”, amelyet főleg power userek és fejlesztők jeleztek.
Mit üzen ez az AI-rendszerek megbízhatóságáról?
Az egész történet jó emlékeztető: az AI-eszközök ma már mindennaposak, de a kritikus munkafolyamatok mellé továbbra is kell emberi kontroll. Ha egy olyan „egyszerű” kérést, mint a gondolatjelek kerülése, hónapokig nem sikerült rendesen betartatni egy modellel, az jól mutatja, mennyire komplexek ezek a rendszerek – és hogy milyen nehéz finoman, mégis következetesen szabályozni a stílust és a formátumot.
Ugyanakkor pozitív jel, hogy a visszajelzések valóban eljutnak a fejlesztőkhöz: a TechCrunch, a Business Insider és más lapok cikkeiből is az látszik, hogy az OpenAI egyre inkább a testreszabhatóságra, a memory funkciókra és az állandó stílusbeállításokra épít. Ha ez a trend folytatódik, a jövőben könnyebb lesz olyan AI-asszisztenst építeni, amely nemcsak „okos”, hanem következetesen illeszkedik a saját céges nyelv- és formázási szabályokhoz is.
Gyakorlati tippek: hogyan használd ezt a változást?
- Nyisd meg a ChatGPT személyre szabási (personalization, custom instructions) beállításait, és írd bele egyértelműen, hogy nem kérsz em dash vagy hosszú gondolatjel használatot.
- Ha kódról, konfigurációról vagy technikai dokumentációról van szó, külön is jelezd a promptban, hogy csak ASCII-karaktereket, egyszerű kötőjelet használjon a modell.
- A már létező sablonjaidat (pl. szerződésminta, dokumentációs skeleton) frissítsd úgy, hogy tartalmazzák ezeket a stilisztikai kéréseket.
- Ha vállalati környezetben használjátok az AI-t, érdemes belső guideline-ban rögzíteni, hogy milyen írásjelek megengedettek, és ezt a custom instructions részben is beállítani.
Kilátások: mi jöhet ezután?
A kötőjel-bug javítása valószínűleg csak az első a hasonló, látszólag apró, de a gyakorlatban nagyon is zavaró stílushibák sorában. Várható, hogy a következő hónapokban egyre több olyan finomhangolás érkezik, amely a tipikus „AI-nyelvezetet” próbálja emberibbé tenni: kevesebb elcsépelt fordulat, jobb mondathossz-kezelés, konzisztens formázás, rugalmasabb hivatkozáskezelés.
Magyar szemmel nézve ez különösen izgalmas: ha a nagy modellek jobban követik a saját stílusguide-unkat, akkor az AI könnyebben integrálható lesz a hazai médiában, a vállalati dokumentációban, sőt akár a kód- és infra-review folyamatokban is. A kötőjel-bug története tehát egyszerre apró technikai javítás és fontos jelzés: a felhasználói visszajelzés igenis számít, és az AI-rendszerek folyamatosan formálhatók a valódi igényekhez.
GYIK – rövid kérdések és válaszok
- El fog tűnni teljesen a gondolatjel a ChatGPT válaszaiból? – Nem, csak akkor próbálja következetesen kerülni, ha a felhasználó ezt kifejezetten kéri a személyre szabási beállításokban vagy a promptban.
- API-hívásoknál is működik a változás? – Igen, a modell szintjén történt módosítás, így az API-n keresztül hívott modellek is jobban követik az explicit stíluskéréseket, ha azokat a promptban egyértelműen megadod.
- Megszűnik a „ChatGPT-stílus” felismerhetősége? – Teljesen nem, de egyre nehezebb lesz pusztán néhány írásjel alapján AI-t detektálni, mert a modellek rugalmasabban idomulnak az egyéni stílushoz.
- Érdemes-e továbbra is emberrel lektoráltatni a fontos szövegeket? – Igen, különösen jogi, pénzügyi vagy műszaki dokumentumoknál továbbra is ajánlott emberi kontrollt alkalmazni, az AI-t pedig gyorsító, segítő eszközként használni.
- Mit tegyek, ha még mindig túl sok gondolatjelet látok? – Finomítsd a custom instructions szövegét, adj konkrét példákat a kívánt stílusra, és szükség esetén futtass egy egyszerű keresés–csere lépést a kész szövegen publikálás előtt.