Ipari méretű adatlopással vádolja az Anthropic a kínai AI-óriásokat

Az elmúlt napok egyik legsúlyosabb technológiai konfliktusa robbant ki a mesterséges intelligencia szektorban, miután az amerikai Anthropic nyilvánosságra hozta részletes jelentését a kínai fejlesztők, köztük a DeepSeek, a Moonshot AI és a MiniMax tevékenységéről. A vádak szerint ezek a vállalatok szisztematikusan, ipari méretekben csapolták le a Claude modellek tudását, hogy saját rendszereiket fejlesszék. A jelentés szerint több mint 24 000 hamis felhasználói fiókot és 16 millió interakciót használtak fel arra, hogy a prémium modellek válaszait kinyerjék és azokból kisebb, olcsóbb modelleket tanítsanak be.

Ez a folyamat, amelyet a szakma lepárlás (distillation) néven ismer, nem ismeretlen az iparágban, azonban az Anthropic által feltárt lépték példátlan. A vádak súlyát növeli, hogy a kínai cégek a felhasználási feltételeket kijátszva, automatizált bot-hálózatokkal végezték az adatgyűjtést. Az ügy nem csupán szerzői jogi kérdéseket vet fel, hanem rávilágít a globális AI-verseny etikai és technológiai feszültségeire is, ahol a nyugati innovációk „visszafejtése” vált a gyors felzárkózás elsődleges eszközévé.

A konfliktus háttere és az adatgyűjtés mechanizmusa

Az Anthropic kutatói hónapok óta figyelték a gyanús aktivitást a rendszereikben. A feltárt adatok alapján a támadók nem véletlenszerűen kérdezgettek, hanem egy rendkívül tudatos, strukturált módszertant követtek. A cél az volt, hogy a Claude 3.5 Sonnet és Opus modellek logikai gondolkodását és válaszstruktúráit lemásolják. A distilláció lényege, hogy egy nagyobb, okosabb modell válaszait használják fel egy kisebb modell tanítóadatbázisaként, így az utóbbi hasonló képességekre tehet szert töredéknyi számítási kapacitás mellett.

A jelentés szerint a DeepSeek és társai komplex hálózatokat építettek ki, amelyekkel kikerülték az Anthropic biztonsági korlátait. Mivel egy átlagos felhasználó nem tesz fel napi több tízezer kérdést, a kínai fejlesztők 24 000 különböző regisztrációt hoztak létre, amelyek mindegyike emberi viselkedést szimulált. Ez a hatalmas volumenű adatkinyerés tette lehetővé, hogy a kínai modellek, mint például a DeepSeek-V3, meglepően rövid idő alatt érjenek el a nyugati élvonalhoz mérhető eredményeket a benchmark teszteken.

Mi változott és miért kritikus ez a pillanat

Eddig is köztudott volt, hogy az AI-cégek figyelik egymást, de ez az első alkalom, hogy egy vezető fejlesztő ilyen részletes technikai bizonyítékokkal áll elő a „tudáslopás” kapcsán. Az Anthropic állítása szerint a 16 millió rögzített interakció során a kínai modellek nemcsak tényeket tanultak el, hanem a Claude specifikus stílusát és érvelési láncait is átvették. Ez alapjaiban kérdőjelezi meg a kínai AI-sikerek eredetiségét, amelyeket az elmúlt hónapokban a világ nagy része csodálattal figyelt.

A DeepSeek különösen érzékeny helyzetbe került, hiszen a vállalat korábban azt állította, hogy saját, egyedi algoritmusokkal és tiszta adatbázisokkal érték el az alacsony költségű, nagy teljesítményű modelljeiket. Ha bebizonyosodik, hogy eredményeik jelentős része az Anthropic (és vélhetően az OpenAI) modelljeinek megcsapolásából származik, az komoly bizalmi válságot okozhat a befektetők és a vállalati felhasználók körében. Az amerikai kormányzat számára pedig ez egy újabb érv lehet a technológiai exportkorlátozások szigorítása mellett.

A felhasználókra és a piacra gyakorolt hatások

A piaci hatások azonnaliak és mélyrehatóak. Az AI-biztonsági szakértők figyelmeztetnek: ha a modellek egymásból tanulnak, fennáll a modell-összeomlás veszélye, ahol a hibák és torzítások felerősödnek. A felhasználók számára ez azt jelenti, hogy a különböző gyártóktól származó mesterséges intelligenciák egyre inkább hasonlítani fognak egymásra, elveszítve egyedi karakterüket és specializált tudásukat. Emellett a fejlesztési költségek megtérülése is veszélybe kerül, ha az innovatív cégek munkáját a konkurencia hetek alatt „leklónozhatja”.

Az iparági elemzők szerint ez az eset felgyorsíthatja a digitális vízjelek és a fejlettebb bot-védelem bevezetését. Az Anthropic már jelezte, hogy szigorítja az API-hozzáféréseket és új algoritmusokat vezet be a gépi lekérdezések szűrésére. Ez ugyanakkor a legitim fejlesztők dolgát is megnehezítheti, növelve a bürokráciát és a költségeket a transzparens kutatásban.

Technikai adatok és a művelet nagyságrendje

Az alábbi táblázat összefoglalja az Anthropic jelentésében szereplő legfontosabb adatokat a feltételezett adatlopási akcióról:

Megnevezés	Részletek és mennyiség	Érintett felek
Felhasznált fiókok száma	24 000+ csalárd regisztráció	DeepSeek, Moonshot, MiniMax
Lekérdezések száma	~16 millió interakció	Claude 3 / 3.5 modellek
Módszertan	Strukturált modell-distilláció	Automatizált bot-hálózatok
Időszak	2025 vége – 2026 eleje	Folyamatos monitoring alatt

Magyar vonatkozások és a hazai szakvélemény

Bár az események globális szinten zajlanak, a magyar technológiai szektor és a hazai AI-fejlesztők számára is fontos tanulságokkal szolgálnak. Magyarországon több startup és kutatócsoport használja a DeepSeek modelljeit azok költséghatékonysága miatt. Amennyiben a kínai modellek jogi státusza bizonytalanná válik az EU-ban a szerzői jogi és adatvédelmi szabályozások (AI Act) miatt, a magyar cégeknek is mérlegelniük kell a váltást biztonságosabb, etikusan tanított modellekre.

A hazai szakértők rámutatnak, hogy a magyar nyelvű AI-alkalmazások fejlesztésekor is kulcskérdés a forrásadatok tisztasága. Ha egy modell „lopott” tudásra épül, az a magyar specifikus kontextusokban (például jogi vagy orvosi szövegeknél) váratlan torzításokat okozhat, mivel a lepárlási folyamat során elveszhetnek a finom árnyalatok és a forrásmodell biztonsági korlátai is sérülhetnek.

Kilátások és a jövőbeli következmények

Az Anthropic vádjai után várhatóan megindul a jogi csatározás, bár a kínai joghatóság alá tartozó cégekkel szemben az amerikai vállalatoknak kevés közvetlen eszközük van. Valószínűbb, hogy a harc technológiai és politikai szinten dől el. Az Egyesült Államok kormánya újabb szankciókat vethet ki a kínai AI-szektorra, korlátozva a felhőalapú szolgáltatásokhoz való hozzáférést, hogy megakadályozzák a további adatlopásokat.

A technológiai ipar számára ez a pillanat az őszinteség ideje is. Fel kell ismerniük, hogy a modellek puszta másolása és „lepárlása” nem fenntartható stratégia. A jövőben a valódi innovációt az eredeti adatokon nyugvó, átlátható módon tanított rendszerek fogják képviselni, amelyek elkerülik a plagizálás és az etikai aggályok csapdáit.

Az Anthropic lépése egyértelmű hadüzenet: a mesterséges intelligencia fejlesztése nem válhat a digitális kalózkodás terepévé, és a szellemi tulajdon védelme még a technológiai verseny hevében is prioritás marad.

Források:

- Tom’s Hardware – Anthropic Accuses DeepSeek and Chinese AI Developers
- Reuters – AI Rivalry Escalates: Anthropic vs. China

Katonai esztétika és brutális légáramlás: Előrendelhető a Corsair Warthog RS

Az Nvidia és a Microsoft közös erővel robbantja be az Arm-alapú laptopok világát

Digitális herbáriumok oldhatják fel Charles Darwin másfél évszázados rejtélyét

A Hitman és a James Bond után online szerepjátékkal kísérletezik az IO Interactive

A Take-Two vezérigazgatója szerint a Rockstar öröksége másolhatatlan

Linux-alapú streaming társeszközt villantott az Acer a Computexen

Elveszett jégóriás menthette meg a Jupiter és az Uránusz holdjait

Szupergyors PC-adatátvitel Windows alatt

Planet Zoo 2: Érkeznek a repülő és teljesen vízi állatok a folytatásban

Hivatalos Overwatch animációs sorozat érkezhet a Blizzard vezetőjének nyilatkozata alapján

Ipari méretű adatlopással vádolja az Anthropic a kínai AI-óriásokat

A konfliktus háttere és az adatgyűjtés mechanizmusa

Mi változott és miért kritikus ez a pillanat

A felhasználókra és a piacra gyakorolt hatások

Technikai adatok és a művelet nagyságrendje

Magyar vonatkozások és a hazai szakvélemény

Kilátások és a jövőbeli következmények

A konfliktus háttere és az adatgyűjtés mechanizmusa

Mi változott és miért kritikus ez a pillanat

A felhasználókra és a piacra gyakorolt hatások

Technikai adatok és a művelet nagyságrendje

Magyar vonatkozások és a hazai szakvélemény

Kilátások és a jövőbeli következmények

Kapcsolódó tartalom