Az Nvidia tagadja a kalózkönyvek használatát az AI-modellek tanításánál

nvidia logo

Az Nvidia, a világ vezető chipgyártója és mesterséges intelligencia-infrastruktúra szolgáltatója, határozottan visszautasította azokat a vádakat, amelyek szerint jogvédett, illegális forrásból származó könyveket használt volna fel generatív AI-modelljeinek oktatásához. A legújabb bírósági beadványokban a tech-óriás azt kéri a szövetségi bíróságtól, hogy utasítsa el az Anna’s Archive nevű, hírhedt digitális könyvtárral kapcsolatos állításokat. A jogi vita középpontjában az áll, hogy a felperesek szerint az Nvidia olyan adatkészleteket alkalmazott, amelyek tartalmazzák a kalózoldalról származó tartalmakat, ám a vállalat szerint az erre vonatkozó bizonyítékok nem állják meg a helyüket, és nem igazolják a tényleges szerzői jogi jogsértést.

A konfliktus háttere és a peres eljárás gyökerei

Az ügy egy tavaly indított csoportos keresetre vezethető vissza, amelyben neves szerzők azzal vádolják az Nvidiát, hogy az NeMo keretrendszer fejlesztése során engedély nélkül használta fel műveiket. A vádak szerint az Nvidia olyan adathalmazokat használt – például a Books3 nevű gyűjteményt –, amelyek közvetlenül vagy közvetve az Anna’s Archive és hasonló „árnyékkönyvtárak” tartalmára épültek. Ezek a platformok több millió, jogtalanul beszkennelt és letölthetővé tett könyvet tartalmaznak, amelyek az AI-modellek nyelvi képességeinek pallérozására kiválóan alkalmasak, ám jogi szempontból rendkívül problémásak.

Az Nvidia védekezése szerint a felperesek nem tudják bizonyítani, hogy a kérdéses modellek kimeneteiben ténylegesen megjelennének a jogvédett részletek, vagy hogy a tanítási folyamat során elkövetett másolás kimerítené a jogsértés fogalmát. A vállalat jogászai hangsúlyozták, hogy a modellek statisztikai összefüggéseket tanulnak, nem pedig konkrét szövegeket tárolnak el, így a tanítási folyamat során végzett adatkezelés a méltányos használat (fair use) körébe tartozhat.

Az Anna’s Archive és a technológiai szektor kapcsolata

Az Anna’s Archive egy meta-keresőmotor, amely több nagy kalózadatbázis (mint a Library Genesis és a Sci-Hub) tartalmát egyesíti. Az Nvidia bírósági érvelése szerint az a tény, hogy egy adathalmaz neve felmerül egy ilyen oldallal összefüggésben, még nem jelenti azt, hogy a vállalat tudatosan és szándékosan sértett volna szerzői jogot. A technológiai szektorban bevett gyakorlat a nagy, nyílt forráskódú adatkészletek használata, amelyek tisztasága azonban sokszor nehezen ellenőrizhető a felhasználó cégek számára.

Az Nvidia mostani beadványa kifejezetten azt célozza, hogy a bíróság zárja ki a perből az Anna’s Archive-ra való hivatkozásokat, mivel azok véleményük szerint csak a hangulatkeltést szolgálják, és nem tartalmaznak konkrét bizonyítékot a jogsértésre vonatkozóan. A cég álláspontja szerint a felpereseknek azt kellene bizonyítaniuk, hogy az ő specifikus könyveiket használták fel, és az Nvidia modelljei képesek azokat reprodukálni, nem pedig általános adathalmaz-kapcsolatokra mutogatni.

A technológiai és piaci hatások

Az ügy kimenetele meghatározó lehet az egész AI-iparág számára. Ha a bíróság az Nvidia javára dönt, az megerősítheti a tech-cégek pozícióját a tanítási adatok „szabadabb” felhasználása terén. Ellenkező esetben azonban olyan precedens születhet, amely kártérítési hullámot indíthat el a Microsoft, a Google és az OpenAI ellen is. Az Nvidia piaci dominanciája miatt minden ilyen jogi lépés közvetlen hatással van a befektetői bizalomra és a vállalat részvényárfolyamára is.

A felhasználók számára ez a vita a modellek minőségét befolyásolhatja. Ha a fejlesztők kénytelenek lesznek kizárólag szigorúan ellenőrzött, fizetős licencű forrásokra támaszkodni, az adatkészletek mérete és diverzitása csökkenhet, ami butább vagy korlátozottabb képességű mesterséges intelligenciákat eredményezhet. Ugyanakkor az etikus AI hívei szerint ez az egyetlen út a kreatív szektor és a szerzői jogok védelmében.

Adatok és specifikációk az Nvidia AI-modelljeiről

Megnevezés Részletek / Érintett adatok Státusz
Modell keretrendszer Nvidia NeMo Aktív fejlesztés alatt
Kérdéses adathalmaz Books3 (kb. 196 640 könyv) Eltávolítva/Tisztázás alatt
Vád alapja Anna’s Archive kapcsolat Visszautasítva
Jogi érv Fair Use (Méltányos használat) Folyamatban lévő érvelés

Magyar vonatkozás és az európai szabályozás

A magyar tartalomgyártók és kiadók számára is kritikus az ügy, mivel az Európai Unió nemrégiben elfogadott AI Act szabályozása szigorú átláthatóságot követel meg az adatkészletek forrását illetően. Bár a per az Egyesült Államokban zajlik, az ottani bírósági döntés globális standardot állíthat fel. Magyarországon a szerzői jogi törvények jelenleg nem adnak ilyen széles körű mentességet a gépi tanulás céljából végzett adatbányászatra, amennyiben a szerző kifejezetten tiltakozik ez ellen (opt-out). Ha az Nvidia vereséget szenved, a magyar szerzők is nagyobb eséllyel követelhetnének fellépést a hazai műveiket engedély nélkül felhasználó nagyvállalatok ellen.

Kilátások és következő lépések

A bíróságnak most arról kell döntenie, hogy az Nvidia által benyújtott elutasítási indítvány (motion to dismiss) helytálló-e. Amennyiben a bíró engedi a per folytatását, az Nvidia kénytelen lesz mélyebben feltárni belső folyamatait és az adatszerzési stratégiáját, ami érzékeny üzleti titkokat is érinthet. A tech-iparág feszülten figyeli a fejleményeket, hiszen a 2026-os év sorsfordító lehet az AI és a szellemi tulajdonjog viszonyában.

A következő hónapokban várható a tanúmeghallgatások és a bizonyítási szakasz megkezdése. Az Nvidia stratégiája egyértelmű: elhatárolódni a direkt kalózkodástól, és a vitát a technológia absztrakt működésének szintjére terelni, ahol a hagyományos szerzői jogi keretek nehezebben értelmezhetők.

Forráslista