Történelmi alkut kötött a Wikipédia a techóriásokkal, a túlélésüket jelentheti

Wikipedia

A Wikipédia 25. születésnapjára időzítve jelentette be a Wikimedia Alapítvány, hogy átfogó licencszerződést kötött a világ vezető technológiai vállalataival. A megállapodás értelmében a Microsoft, a Meta és az Amazon is fizetni fog azért, hogy mesterséges intelligenciáik legálisan, strukturált formában férhessenek hozzá az online enciklopédia tudásbázisához. Ez a lépés biztosíthatja a platform pénzügyi jövőjét a változó internetes szokások közepette.

A Wikipédia-paradoxon: népszerűbb, mint valaha, mégis bajban van

Az elmúlt években a Wikipédia egy sajátos csapdába került. Bár az emberiség tudása iránti kereslet sosem volt nagyobb, a felhasználók szokásai drasztikusan megváltoztak. A generatív mesterséges intelligencia (mint a ChatGPT vagy a Google Gemini) megjelenésével az emberek egyre kevesebbszer kattintanak rá magára a Wikipédia weboldalára, mivel a chatbotok azonnal, kész válaszként tálalják az onnan származó információkat.

Ez a jelenség kettős problémát okozott a nonprofit alapítványnak:

  • Bevételkiesés: A kevesebb látogató kevesebb potenciális adományozót jelent, ami veszélyezteti a szerverek fenntartását és a fejlesztéseket.
  • Megnövekedett terhelés: Eközben az AI-cégek adatgyűjtő robotjai (crawlers) folyamatosan pásztázták az oldalt, hatalmas terhelést róva az infrastruktúrára, anélkül, hogy ezért bármit fizettek volna.

A most bejelentett, január közepén véglegesített megállapodáscsomag ezt az egyensúlytalanságot hivatott feloldani. A Wikimedia Foundation közlése szerint az új partnerek – köztük a Microsoft, a Meta, az Amazon, a Perplexity és a Mistral AI – csatlakoztak a már korábban szerződött Google mellé a fizetős ügyfelek sorába.

Mit kapnak a techóriások a pénzükért?

A megállapodás lényege nem a felhasználói adatok eladása – ezt az Alapítvány határozottan cáfolta –, hanem a kényelem és a sebesség árusítása. A partnerek a Wikimedia Enterprise nevű szolgáltatáson keresztül férnek hozzá az adatokhoz. Ez egy kifejezetten nagyvállalati igényekre szabott adatcsatorna (API), amely lehetővé teszi, hogy a cégek ne „lopva”, a weboldalt lassítva gyűjtsék be az információkat, hanem egy dedikált, tiszta sávon.

Az alábbi táblázat összefoglalja, miért éri meg a cégeknek fizetni az ingyenesen is elérhető adatokért:

Szempont Hagyományos adatbányászat (Scraping) Wikimedia Enterprise API (Fizetős)
Sebesség Lassú, gyakran elavult adatok Valós idejű frissítések (milliszekundumok alatt)
Adatminőség Nyers HTML kód, tisztítást igényel Strukturált, gépek számára azonnal emészthető formátum
Jogi státusz Szürkezóna, szerzői jogi kockázatok Hivatalos licenc, jogtiszta felhasználás
Vandalizmus-szűrés Nincs (a trollkodás bekerülhet az AI-ba) Automatikus jelölés a gyanús változtatásoknál

Magyar vonatkozás és a közösség reakciója

A megállapodás közvetve érinti a magyar Wikipédiát (hu.wikipedia.org) is. A magyar szócikkek tízezreit ugyanazok a lelkes önkéntesek írják ingyen, akiknek a munkájából mostantól közvetve profitálnak a techóriások. Bár ez etikai vitákat váltott ki a szerkesztői közösségben, a bevétel garantálja, hogy a magyar nyelvű felület is reklámmentes és gyors maradhasson.

Fontos szempont, hogy a strukturált adatátadás révén a magyar nyelvű AI-modellek pontossága is javulhat. Ha egy magyar szócikket frissítenek egy fontos adattal (például egy választási eredménnyel vagy sporteredménnyel), az a fizetős API-n keresztül szinte azonnal megjelenhet a ChatGPT vagy a Microsoft Copilot válaszaiban, csökkentve a „hallucinációk” (kitalált tények) számát.

Kilátások: békejobb vagy fegyverszünet?

A mostani egyezség történelmi jelentőségű, mivel lezárhatja a „szerzői jogi háborúk” egyik frontját. Míg a New York Times és más kiadók pereket indítottak az AI-cégek ellen a tartalmaik engedély nélküli felhasználása miatt, a Wikipédia a kooperáció útját választotta. Az Alapítvány hangsúlyozza: a befolyó összeget nem osztalékként fizetik ki, hanem visszaforgatják az infrastruktúrába és a tudás szabad terjesztésébe.

A lépés hosszú távon precedenst teremthet az internetes tartalomgyártásban: a minőségi, ellenőrzött információ válik a legértékesebb valutává, amelyért a mesterséges intelligenciának fizetnie kell.