A Wikipédia 25. születésnapjára időzítve jelentette be a Wikimedia Alapítvány, hogy átfogó licencszerződést kötött a világ vezető technológiai vállalataival. A megállapodás értelmében a Microsoft, a Meta és az Amazon is fizetni fog azért, hogy mesterséges intelligenciáik legálisan, strukturált formában férhessenek hozzá az online enciklopédia tudásbázisához. Ez a lépés biztosíthatja a platform pénzügyi jövőjét a változó internetes szokások közepette.
A Wikipédia-paradoxon: népszerűbb, mint valaha, mégis bajban van
Az elmúlt években a Wikipédia egy sajátos csapdába került. Bár az emberiség tudása iránti kereslet sosem volt nagyobb, a felhasználók szokásai drasztikusan megváltoztak. A generatív mesterséges intelligencia (mint a ChatGPT vagy a Google Gemini) megjelenésével az emberek egyre kevesebbszer kattintanak rá magára a Wikipédia weboldalára, mivel a chatbotok azonnal, kész válaszként tálalják az onnan származó információkat.
Ez a jelenség kettős problémát okozott a nonprofit alapítványnak:
- Bevételkiesés: A kevesebb látogató kevesebb potenciális adományozót jelent, ami veszélyezteti a szerverek fenntartását és a fejlesztéseket.
- Megnövekedett terhelés: Eközben az AI-cégek adatgyűjtő robotjai (crawlers) folyamatosan pásztázták az oldalt, hatalmas terhelést róva az infrastruktúrára, anélkül, hogy ezért bármit fizettek volna.
A most bejelentett, január közepén véglegesített megállapodáscsomag ezt az egyensúlytalanságot hivatott feloldani. A Wikimedia Foundation közlése szerint az új partnerek – köztük a Microsoft, a Meta, az Amazon, a Perplexity és a Mistral AI – csatlakoztak a már korábban szerződött Google mellé a fizetős ügyfelek sorába.
Mit kapnak a techóriások a pénzükért?
A megállapodás lényege nem a felhasználói adatok eladása – ezt az Alapítvány határozottan cáfolta –, hanem a kényelem és a sebesség árusítása. A partnerek a Wikimedia Enterprise nevű szolgáltatáson keresztül férnek hozzá az adatokhoz. Ez egy kifejezetten nagyvállalati igényekre szabott adatcsatorna (API), amely lehetővé teszi, hogy a cégek ne „lopva”, a weboldalt lassítva gyűjtsék be az információkat, hanem egy dedikált, tiszta sávon.
Az alábbi táblázat összefoglalja, miért éri meg a cégeknek fizetni az ingyenesen is elérhető adatokért:
| Szempont | Hagyományos adatbányászat (Scraping) | Wikimedia Enterprise API (Fizetős) |
|---|---|---|
| Sebesség | Lassú, gyakran elavult adatok | Valós idejű frissítések (milliszekundumok alatt) |
| Adatminőség | Nyers HTML kód, tisztítást igényel | Strukturált, gépek számára azonnal emészthető formátum |
| Jogi státusz | Szürkezóna, szerzői jogi kockázatok | Hivatalos licenc, jogtiszta felhasználás |
| Vandalizmus-szűrés | Nincs (a trollkodás bekerülhet az AI-ba) | Automatikus jelölés a gyanús változtatásoknál |
Magyar vonatkozás és a közösség reakciója
A megállapodás közvetve érinti a magyar Wikipédiát (hu.wikipedia.org) is. A magyar szócikkek tízezreit ugyanazok a lelkes önkéntesek írják ingyen, akiknek a munkájából mostantól közvetve profitálnak a techóriások. Bár ez etikai vitákat váltott ki a szerkesztői közösségben, a bevétel garantálja, hogy a magyar nyelvű felület is reklámmentes és gyors maradhasson.
Fontos szempont, hogy a strukturált adatátadás révén a magyar nyelvű AI-modellek pontossága is javulhat. Ha egy magyar szócikket frissítenek egy fontos adattal (például egy választási eredménnyel vagy sporteredménnyel), az a fizetős API-n keresztül szinte azonnal megjelenhet a ChatGPT vagy a Microsoft Copilot válaszaiban, csökkentve a „hallucinációk” (kitalált tények) számát.
Kilátások: békejobb vagy fegyverszünet?
A mostani egyezség történelmi jelentőségű, mivel lezárhatja a „szerzői jogi háborúk” egyik frontját. Míg a New York Times és más kiadók pereket indítottak az AI-cégek ellen a tartalmaik engedély nélküli felhasználása miatt, a Wikipédia a kooperáció útját választotta. Az Alapítvány hangsúlyozza: a befolyó összeget nem osztalékként fizetik ki, hanem visszaforgatják az infrastruktúrába és a tudás szabad terjesztésébe.
A lépés hosszú távon precedenst teremthet az internetes tartalomgyártásban: a minőségi, ellenőrzött információ válik a legértékesebb valutává, amelyért a mesterséges intelligenciának fizetnie kell.