Kiszivárgott a Jalapeño: saját célhardverrel égeti le az OpenAI az Nvidia dominanciáját

Saját dedikált szilíciummal tör ki az Nvidia szorításából a ChatGPT mögött álló OpenAI, befutott a Jalapeño chip. A Broadcommal közösen tervezett Jalapeño egy kifejezetten nagy nyelvi modellek következtetési fázisára, azaz az inferenciára kihegyezett céláramkör.

Háború a méregdrága grafikus processzorok ellen

Az MI-szektorban tevékenykedő óriáscégek eddig szinte teljesen ki voltak szolgáltatva az Nvidia méregdrága hardvereinek, ami komoly piaci kiszolgáltatottságot eredményezett. A ChatGPT kiszolgálása, a Codex futtatása és az API-kérések megválaszolása elképesztő mennyiségű villamos energiát és brutális pénzügyi hátteret emészt fel napi szinten. A konkurens tech-óriások, köztük a Google a saját fejlesztésű TPU-kkal, vagy a Microsoft a Maia gyorsítókkal már korábban elindultak a függetlenedés útján. Az OpenAI eddig elsősorban szoftveres és algoritmus-oldalon dominált, de a fizikai hardveres szűkkeresztmetszet gátat szabott a skálázódási ütemnek.

Kilenc hónap alatt tető alá hozott egyedi architektúra

A Jalapeño szakít a hagyományos megközelítéssel: nem egy korábbi mesterséges intelligencia tréning-gyorsítóból átalakított általános célú processzor, hanem egy teljesen tiszta lappal indított, kifejezetten az LLM-ek következtetési fázisára optimalizált szilícium. A tervezési ciklus elképesztő tempót diktált, mivel az első skiccektől a gyártási szalagra küldésig, azaz a tape-out fázisig mindössze kilenc hónap telt el. Ezt a rekordidőt az iparági adatok szerint részben maguk az OpenAI meglévő nyelvi modelljei segítették elő, amelyek hatékonyan támogatták a chiptervező mérnökök munkáját. A kész laboratóriumi minták már jelenleg is sikeresen futtatják a GPT-5.3-Codex-Spark modellt a megcélzott gyári frekvencián és üzemi feszültségen.

Wattokért folyó küzdelem a szerverszobákban

Bár a pontos teljesítményadatokat tartalmazó részletes technikai jelentés publikálására még hónapokat kell várni, az első laboratóriumi mérések lényegesen jobb wattonkénti teljesítményt mutatnak a jelenlegi csúcshardverekhez kpest. Az inferencia fázis fenntartása jelenti a legnagyobb folyamatos pénzügyi terhet a tömegesen használt lakossági és vállalati MI-szolgáltatásoknál, így a megnövelt hatékonyság közvetlenül csökkenti a működési költségeket. A hardver felépítése fizikailag is monumentalitást tükröz, ugyanis a központi logikai lapka mellett nyolc darab HBM3E memóriablokk kapott helyet az extrém sávszélesség biztosítására, minimalizálva a költséges belső adatmozgási veszteségeket. A nagy sebességű hálózati konnektivitásért a Broadcom Tomahawk technológiája felel, míg a szerverszintű integrációt és rack-kialakítást a Celestica végzi.

Gigawattos adatközpontok és a piaci terjeszkedés lehetősége

A több generációra tervezett hardveres platform első éles példányait 2026 végén kezdhetik el kiépíteni a Microsoft és más kiemelt partnerek adatközpontjaiban. A Broadcom vezetésének nyilatkozata alapján a végső cél egy gigawattos léptékű infrastruktúra kiépítése, amely stabil alapot biztosít a jövőbeli, autonóm ágensekre épülő komplex szoftveres termékek tömeges elterjedéséhez. Különösen lényeges, hogy a Jalapeño architektúráját úgy alakították ki, hogy az iparág más nyelvi modelljeit is képes legyen kiszolgálni. Ez a fajta rugalmasság hosszú távon megnyitja az utat azelőtt, hogy az OpenAI harmadik feleknek is közvetlenül értékesítse vagy bérbe adja a saját tulajdonú célhardvereit, amivel közvetlen konkurenciát teremthet a piacon elérhető alternatív felhőszolgáltatásoknak.

Nyitókép forrása: openai

Kapcsolódó tartalom

A GTA 6 helyett a klasszikusokra figyel a világ: váratlan frissítést kaptak a kultikus RPG-k