Jövőre már a memóriahátrányt is ledolgozhatja a Huawei

huawei-ascend-illustration

A Huawei az Ascend 910B/910C chipvonal után hivatalosan is felrajzolta az Ascend 950–960–970 ütemtervet, és két új „supernode” rendszert (Atlas 950, Atlas 960) jelentett be. A cél egyértelmű: saját, házon belüli HBM-memóriával és jóval nagyobb klaszterekkel csökkenteni a nyugati riválisokkal szembeni memória- és sávszélesség-hátrányt.

Mi történt?

  • A Huawei a Huawei Connect 2025 konferencián először mutatott be részletes, több évre szóló Ascend AI-chip road­mapet.
  • 2026 elején érkezik az Ascend 950 (két változatban), 2027-ben az Ascend 960, 2028-ban az Ascend 970.
  • Bemutatkozott az Atlas 950 és Atlas 960 „supernode” architektúra, amelyek 8192, illetve 15 488 Ascend chip összekapcsolását célozzák.
  • Kiemelt újdonság a saját fejlesztésű HBM, amellyel a memória-kapacitás és a sávszélesség is nagyot ugrik.

Mit jelent ez a memóriahátrány szempontjából?

Nagy nyelvi modellek és multimodális AI-feladatok esetén a memória mérete és sávszélessége kritikus. A Huawei szerint az Ascend 950 széria házon belüli HBM-mel párosítva érdemben csökkenti a szűk keresztmetszeteket, miközben a „supernode” topológiák a chip-közi összeköttetést skálázzák fel nagyságrendekkel. Az irány tehát nem csak „több chip egy dobozban”, hanem teljes rendszer-szintű (memória, interconnect, szoftver) előrelépés.

Új chipek és „supernode”-ok – a lényeg számokban

Elem Korábbi generáció Új generáció / cél
Ascend 910C → 950 910B/910C chipek, korlátozottabb HBM-opciókkal Ascend 950PR/950DT (2026): saját HBM; a PR prefill/ajánlórendszerekre, a DT decode/tréningre optimalizált
HBM kapacitás/sávszél (950) Alacsonyabb memória és sávszélesség a 910-es sorozatban 950PR: ~128 GB és akár ~1,6 TB/s; 950DT: ~144 GB és akár ~4 TB/s (célértékek)
Supernode kapacitás Atlas 900: ~384 Ascend 910C chip Atlas 950: 8192 chip (Q4 2025/2026 időzítéssel kommunikálva); Atlas 960: 15 488 chip (Q4 2027 cél)

Mire elég ez a gyakorlatban?

  • Nagyobb modellek és batch-ek: több memória → kevesebb offload/fragmentáció, stabilabb tréning.
  • Gyorsabb elő- és utófeldolgozás: magas sávszélesség segít a prefill/decode fázisok felgyorsításában.
  • Skálázhatóság: a „supernode” az interconnectet is skálázza, nem csak a nyers számot.

Vakfoltok és kérdőjelek

  • Gyártási oldal: a házon belüli HBM és a csomagolástechnológia kiforrottsága, hozamok és energiahatékonyság.
  • Szoftver-ökoszisztéma: a CUDA-szintű stack hiánya továbbra is kihívás lehet a teljesítmény kiaknázásához.
  • Időzítés és „való világ” mérési adatok: a bejelentett számok ambiciózusak, de a független benchmarkok döntik el a tényleges előnyt.

Kilátás 2026–2027

Ha a Huawei tartja az ütemtervet, 2026-ra a memória-hátrány jelentős része eltűnhet a célpiacain (ajánlórendszerek, LLM-ek tréningje és inferenciája, multimodális AI). 2027-ben az Atlas 960-nal a cég már a hiperskálázott, több tízezer gyorsítós „sziget-rendszereket” célozza, amelyek papíron a jelenlegi riválisok csúcskonfigurációival versenyezhetnek.