NVIDIA Blackwell Ultra: akár 50-szer gyorsabb és olcsóbb AI-ügynököknek

Az AI fejlesztések újabb mérföldkövéhez érkezett az NVIDIA a Blackwell Ultra platformmal, amely különösen az ügynökalapú (agentic) mesterséges intelligenciák terén hoz jelentős előrelépést. A legfrissebb SemiAnalysis InferenceX adatok szerint az új rendszer akár 50-szer nagyobb teljesítményt nyújt, miközben a költségek akár 35-ször csökkennek az előző generációs Hopper platformhoz képest. Ez a fejlődés alapjaiban változtathatja meg az AI-alapú kódíró asszisztensek és ügynökök működését, amelyek egyre fontosabb szerepet kapnak a szoftverfejlesztés világában.

Az AI ügynökök és a kódíró asszisztensek térhódítása

Az utóbbi időben robbanásszerűen nőtt az AI-alapú kódírási és programozási segédletek iránti kereslet: az OpenRouter legutóbbi jelentése szerint az ilyen típusú AI-lekérdezések aránya az összes AI-interakción belül tavaly 11%-ról közel 50%-ra nőtt. Ezek az alkalmazások különösen érzékenyek a késleltetésre, hiszen a valós idejű válaszadás elengedhetetlen a többlépcsős műveletek és a komplex kódbázisok átfogó értelmezése során.

Az NVIDIA Blackwell Ultra platform erre a kihívásra kínál megoldást, hiszen a teljesítmény és a hatékonyság terén egyaránt új mércét állít fel. A GB300 NVL72 rendszer kiemelkedő energiahatékonysággal rendelkezik, így akár 50-szer több token feldolgozására képes megawattanként, miközben a tokenenkénti költség drasztikusan, akár 35-ször is csökkenhet a korábbi generációs rendszerekhez képest.

Technológiai újítások a Blackwell Ultra mögött

Az áttörést nem csak az új hardver jelenti: az NVIDIA köré épülő szoftveres fejlesztések – mint például a TensorRT-LLM, Dynamo, Mooncake és SGLang – folyamatosan optimalizálják a teljesítményt, különösen a „mixture-of-experts” (MoE) típusú inferenciák esetében, amelyek a komplex AI modellek hatékony működéséhez elengedhetetlenek. Az új GPU magok kifejezetten az alacsony késleltetés és energiahatékonyság érdekében készültek, míg az NVLink Symmetric Memory lehetővé teszi a gyorsabb és hatékonyabb GPU-k közti kommunikációt.

Ezek a fejlesztések együtt teszik lehetővé, hogy a GB300 NVL72 az ügynökalapú AI-k esetében – ahol minden milliszekundum számít – valós idejű, zökkenőmentes felhasználói élményt nyújtson, miközben jelentősen csökkenti az üzemeltetési költségeket.

Hosszú kontextusú munkákra is optimalizálva

A Blackwell Ultra nemcsak az alacsony késleltetésű feladatokban jeleskedik, hanem a hosszú kontextusú elemzésekben, például olyan AI-kódasszisztensek esetében, amelyek akár 128 ezer tokenes bemenettel dolgoznak. Ilyen komplex feladatoknál a GB300 NVL72 akár másfélszer olcsóbban képes működni, mint a korábbi GB200 NVL72 platform.

Ez a kivételes teljesítmény a megnövelt számítási kapacitásnak, a gyorsabb figyelemfeldolgozásnak (attention processing) és a fejlett architektúrának köszönhető, amelyek lehetővé teszik, hogy az AI mélyebben átlássa és értelmezze a kódbázisokat, így intelligensebb és hatékonyabb segítséget nyújtson a fejlesztőknek.

Az iparág vezetői már építik az új generációt

Nem véletlen, hogy a legnagyobb felhőszolgáltatók és AI-cégek, mint a Microsoft, CoreWeave vagy az OCI már élesben használják a GB200 NVL72-t, miközben a GB300 NVL72 is egyre szélesebb körben válik elérhetővé. A platform nem csak gazdaságosabbá teszi az AI működtetését, hanem lehetővé teszi olyan új alkalmazások létrejöttét, amelyek korábban a költségek vagy a teljesítmény korlátai miatt nem voltak megvalósíthatók.

CoreWeave mérnöki vezetője, Chen Goldberg is kiemelte, hogy a Blackwell NVL72 platform a hosszú kontextusú feldolgozás és a tokenhatékonyság szempontjából kulcskérdés az AI-termelés központi elemévé váló inferenciák terén. A legújabb elemzés pedig részletesen bemutatja, hogy milyen mértékben járul hozzá a Blackwell Ultra a skálázható és költséghatékony AI-megoldások elterjedéséhez.

Mi várható a jövőben?

Az NVIDIA nem áll meg a Blackwell Ultra fejlesztésénél: a Vera Rubin NVL72 rendszerrel a következő generációs teljesítményrobbanás is küszöbön áll. Ez a platform akár tízszeres throughput-növekedést hozhat megawattanként a Blackwellhez képest, miközben a költségeket tovább csökkentheti. Ezzel az NVIDIA újabb lépést tesz afelé, hogy az AI egyre összetettebb feladatokat oldjon meg, egyre hatékonyabban és elérhetőbb áron.