Az NVIDIA új Nemotron 3 Super modellje forradalmasítja az ügynökalapú MI-t
Az NVIDIA nemrég mutatta be legújabb fejlesztését, a Nemotron 3 Super modellt, amely egy óriási, 120 milliárd paraméterből álló nyílt forráskódú mesterséges intelligencia rendszer. A modell különlegessége, hogy csak 12 milliárd paraméter aktív egyidejűleg, így képes hatékonyan és gyorsan kezelni a komplex, többügynökös AI alkalmazásokat. Ez a megoldás radikálisan megnöveli a feldolgozási kapacitást és pontosságot, miközben csökkenti a működési költségeket – így széles körben alkalmazható a jövő intelligens rendszereiben.
Új szint a többügynökös rendszerekben
A többügynökös mesterséges intelligencia alkalmazások eddig komoly kihívásokkal szembesültek, főként a kontextus menedzselése és a folyamatos, komplex logikai lépések miatt. Egy hosszabb munkafolyamat során akár 15-ször több adatot kell feldolgozni, mint egy egyszerű csevegőbot esetén, ami jelentősen megdrágítja és lassítja a működést. Ezen túl a „gondolkodási költség” is nagy teher, hiszen minden részfeladat megoldása extra számításokat igényel, amelyek visszafogják a rendszer gyorsaságát és hatékonyságát.
A Nemotron 3 Super ezt a problémát egy óriási, egymillió tokenes kontextusablakkal oldja meg, amely lehetővé teszi, hogy az AI megőrizze az egész munkafolyamat állapotát anélkül, hogy elveszítené a fókuszt az eredeti célról. Ez a megoldás egyedülálló pontosságot és stabilitást nyújt, amivel a modell az élmezőnybe került az Artificial Analysis hatékonysági rangsorában.
Hibrid architektúra és újítások
A Nemotron 3 Super egy hibrid, úgynevezett mixture-of-experts (MoE) architektúrát használ, amely három fő technológiai újítást fog össze. A Mamba rétegek négyszeres memória- és számítási hatékonyságot biztosítanak, míg a hagyományos transzformer rétegek gondoskodnak a fejlett érvelési képességekről. A MoE megoldás révén a modell csak az aktív 12 milliárd paramétert használja, a többi pedig „alvó” állapotban marad, így jelentősen csökken az energiaigény és a működési költség.
Emellett a Latent MoE technológia lehetővé teszi, hogy egyetlen token generálásához négy szakértői modult aktiváljon egyszerre, növelve ezzel a pontosságot. A többtokenes előrejelzés pedig akár háromszoros gyorsulást hoz az inferencia folyamatban. Az új modell az NVIDIA Blackwell hardverplatformon fut NVFP4 pontossági szinten, ami tovább csökkenti a memóriaigényt és négyszer gyorsabb működést tesz lehetővé az előző generációs rendszerekhez képest.
Nyílt hozzáférés és széles körű alkalmazások
Az NVIDIA nemcsak a technológiát hozta el, hanem a teljes modellt, az adathalmazokat és a tanítási módszertanokat is nyíltan elérhetővé tette egy engedékeny licenc alatt. Ez azt jelenti, hogy fejlesztők és kutatók saját céljaikra is alakíthatják a Nemotron 3 Supert, akár helyi gépeken, akár felhőben futtatva.
A modell már most számos területen bizonyít: a szoftverfejlesztő ügynökök képesek egyszerre betölteni teljes kódbázisokat, így az automatikus kódgenerálás és hibakeresés hatékonyabbá válik. A pénzügyi elemzésekben pedig több ezer oldalnyi jelentést tud egyszerre kezelni, így jelentősen gyorsítva az adatfeldolgozást. A magas pontosságú eszközhívások révén az autonóm rendszerek, például a kibervédelemben használatos biztonsági automatizmusok is megbízhatóbbá válnak.
Hol érhető el a Nemotron 3 Super?
A Nemotron 3 Super modell több platformon és szolgáltatón keresztül érhető el, többek között az NVIDIA saját build.nvidia.com oldalán, továbbá a Perplexity és OpenRouter szolgáltatásokon, valamint a Hugging Face-en keresztül. A Dell Technologies és a Hewlett Packard Enterprise is integrálja a modellt saját AI megoldásaiba, hogy megkönnyítse a vállalati szintű AI-alapú munkafolyamatok bevezetését.
Emellett az olyan felhőszolgáltatók, mint a Google Cloud Vertex AI, az Oracle Cloud Infrastructure, az Amazon Bedrock (hamarosan) és a Microsoft Azure is támogatják a modellt, ami megkönnyíti a skálázható, többügynökös AI rendszerek bevezetését a legkülönbözőbb iparágakban.
Az NVIDIA továbbá teljes körű dokumentációt és oktatóanyagokat is kínál, amelyek segítségével bárki elmélyedhet a Nemotron 3 Super képességeiben, és saját projektjeihez igazíthatja azt. A részleteket és a legfrissebb híreket az NVIDIA Nemotron 3 Super blogon követhetik az érdeklődők.