-
Robotikai mesterséges intelligencia beágyazott rendszerekre optimalizálva
A robotika és mesterséges intelligencia (MI) egyre szorosabban fonódnak össze, különösen a beágyazott rendszerek területén, ahol a számítási kapacitás és energiahatékonyság komoly korlátokat szab. Az NXP legújabb tapasztalatai alapján most betekintést nyerhetünk, hogyan lehet hatékonyan rögzíteni robotikai adatokat, finomhangolni a Vision–Language–Action (VLA) modelleket, és optimalizálni a működést egy olyan speciális processzoron, mint az NXP i.MX 95. Megbízható adatgyűjtés: az alapok Akármilyen fejlett MI-rendszerről legyen szó, a siker kulcsa a minőségi és konzisztens adatgyűjtés. Az NXP szakértői szerint nem az a lényeg, hogy minél több adatot halmozzunk fel, hanem hogy azok egységesek és megbízhatóak legyenek. A robotkar által végzett feladatok során például a kamerák állandó pozíciója elengedhetetlen, hogy ne csússzon el…
-
LeRobot v0.5.0 – A robotika új dimenziói Magyarországon is
A LeRobot v0.5.0 verziója az eddigi legátfogóbb frissítés, amely egyszerre bővíti a támogatott hardverek, a mesterséges intelligencia modellek és a fejlesztőeszközök körét. A projekt immár nem csupán robotkarokat, hanem teljes humanoid robotokat is irányít, miközben a szoftveres háttér is jelentősen korszerűsödött. Ha érdekel a robotika legújabb irányzata, érdemes közelebbről is megismerkedni az újításokkal. Teljes humanoid robot támogatás a Unitree G1-gyel A legizgalmasabb fejlesztés a Unitree G1 humanoid robot teljes integrációja, amely a LeRobot történetének első ilyen irányú bővítése. Ez nem csupán egy új robotkar vagy mobil egység, hanem egy komplex, egész testet érintő vezérlés, amely lehetővé teszi a robot járását, tájékozódását és finom mozdulatokkal történő tárgykezelést is. A teleoperációs interfész…
-
Hatékonyabb megerősítéses tanulás: 16 nyílt forráskódú könyvtár tanulságai
A mesterséges intelligencia és a gépi tanulás egyik legizgalmasabb területe ma a megerősítéses tanulás (reinforcement learning, RL), amely folyamatosan fejlődik, hogy a nagy modellek és komplex környezetek igényeit is kiszolgálja. A hagyományos, szinkronizált RL-tréning azonban egyre kevésbé hatékony, hiszen a modellgenerálás (inferencia) időigényesebb, mint maga a tanítás, így a drága GPU-k sokszor tétlenül várakoznak. Ez a probléma vezette a kutatókat és fejlesztőket arra, hogy az aszinkron (async) tréningarchitektúrák felé forduljanak, melyekben a generálás és a tanítás külön erőforrásokon, párhuzamosan fut, hogy a teljes rendszer kihasználtsága javuljon. Szinkronból aszinkronba: miért vált kritikus a váltás? A hagyományos RL-tréningek során a modell egy adott batch adaton egyszerre fut át, majd a paramétereket frissítik,…
-
Az új NVIDIA NeMo Retriever: a jövő agentikus keresőrendszere
Az NVIDIA NeMo Retriever csapata új szintre emelte a dokumentumkeresést egy innovatív agentikus kereső pipeline-nal, amely nemcsak a ViDoRe v3 versenyen szerezte meg az első helyet, hanem a komplex gondolkodást igénylő BRIGHT ranglistán is a második helyen végzett. Ez az új megközelítés túllép a hagyományos szemantikai hasonlóságon, és dinamikusan alkalmazkodik a különböző típusú feladatokhoz, így jelentősen megnöveli a keresőmotorok általános használhatóságát és hatékonyságát. Miért nem elég a szemantikai hasonlóság? A hagyományos információkeresők többsége a szemantikai hasonlóságra épít, vagyis arra, hogy a lekérdezés és a dokumentumok közötti nyelvi hasonlóságot mérje. Ez a módszer jól működik egyszerűbb, homogén adatbázisok esetén, de a valós üzleti környezetek sokkal összetettebbek. Itt nem elég csupán releváns…
-
Hogyan készíts egyszerű RAG rendszert Pythonban lépésről lépésre
Az utóbbi időben a Retrieval-Augmented Generation, azaz RAG, egyre nagyobb figyelmet kap az AI és a nagyméretű nyelvi modellek világában. A RAG lényege, hogy a nyelvi modellek válaszadása nem csupán a bennük rejlő tudáson alapul, hanem kiegészül külső információforrásokból származó releváns adatokkal. Ez a megközelítés jelentősen javítja a modellek pontosságát és alkalmazhatóságát, legyen szó akár kérdés-válasz rendszerekről, chatbotokról vagy tartalomgenerálásról. Ebben a cikkben egy egyszerű RAG rendszer megalkotását mutatom be lépésről lépésre Python nyelven, az ollama eszköz segítségével. Mi is az a RAG valójában? Egy hagyományos chatbot vagy nyelvi modell önmagában csak az általa betanult adatok alapján válaszol, ami gyakran korlátozza a tudását, különösen ha specifikus vagy friss információkra lenne…
-
Pruna 0.3.2: Új algoritmusok és hatékonyabb modellezés
A mesterséges intelligencia modellek optimalizálása folyamatosan fejlődik, és ebben a folyamatban kiemelkedő szerepet játszik a nyílt forráskódú Pruna keretrendszer. A legfrissebb, 0.3.2-es verzióval a Pruna újabb mérföldkőhöz érkezett, hiszen jelentősen bővült az algoritmusok és optimalizációs eszközök tárháza, miközben az összeférhetőség és a használhatóság is javult. Ez az update nem csak új funkciókat hoz, hanem a már meglévő családokat is tovább fejleszti, így még több lehetőséget kínál a modellek hatékonyabb futtatására. Bővülő algoritmuscsaládok és új megoldások A Pruna 0.3.2 legnagyobb újdonsága a jelentős algoritmuskészlet-bővítés. Az optimalizációs eszköztár mostantól számos új algoritmust és egész új algoritmuscsaládokat tartalmaz, mint például a Decoders, Distillers, Enhancers és Recoverers. Ezek az új családok különböző megközelítésekkel segítik…
-
ShopRLVE-GYM: Intelligens e-kereskedelmi asszisztensek új generációja
Az e-kereskedelem rohamos fejlődésével egyre fontosabbá válik, hogy a vásárlói élmény gördülékeny és hatékony legyen. Bár a nagy nyelvi modellek már képesek folyékony beszélgetésekre, a gyakorlati alkalmazásban, például egy digitális vásárlósegéd szerepében, még mindig akadnak korlátok. A ShopRLVE-GYM nevű új kutatási projekt ezt a problémát célozza meg azzal, hogy az automatizált e-kereskedelmi asszisztensek képzését egy új, adaptív és megbízható környezetben valósítja meg. Miért fontos a megerősítéses tanulás az e-kereskedelemben? A hagyományos felügyelt tanulással (supervised fine-tuning) a modelleket példák alapján tanítják meg bizonyos feladatokra, például termékkeresésre vagy egyszerű kérdések megválaszolására. Azonban a valós vásárlói helyzetek gyakran összetettek: több egymást követő kérdésből álló párbeszéd, több szűrőfeltétel, részleges információk, vagy éppen egy rendelés…
-
OpenMed: Nyílt forráskódú orvosi AI forradalom fél év után
Az OpenMed projekt alig fél éve indult, mégis komoly hullámokat kelt az orvosi mesterséges intelligencia világában. Egy tapasztalt fejlesztő és kutató egy ebédszünetben kezdte el, hogy megmutassa: a klinikai AI nem kell, hogy drága, zárt rendszerek mögé rejtőzzön. A nyílt forráskódú megoldások lehetőségei már most olyan szintre értek, hogy bátran versenyezhetnek a kereskedelmi termékekkel, és egyre több kutató, fejlesztő, valamint egészségügyi szakember fedezi fel őket. Az OpenMed útja és alapjai 2025 júliusában, több mint húsz évnyi tapasztalat után az OpenMed megalkotója elindított egy nyílt forráskódú projektet, amely több mint 380 orvosi nyelvi modellből áll. Ezek a modellek különféle klinikai szövegek elemzésére képesek, legyen szó gyógyszerészeti vagy kémiai entitások felismeréséről. Ami…
-
TiRex: az ipari előrejelzések új gyors és energiatakarékos bajnoka
A mindennapjainkat átszövő időbeli adatsorok egyre fontosabb szerepet játszanak nemcsak a magánéletünkben, hanem az ipari folyamatokban is. Az időalapú előrejelző modellek gyors és megbízható működése kulcsfontosságú, különösen akkor, ha ezeket gyengébb hardvereken, például ipari PLC-ken vagy beágyazott rendszereken kell futtatni. Az NXAI legújabb laboratóriumi tesztjei során a TiRex nevű modell teljesítményét vizsgálták különféle eszközökön, és az eredmények azt mutatják, hogy egy új generációs alapmodell született, amely ideális lehet az ipari környezetek számára. Miért fontos az edge-kompatibilis időalapú modell? Az időbeli adatsorok, vagyis a time series adatok elemzése manapság szinte minden területen jelen van: a gyártásban, az energiaszektorban, a logisztikában vagy akár az egészségügyben. Ezeknek az adatsoroknak a pontos előrejelzése segíti…
-
Kanon 2 Reranker: Az új csúcstartó a jogi RAG rendszerekben
A jogi szférában egyre nagyobb az igény a gyors és pontos információkeresésre, hiszen a hatalmas mennyiségű jogi dokumentum között a releváns adatokat megtalálni nem egyszerű feladat. Ebben segít a Kanon 2 Reranker, amely a legújabb fejlesztéseknek köszönhetően az egyik legerősebb modell a jogi Retrieval-Augmented Generation (RAG) rendszerek világában. Ez az új eszköz jelentősen javítja a keresési pontosságot és a releváns jogi tartalmak előtérbe helyezését. Kanon 2 Reranker – miért kiemelkedő? A Kanon 2 Reranker jelenleg a legjobb teljesítményt nyújtó modell a jogi RAG alkalmazások között, amit a Legal RAG Bench nevű benchmark teszt is egyértelműen alátámaszt. Ebben a versenyszámban 9 százalékkal előzi meg a Qwen 3 Reranker 8B modellt, és…