Mesterséges intelligencia

  • Mesterséges intelligencia

    Egy fájlban az egész webalkalmazás: Gradio gr.HTML új lehetőségei

    A Gradio legújabb frissítése csendben, de annál nagyobb erővel érkezett: a gr.HTML komponens mostantól támogatja a testreszabott sablonokat, a scoped CSS-t és a JavaScript interaktivitást. Ez azt jelenti, hogy egyetlen Python fájlban megírhatunk teljes webalkalmazásokat – frontend, backend és állapotkezelés egy helyen. Így a fejlesztők és AI-rajongók akár egyetlen körben megkaphatják a teljes működő appot, amelyet aztán azonnal telepíthetnek a Hugging Face Spaces platformjára. Termelékenységi és üzleti alkalmazások egyszerűen Az új gr.HTML képességeivel különféle alkalmazásokat próbáltak ki, amelyek mind egyetlen Python fájlban működnek, és semmilyen bonyolult build-folyamatra nincs szükség. Például egy Pomodoro időzítőt is létrehoztak, ahol egy pixel-art fa növekszik a munka előrehaladtával – a magból kis hajtás, majd lomb,…

  • Mesterséges intelligencia

    A llama.cpp és a GGML csatlakozik a Hugging Face-hez a helyi AI jövőjéért

    A mesterséges intelligencia fejlődése egyre inkább a helyi futtatás, vagyis a Local AI irányába tolódik el, ahol a modellek nem felhőben, hanem közvetlenül a felhasználó eszközén futnak. Ebben a folyamatban kiemelt szerepet játszik a nyílt forráskódú llama.cpp projekt, amelyet a GGML csapata fejleszt. Nemrégiben bejelentették, hogy a GGML és a llama.cpp hivatalosan is csatlakozik a Hugging Face-hez (HF), hogy ezzel biztosítsák a projekt hosszú távú fenntarthatóságát és fejlődését. Mi változik a llama.cpp és a közösség számára? A GGML mögött álló Georgi Gerganov és csapata immár a Hugging Face keretein belül folytatja munkáját, amely elsősorban a közösség támogatására és a projekt skálázására fókuszál. A helyi AI egyre nagyobb lendületet kap, és…

  • Mesterséges intelligencia

    Modular Diffusers: az új generációs, moduláris diffúziós csövek felépítése

    A mesterséges intelligencia és a generatív modellek fejlődésével egyre nagyobb az igény a rugalmas, testreszabható megoldások iránt. A Modular Diffusers egy friss fejlesztés, amely teljesen új megközelítést kínál a diffúziós pipeline-ok építéséhez: ahelyett, hogy az egész folyamatot egyben írnánk meg, moduláris, újrahasznosítható blokkokból rakhatjuk össze a kívánt munkafolyamatokat. Ez a megoldás nemcsak egyszerűbbé, hanem sokkal átláthatóbbá és testreszabhatóbbá is teszi a munkát. Mi az a Modular Diffusers és hogyan működik? A Modular Diffusers lényege, hogy a hagyományos DiffusionPipeline osztály mellett egy sokkal rugalmasabb, komponálható alternatívát ad a felhasználók kezébe. A pipeline-t nem egy monolitikus egészként kezeljük, hanem különálló blokkokból építjük fel, melyek mindegyike saját bemenetekkel, kimenetekkel és működési logikával rendelkezik.…

  • Mesterséges intelligencia

    LeRobot v0.5.0 – A robotika új dimenziói Magyarországon is

    A LeRobot v0.5.0 verziója az eddigi legátfogóbb frissítés, amely egyszerre bővíti a támogatott hardverek, a mesterséges intelligencia modellek és a fejlesztőeszközök körét. A projekt immár nem csupán robotkarokat, hanem teljes humanoid robotokat is irányít, miközben a szoftveres háttér is jelentősen korszerűsödött. Ha érdekel a robotika legújabb irányzata, érdemes közelebbről is megismerkedni az újításokkal. Teljes humanoid robot támogatás a Unitree G1-gyel A legizgalmasabb fejlesztés a Unitree G1 humanoid robot teljes integrációja, amely a LeRobot történetének első ilyen irányú bővítése. Ez nem csupán egy új robotkar vagy mobil egység, hanem egy komplex, egész testet érintő vezérlés, amely lehetővé teszi a robot járását, tájékozódását és finom mozdulatokkal történő tárgykezelést is. A teleoperációs interfész…

  • Mesterséges intelligencia

    Robotikai mesterséges intelligencia beágyazott rendszerekre optimalizálva

    A robotika és mesterséges intelligencia (MI) egyre szorosabban fonódnak össze, különösen a beágyazott rendszerek területén, ahol a számítási kapacitás és energiahatékonyság komoly korlátokat szab. Az NXP legújabb tapasztalatai alapján most betekintést nyerhetünk, hogyan lehet hatékonyan rögzíteni robotikai adatokat, finomhangolni a Vision–Language–Action (VLA) modelleket, és optimalizálni a működést egy olyan speciális processzoron, mint az NXP i.MX 95. Megbízható adatgyűjtés: az alapok Akármilyen fejlett MI-rendszerről legyen szó, a siker kulcsa a minőségi és konzisztens adatgyűjtés. Az NXP szakértői szerint nem az a lényeg, hogy minél több adatot halmozzunk fel, hanem hogy azok egységesek és megbízhatóak legyenek. A robotkar által végzett feladatok során például a kamerák állandó pozíciója elengedhetetlen, hogy ne csússzon el…

  • Mesterséges intelligencia

    Hatékonyabb megerősítéses tanulás: 16 nyílt forráskódú könyvtár tanulságai

    A mesterséges intelligencia és a gépi tanulás egyik legizgalmasabb területe ma a megerősítéses tanulás (reinforcement learning, RL), amely folyamatosan fejlődik, hogy a nagy modellek és komplex környezetek igényeit is kiszolgálja. A hagyományos, szinkronizált RL-tréning azonban egyre kevésbé hatékony, hiszen a modellgenerálás (inferencia) időigényesebb, mint maga a tanítás, így a drága GPU-k sokszor tétlenül várakoznak. Ez a probléma vezette a kutatókat és fejlesztőket arra, hogy az aszinkron (async) tréningarchitektúrák felé forduljanak, melyekben a generálás és a tanítás külön erőforrásokon, párhuzamosan fut, hogy a teljes rendszer kihasználtsága javuljon. Szinkronból aszinkronba: miért vált kritikus a váltás? A hagyományos RL-tréningek során a modell egy adott batch adaton egyszerre fut át, majd a paramétereket frissítik,…

  • Mesterséges intelligencia

    Az új NVIDIA NeMo Retriever: a jövő agentikus keresőrendszere

    Az NVIDIA NeMo Retriever csapata új szintre emelte a dokumentumkeresést egy innovatív agentikus kereső pipeline-nal, amely nemcsak a ViDoRe v3 versenyen szerezte meg az első helyet, hanem a komplex gondolkodást igénylő BRIGHT ranglistán is a második helyen végzett. Ez az új megközelítés túllép a hagyományos szemantikai hasonlóságon, és dinamikusan alkalmazkodik a különböző típusú feladatokhoz, így jelentősen megnöveli a keresőmotorok általános használhatóságát és hatékonyságát. Miért nem elég a szemantikai hasonlóság? A hagyományos információkeresők többsége a szemantikai hasonlóságra épít, vagyis arra, hogy a lekérdezés és a dokumentumok közötti nyelvi hasonlóságot mérje. Ez a módszer jól működik egyszerűbb, homogén adatbázisok esetén, de a valós üzleti környezetek sokkal összetettebbek. Itt nem elég csupán releváns…

  • Mesterséges intelligencia

    Hogyan készíts egyszerű RAG rendszert Pythonban lépésről lépésre

    Az utóbbi időben a Retrieval-Augmented Generation, azaz RAG, egyre nagyobb figyelmet kap az AI és a nagyméretű nyelvi modellek világában. A RAG lényege, hogy a nyelvi modellek válaszadása nem csupán a bennük rejlő tudáson alapul, hanem kiegészül külső információforrásokból származó releváns adatokkal. Ez a megközelítés jelentősen javítja a modellek pontosságát és alkalmazhatóságát, legyen szó akár kérdés-válasz rendszerekről, chatbotokról vagy tartalomgenerálásról. Ebben a cikkben egy egyszerű RAG rendszer megalkotását mutatom be lépésről lépésre Python nyelven, az ollama eszköz segítségével. Mi is az a RAG valójában? Egy hagyományos chatbot vagy nyelvi modell önmagában csak az általa betanult adatok alapján válaszol, ami gyakran korlátozza a tudását, különösen ha specifikus vagy friss információkra lenne…

  • Mesterséges intelligencia

    Pruna 0.3.2: Új algoritmusok és hatékonyabb modellezés

    A mesterséges intelligencia modellek optimalizálása folyamatosan fejlődik, és ebben a folyamatban kiemelkedő szerepet játszik a nyílt forráskódú Pruna keretrendszer. A legfrissebb, 0.3.2-es verzióval a Pruna újabb mérföldkőhöz érkezett, hiszen jelentősen bővült az algoritmusok és optimalizációs eszközök tárháza, miközben az összeférhetőség és a használhatóság is javult. Ez az update nem csak új funkciókat hoz, hanem a már meglévő családokat is tovább fejleszti, így még több lehetőséget kínál a modellek hatékonyabb futtatására. Bővülő algoritmuscsaládok és új megoldások A Pruna 0.3.2 legnagyobb újdonsága a jelentős algoritmuskészlet-bővítés. Az optimalizációs eszköztár mostantól számos új algoritmust és egész új algoritmuscsaládokat tartalmaz, mint például a Decoders, Distillers, Enhancers és Recoverers. Ezek az új családok különböző megközelítésekkel segítik…

  • Mesterséges intelligencia

    ShopRLVE-GYM: Intelligens e-kereskedelmi asszisztensek új generációja

    Az e-kereskedelem rohamos fejlődésével egyre fontosabbá válik, hogy a vásárlói élmény gördülékeny és hatékony legyen. Bár a nagy nyelvi modellek már képesek folyékony beszélgetésekre, a gyakorlati alkalmazásban, például egy digitális vásárlósegéd szerepében, még mindig akadnak korlátok. A ShopRLVE-GYM nevű új kutatási projekt ezt a problémát célozza meg azzal, hogy az automatizált e-kereskedelmi asszisztensek képzését egy új, adaptív és megbízható környezetben valósítja meg. Miért fontos a megerősítéses tanulás az e-kereskedelemben? A hagyományos felügyelt tanulással (supervised fine-tuning) a modelleket példák alapján tanítják meg bizonyos feladatokra, például termékkeresésre vagy egyszerű kérdések megválaszolására. Azonban a valós vásárlói helyzetek gyakran összetettek: több egymást követő kérdésből álló párbeszéd, több szűrőfeltétel, részleges információk, vagy éppen egy rendelés…