Mesterséges intelligencia

  • Mesterséges intelligencia

    OpenMed: Nyílt forráskódú orvosi AI forradalom fél év után

    Az OpenMed projekt alig fél éve indult, mégis komoly hullámokat kelt az orvosi mesterséges intelligencia világában. Egy tapasztalt fejlesztő és kutató egy ebédszünetben kezdte el, hogy megmutassa: a klinikai AI nem kell, hogy drága, zárt rendszerek mögé rejtőzzön. A nyílt forráskódú megoldások lehetőségei már most olyan szintre értek, hogy bátran versenyezhetnek a kereskedelmi termékekkel, és egyre több kutató, fejlesztő, valamint egészségügyi szakember fedezi fel őket. Az OpenMed útja és alapjai 2025 júliusában, több mint húsz évnyi tapasztalat után az OpenMed megalkotója elindított egy nyílt forráskódú projektet, amely több mint 380 orvosi nyelvi modellből áll. Ezek a modellek különféle klinikai szövegek elemzésére képesek, legyen szó gyógyszerészeti vagy kémiai entitások felismeréséről. Ami…

  • Mesterséges intelligencia

    Kanon 2 Reranker: Az új csúcstartó a jogi RAG rendszerekben

    A jogi szférában egyre nagyobb az igény a gyors és pontos információkeresésre, hiszen a hatalmas mennyiségű jogi dokumentum között a releváns adatokat megtalálni nem egyszerű feladat. Ebben segít a Kanon 2 Reranker, amely a legújabb fejlesztéseknek köszönhetően az egyik legerősebb modell a jogi Retrieval-Augmented Generation (RAG) rendszerek világában. Ez az új eszköz jelentősen javítja a keresési pontosságot és a releváns jogi tartalmak előtérbe helyezését. Kanon 2 Reranker – miért kiemelkedő? A Kanon 2 Reranker jelenleg a legjobb teljesítményt nyújtó modell a jogi RAG alkalmazások között, amit a Legal RAG Bench nevű benchmark teszt is egyértelműen alátámaszt. Ebben a versenyszámban 9 százalékkal előzi meg a Qwen 3 Reranker 8B modellt, és…

  • Mesterséges intelligencia

    TiRex: az ipari előrejelzések új gyors és energiatakarékos bajnoka

    A mindennapjainkat átszövő időbeli adatsorok egyre fontosabb szerepet játszanak nemcsak a magánéletünkben, hanem az ipari folyamatokban is. Az időalapú előrejelző modellek gyors és megbízható működése kulcsfontosságú, különösen akkor, ha ezeket gyengébb hardvereken, például ipari PLC-ken vagy beágyazott rendszereken kell futtatni. Az NXAI legújabb laboratóriumi tesztjei során a TiRex nevű modell teljesítményét vizsgálták különféle eszközökön, és az eredmények azt mutatják, hogy egy új generációs alapmodell született, amely ideális lehet az ipari környezetek számára. Miért fontos az edge-kompatibilis időalapú modell? Az időbeli adatsorok, vagyis a time series adatok elemzése manapság szinte minden területen jelen van: a gyártásban, az energiaszektorban, a logisztikában vagy akár az egészségügyben. Ezeknek az adatsoroknak a pontos előrejelzése segíti…

  • Mesterséges intelligencia

    Az AlphaFold forradalma: hogyan változtatja meg az AI a fehérje-kutatást?

    2024 októberében a kémiai Nobel-díjat először ítélték oda elsősorban mesterséges intelligencia kutatóknak: Demis Hassabis és John Jumper, a Google DeepMind szakemberei kapták meg az elismerést az AlphaFold fejlesztéséért. Ez a mélytanuló rendszer megoldotta azt a több évtizedes biológiai rejtélyt, amit fehérjék hajtogatási problémájaként ismerünk. Az AlphaFold sikere nem csupán a tudományos közösséget rázta meg, hanem az egész gyógyszerkutatás, az enzimgyártás és a génterápia területét is radikálisan átalakítja. Az AI és a biológia találkozása A fehérjék az élet alapvető építőkövei, melyeket 20 különböző aminosav „betű” alkot. Egy-egy fehérje akár több száz aminosavból is állhat, és a funkciója attól függ, hogy ezek a láncok miként hajlanak össze háromdimenziós formává. Bár a DNS-ben…

  • Mesterséges intelligencia

    GRPO, DAPO és GSPO: Az RL fejlődése a nyelvi modellekben

    A nagy nyelvi modellek (LLM-ek) fejlesztése során a megerősítéses tanulás (Reinforcement Learning, RL) kulcsszerepet játszik abban, hogy a modellek egyre kifinomultabb és relevánsabb válaszokat adjanak. A korábban domináns PPO (Proximal Policy Optimization) módszer azonban számos korlátba ütközött, különösen hosszú szövegek és összetett feladatok esetén. Ezen kihívások miatt születtek meg a GRPO, DAPO és GSPO algoritmusok, melyek célja a hatékonyabb, stabilabb és skálázhatóbb megerősítéses tanulás megvalósítása. A GRPO újragondolása A GRPO (Generalized Ratio Policy Optimization) azzal vált ismertté, hogy eltávolította a PPO értékmódellől való függőségét. Ez nagy előrelépés, hiszen a value modellek hiányosságai korlátozták a PPO alkalmazhatóságát, főleg hosszú szövegek esetében. A GRPO lényege a fontossági arány (importance ratio) használata, amely…

  • Mesterséges intelligencia

    KV caching: a Transformer modellek gyorsabb szöveggenerálása

    Az utóbbi években a Transformer alapú nyelvi modellek, mint a GPT, forradalmasították a mesterséges intelligencia világát, különösen a természetes nyelv feldolgozásában. Ugyanakkor ezek a modellek gyakran nagyon erőforrás-igényesek, különösen a szöveggenerálás során, amikor minden egyes új szó előállításához az összes korábbi lépést újra kell számolni. Ezt a problémát oldja meg a KV caching, vagyis a kulcs-érték gyorsítótárazás, amely hatékonyabbá teszi a modell működését azáltal, hogy nem ismétli meg fölöslegesen az előző számításokat. Mi az a KV caching és miért fontos? Amikor egy Transformer alapú modell új szöveget generál, minden egyes új token előállításakor újraszámolja a figyelem (attention) mechanizmus köztes értékeit, azaz a kulcsokat (key) és értékeket (value). Ez a folyamat…

  • Mesterséges intelligencia

    Az első nyílt platform az arab beszédszintetizálás értékelésére

    Az arab nyelvű szöveg-beszéd átalakítás (TTS) területén a minőség megítélése mindig is nagy kihívást jelentett a nyelv dialektikus sokszínűsége miatt. Egy friss kezdeményezés, az Arabic TTS Arena azonban új irányt mutat, hiszen a sakkozásból ismert Elo-rendszert alkalmazza, hogy közösségi alapon rangsorolja a beszédszintetizáló modelleket. Ez az innovatív megközelítés lehetővé teszi, hogy a felhasználók saját fülükre hagyatkozva döntsenek arról, melyik hangszintézis a legtermészetesebb, legkifejezőbb az arab nyelv különböző változataiban. Hogyan működik az Arabic TTS Arena? A rendszer egyszerű, mégis rendkívül hatékony: a felhasználó beír egy arab nyelvű mondatot, majd két véletlenszerűen kiválasztott TTS-modell által generált hangfelvételt hallgat meg. A modellek identitása rejtve marad, így a szavazás teljesen pártatlan. A hallgatók eldönthetik,…

  • Mesterséges intelligencia

    Így gondolkodik egy adatkutató: NVIDIA új AI megoldása tarolt a DABStep-en

    Az adatelemzés világa egyre komplexebb kihívásokat támaszt a mesterséges intelligencia rendszereivel szemben. Bár a szöveges információk feldolgozása ma már jól fejlett terület, a strukturált, táblázatos adatok mélyreható elemzése komoly nehézséget jelent a kutató ügynökök számára. Az NVIDIA KGMON (NeMo Agent Toolkit) Data Explorer projektje most azonban egy olyan új megközelítést kínál, amely forradalmasíthatja az adatintenzív kutatást, és első helyezést ért el a DABStep benchmarkon, miközben 30-szor gyorsabb, mint a korábbi legjobb megoldás. Az NVIDIA KGMON Data Explorer architektúrája Az NVIDIA fejlesztői egy különleges, autonóm adatelemző ügynököt alkottak, amely képes komplex, több lépéses gondolkodásra, eszközhívásokra és iteratív elemzésre. A rendszer két fő alkalmazási területre fókuszál: nyílt végű exploratív adatfeltárásra (Exploratory Data…

  • Mesterséges intelligencia

    Mesterséges intelligencia értékelés: új keretrendszer a zavaros benchmarkok helyett

    A mesterséges intelligencia (MI) fejlődése elképesztő ütemben zajlik, ám az értékelés terén egyre több probléma merül fel. A jelenlegi benchmarkok, vagyis a modellek teljesítményét mérő tesztek rendszere egyre inkább telítődik, ami megnehezíti a különbségtételt a legjobb modellek között. Emellett az értékelések forrásai gyakran átláthatatlanok, és az egyes képességek külön-külön mérve nem adják vissza egy adott MI-rendszer teljes komplexitását. Egy friss kutatás ezért egy egységes, 5 tengelyes intelligencia keretrendszert és egy háromszintű megbízhatósági rendszert javasol, amelyek átfogóbb és hitelesebb képet nyújtanak. Benchmark telítettség és az átláthatóság hiánya Az elmúlt években a legnépszerűbb tesztek, mint az MMLU, olyan magas szintekre jutottak, hogy a csúcskategóriás modellek teljesítménye szinte megkülönböztethetetlenné vált. Ezért új, nehezebb…

  • Mesterséges intelligencia

    Hogyan szabadíthatjuk fel a cenzúrázott nyelvi modelleket abliteration segítségével?

    Az utóbbi években a mesterséges intelligenciával működő nyelvi modellek, például a Llama harmadik generációja, egyre kifinomultabbá váltak az utasítások megértésében és követésében. Ezeket a modelleket azonban erősen cenzúrázzák, hogy elkerüljék a káros vagy etikailag problematikus válaszokat. A gyakori „As an AI assistant, I cannot help you” típusú elutasítási reakciók ugyan fontos biztonsági elemek, de jelentősen korlátozzák a modell rugalmasságát és alkalmazhatóságát. Ebben a cikkben egy rendkívül érdekes módszert mutatunk be, az úgynevezett abliteration technikát, amely lehetővé teszi bármely nyelvi modell cenzúrájának eltávolítását anélkül, hogy újra kellene tanítani a modellt. Mi az az abliteration és hogyan működik? Az abliteration egy olyan beavatkozás, amely a modell elutasító viselkedésének idegi nyomát, az úgynevezett…