Mesterséges intelligencia

  • Mesterséges intelligencia

    MARL: Új middleware csökkenti az LLM-ek tévedéseit finomhangolás nélkül

    A mesterséges intelligencia nyelvi modellek (LLM-ek) rohamos fejlődése ellenére továbbra is jelentős kihívást jelent a „hallucináció”, azaz a téves vagy kitalált válaszok előállítása. A MARL nevű új runtime middleware azonban egy merőben újszerű megoldást kínál erre a problémára – anélkül, hogy magukat a modelleket finomhangolni kellene. Ez a szoftverréteg azonnal alkalmazható bármilyen OpenAI API-kompatibilis LLM-re, legyen az GPT-5.4, Claude, Gemini vagy akár a nyílt forráskódú Llama. Mi áll a MARL mögött? A metakognitív szakadék áthidalása A MARL fejlesztői az úgynevezett „metakognitív szakadékra” (MA-ER Gap) fókuszáltak, amely arra a képességre utal, hogy a mesterséges intelligencia felismerje saját hibáit és képes legyen azokat javítani. Bár a mai legfejlettebb LLM-ek már elképesztő pontossággal…

  • Mesterséges intelligencia

    NEO-unify: Az új generációs natív multimodális mesterséges intelligencia

    Az elmúlt években a multimodális mesterséges intelligencia (AI) egyik legnagyobb kihívása az volt, hogyan lehet egyszerre hatékonyan feldolgozni és összekapcsolni a vizuális és szöveges információkat. A hagyományos megközelítésekben külön modulokat használtak a képek és a szövegek kezelésére, például látásfeldolgozó kódereket (VE) és generatív variációs autoenkódereket (VAE), amelyek gyakran kompromisszumokra kényszerítették a modell teljesítményét. Most azonban a SenseTime és a NTU közös fejlesztése, a NEO-unify egy teljesen új paradigma felé nyit utat, amely natív módon, end-to-end tanulással dolgozik, és elhagyja a korábbi előfeldolgozó rétegeket. Mi az a NEO-unify? A NEO-unify egy forradalmian új multimodális AI modell, amely nem használ sem látásfeldolgozó kódereket, sem variációs autoenkódereket. Ehelyett közvetlenül, közel veszteségmentes formában dolgozza…

  • Mesterséges intelligencia

    Így hódította meg az NVIDIA AI-Q a DeepResearch ranglistákat

    Az NVIDIA AI-Q mélytanuló kutatóügynöke nemrégiben az első helyet szerezte meg mindkét DeepResearch Bench I és II ranglistán, amelyek a legfontosabb mércéknek számítanak a kutatóügynökök teljesítményének értékelésében. Ez a siker nem csupán egyéni győzelem: jól mutatja, hogy egy nyílt, konfigurálható és fejlesztőbarát rendszer képes a mesterséges intelligencia kutatás élvonalába kerülni. Az AI-Q egy olyan újítás, amely megmutatja, hogy a vállalati és webes adatokat feldolgozó, jól idézhető, átlátható válaszokat adó AI-ügynökök jövője ma már elérhető közelségben van. Miért fontos a két benchmark együttes megnyerése? A DeepResearch Bench I és II két különböző, de egymást kiegészítő szempont alapján értékeli a kutatóügynököket. Az első benchmark a jelentések minőségét vizsgálja, kiemelve a részletességet, az…

  • Mesterséges intelligencia

    Smol AI WorldCup: Kis modellek, nagy meglepetések az AI világában

    Az elmúlt években az AI fejlesztések középpontjában a hatalmas nyelvi modellek álltak, amelyek több milliárd paraméterrel dolgoznak, és komoly erőforrásokat igényelnek. Ám a valódi kihívás ma már nem csak a hatalmas számítási kapacitású szervereken futó modellek versenye, hanem az úgynevezett „edge AI” – vagyis a kisebb, helyben futó, energiatakarékos megoldások fejlesztése. Ebben a versenyben mutatkozik be a Smol AI WorldCup, az első benchmark, amely kifejezetten a kis nyelvi modellek éles környezetben való teljesítményét méri. Miért volt szükség új mérőszámra? A hagyományos AI benchmarkok, mint az MMLU vagy a HumanEval, általában csak az intelligenciára fókuszálnak, vagyis arra, mennyire „okos” egy modell. Ez azonban kevés, ha a modellt például egy okostelefonon vagy…

  • Mesterséges intelligencia

    Voxtral Transcribe 2: Villámgyors és pontos beszédfelismerés 13 nyelven

    A beszédfelismerő technológiák fejlődése újabb mérföldkőhöz érkezett a Voxtral legújabb, Transcribe 2 névre keresztelt megoldásával. Ez a fejlett rendszer két különféle modellt kínál: a Voxtral Mini Transcribe V2-t, amelyet elsősorban felvétel alapú, nagy mennyiségű adat feldolgozására terveztek, valamint a Voxtral Realtime-ot, amely élő, valós idejű alkalmazásokhoz készült. Mindkettő kimagasló pontosságot, többnyelvűséget és gyorsaságot ígér, miközben a költséghatékonyság terén is kiemelkedik. Voxtral Realtime: valós idejű beszédfelismerés alacsony késleltetéssel A Voxtral Realtime különlegessége a valósidejű, stream-alapú architektúrában rejlik, amely nem csak az offline modellek darabokra bontott feldolgozását alkalmazza, hanem azonnal, a hang beérkezésével párhuzamosan végzi a transzkripciót. Ez azt jelenti, hogy a késleltetés akár 200 milliszekundum alá is csökkenthető, ami forradalmi újítás…

  • Mesterséges intelligencia

    Kétszer gyorsabb AI-inferencia a Character.ai-nál az AMD és DigitalOcean segítségével

    A mesterséges intelligencia által vezérelt alkalmazásoknál az alacsony késleltetés és a magas feldolgozási kapacitás kulcsfontosságú. A Character.ai, amely világszerte mintegy 20 millió felhasználóval büszkélkedhet, ezért lépett partnerségre az AMD-vel és a DigitalOcean-nal, hogy jelentősen javítsák a GPU-alapú inferencia teljesítményét és csökkentsék az üzemeltetési költségeket. A közös munka eredményeként a csapatok képesek voltak megduplázni a termelési inferencia áteresztőképességet, miközben megtartották a szigorú késleltetési feltételeket. Az együttműködés háttere és céljai A Character.ai többféle modellt használ, köztük a Qwen és a Mistral modelleket, hogy kiszolgálja felhasználóit. A projekt fókuszában a Qwen3-235B Instruct FP8 modell állt, amelyet a DigitalOcean AMD Instinct™ MI300X és MI325X GPU platformján futtattak. A cél az volt, hogy egy nyolc…

  • Mesterséges intelligencia

    Fedezd fel az új AI szórakozás világát a c.ai labs-szel!

    Az AI alapú szórakoztatás új korszakába léphetünk a c.ai labs megjelenésével, amely nem csupán egy új platform, hanem egy kreatív kísérletezőtér is. A c.ai labs célja, hogy túllépjen a hagyományos csevegős AI-élményeken, és egészen friss, játékos, innovatív módokon hozza életre a mesterséges intelligenciával alkotott karaktereket. Ez egy olyan közösségi terep, ahol az ötletek születnek, formálódnak, és ahol a felhasználók aktívan alakíthatják az AI szórakoztató funkcióit. Mi az a c.ai labs? A c.ai labs egy új platform, amelyet kifejezetten a kreatív AI-élmények kibővítésére hoztak létre. Itt az ötletek még korai stádiumban jelennek meg, így a fejlesztők gyorsan tudnak tanulni a közösség visszajelzéseiből, és ez alapján finomítani tudják a funkciókat. Nem minden…

  • Mesterséges intelligencia

    Így formálja át az AI a filmkészítést a Tribeca Fesztiválon

    A filmipar egyre inkább átveszi az új, mesterséges intelligencián (AI) alapuló eszközök adta lehetőségeket, és a Tribeca Fesztivál 2024-ben különösen fókuszál erre a trendre. A Runway nevű innovatív technológiai cég együttműködésével a fesztivál bemutatja, hogyan integrálhatók az AI-megoldások a filmkészítés minden szakaszába, legyen szó forgatókönyvírásról, szerkesztésről, vizuális effektekről vagy hangtervezésről. Ez az együttműködés izgalmas betekintést nyújt abba, miként változtatja meg a digitális forradalom a történetmesélést. AI a filmes alkotás új eszköztárában A Tribeca Fesztivál és a Runway közös programjának középpontjában olyan rövidfilmek állnak, amelyek létrehozásában jelentős szerepet játszott a mesterséges intelligencia. Ezek a filmek nem csupán vizuálisan lenyűgözőek, hanem kreatív módon használják ki az AI nyújtotta lehetőségeket, legyen szó forgatókönyv…

  • Mesterséges intelligencia

    Professzionális piaci adatok elérhetőek magyarul is a Perplexity-n

    Az üzleti döntések megalapozásához ma már elengedhetetlen a megbízható, mélyreható piaci és pénzügyi információ. A legtöbb vállalat azonban csak korlátozottan fér hozzá a szakmai előfizetéses adatbázisokhoz, amelyek pontosabb képet adnak a versenytársakról, a piac méretéről vagy éppen a befektetési lehetőségekről. Ezen a helyzeten változtat a Perplexity újításaként bevezetett Premium Sources funkció, amely közvetlenül integrálja a legfontosabb prémium adatforrásokat a keresési folyamatba. Mi is az a Premium Sources? A Premium Sources olyan fizetős, szakmai adatbázisokat és kutatásokat takar, amelyek nem érhetők el egyszerű webes kereséssel. Ezek az anyagok a legmagasabb szintű piaci és pénzügyi intelligenciát nyújtják, amelyeket a kockázati tőkealapok, magántőke befektetők, hedge fundok és a Fortune 500-as cégek stratégiai csapatai…

  • Mesterséges intelligencia

    Perplexity Search API: pontosabb keresés és dinamikus benchmarkok

    A keresési technológiák folyamatos fejlődése újabb mérföldkőhöz érkezett a Perplexity csapatának legfrissebb fejlesztései kapcsán. Az idei szeptemberben bemutatott Search API technológiai háttere és az open-source search_evals értékelő keretrendszer óriási előrelépést hozott a keresési találatok relevanciájában és méretoptimalizálásában. A fejlesztők célja az volt, hogy a keresőmotor által visszaadott szövegrészletek – vagyis a snippetek – minél pontosabban tükrözzék a lekérdezés tartalmát, miközben a lehető legkevesebb felesleges információt tartalmazzák. Új megközelítés: szövegdarabok szintű értékelés A snippetek minőségének javításához a Perplexity mérnökei egy teljesen új értékelési rendszert dolgoztak ki, amely nem pusztán a dokumentum egészét, hanem annak kisebb szakaszait, úgynevezett span-eket vizsgálja. Ez a módszer lehetővé teszi, hogy a rendszer külön kategóriákba sorolja a…