Mesterséges intelligencia

  • Mesterséges intelligencia

    Forradalmi LLM-inferencia az AWS-en az llm-d segítségével

    Az mesterséges intelligencia fejlődése új korszakba lépett, ahol a nagy nyelvi modellek (LLM-ek) nem csupán egyszerű válaszokat adnak, hanem összetett gondolatmeneteket és agentikus folyamatokat futtatnak. Ez azonban jelentős kihívásokat támaszt az inferencia, vagyis a modellválaszok generálásának hatékonysága terén. Az AWS és az llm-d fejlesztőcsapata közösen dolgozik egy olyan megoldáson, amely lehetővé teszi az LLM-ek skálázható, hatékony és költségoptimalizált futtatását. Az új disaggregált inferencia technológia forradalmasíthatja a nagy nyelvi modellek üzemeltetését, különösen azoknál a vállalatoknál, ahol a teljesítmény és a költségek kulcsfontosságúak. Mi az az llm-d és miért fontos? Az llm-d egy nyílt forráskódú, Kubernetes-kompatibilis keretrendszer, amely a vLLM motorra épül, és kifejezetten a nagy nyelvi modellek elosztott futtatására fejlesztették ki.…

  • Mesterséges intelligencia

    Hogyan gyorsította fel a Ricoh az intelligens dokumentumfeldolgozást az AWS-sel

    A Ricoh nemrég áttörő lépést tett az intelligens dokumentumfeldolgozás terén, amikor az AWS felhőszolgáltatásaira építve egy skálázható, AI-alapú megoldást alkotott. A vállalat célja az volt, hogy a hagyományos, sok kézi beavatkozást igénylő folyamatokat automatizálva jelentősen lerövidítse az ügyfélbevezetési időt, miközben növeli a feldolgozott dokumentumok számát és a rendszer megbízhatóságát. Az új platform a generatív mesterséges intelligenciát, a szerver nélküli architektúrát és szabványosított keretrendszereket ötvözve válaszolja meg a modern vállalati kihívásokat, így a Ricoh ügyfelei már napok alatt végezhetik el azt, ami korábban hetekbe telt. Az egészségügyi szektor dokumentumkezelési kihívásai A Ricoh egészségügyi üzletága több mint 200 országban szolgál ki nagy egészségbiztosítókat, kezelő szervezeteket és egészségügyi szolgáltatókat. Naponta több száz ezer…

  • Mesterséges intelligencia

    Új generációs AI-modell: NVIDIA Nemotron 3 Nano az Amazon Bedrockon

    Az NVIDIA legújabb, fejlett nyelvi modellje, a Nemotron 3 Nano mostantól elérhető az Amazon Bedrock platformján, teljesen menedzselt és szerver nélküli szolgáltatásként. Ez a lépés nagy előrelépést jelent a generatív mesterséges intelligencia alkalmazások fejlesztésében, mivel a fejlesztőknek nem kell többé az infrastruktúra bonyodalmaival bajlódniuk, miközben kihasználhatják a modell kimagasló képességeit. Mi az a Nemotron 3 Nano? A Nemotron 3 Nano egy kisméretű nyelvi modell, amely a Mixture-of-Experts (MoE) hibrid architektúráját használja, így ötvözi a hatékony számítási teljesítményt és a magas pontosságot. Ez a modell különösen jól teljesít kódolási feladatokban, tudományos következtetésekben, matematikai problémák megoldásában, valamint eszközök hívásában és utasítások követésében. Az átláthatóság jegyében a modell súlyai, az adatbázisok és az…

  • Mesterséges intelligencia

    Hogyan válik hatékonnyá az Agentic AI a vállalatoknál?

    Az Agentic AI, vagyis az önálló ügynökként működő mesterséges intelligencia, egyre nagyobb teret nyer a vállalati működésben. Az AWS Generative AI Innovation Center legfrissebb elemzése szerint azonban nem pusztán a technológia jelenti a legnagyobb kihívást, hanem az, hogy miként integrálják és működtetik ezt az újfajta intelligens rendszert a szervezeten belül. A siker kulcsa pedig az, hogy pontosan meghatározzuk, kinek milyen szerepe és felelőssége van az Agentic AI bevezetésében és napi használatában. Az üzleti vezetők: mérhető eredményekre fókuszáljanak Ha Ön egy üzleti egység vagy profitközpont vezetője, akkor nem egy újabb technológiai kütyüre van szüksége, hanem arra, hogy az AI megoldás közvetlenül javítsa a kulcsfontosságú mutatókat, például csökkentse a nyitott ügyeket, rövidítse…

  • Mesterséges intelligencia

    Hatékony offline feature store építése Amazon SageMaker-rel

    A gépi tanulás (ML) korszerű alkalmazásában az egyik legnagyobb kihívás a jellemzők, vagyis a „feature”-ök kezelése és skálázható menedzsmentje. Gyakran előfordul, hogy a különböző csapatok, legyenek azok adatmérnökök, adatkutatók vagy ML üzemeltetők, elkülönült adatfolyamokat és eltérő definíciókat használnak, ami megnehezíti az együttműködést és a megbízható modellezést. Ha nincs központosított rendszer a jellemzők tárolására és újrafelhasználására, akkor a modellek könnyen elavult vagy nem összehangolt adatokon tanulhatnak, ami pontatlan eredményekhez és adatkezelési problémákhoz vezethet. Mi az az offline feature store és miért fontos? Az offline feature store egy olyan strukturált adattár, amely történeti jellemzőadatokat tárol a modellek képzéséhez és validálásához. Ez a megoldás biztosítja, hogy az adatok pontosan időhöz kötötten, konzisztensen álljanak…

  • Mesterséges intelligencia

    Megnyílt az út a szövegből képre modellek nyílt forrású fejlesztése felé

    Új mérföldkőhöz érkezett a mesterséges intelligencia egyik legizgalmasabb területe, a szövegből képet generáló modellek világában. A PhotoRoom csapata nemrégiben megosztotta nyílt forráskódú text-to-image modelljét, a PRX-et, amely egy újabb bizonyíték arra, hogy az AI fejlesztése egyre inkább közösségi alapokon nyugszik. Ez a lépés nem csak a technológia iránt érdeklődők számára jelent izgalmas lehetőséget, hanem a szakmai kutatók és fejlesztők számára is, akik mélyebben szeretnének beleásni a szövegből képet alkotó rendszerek működésébe. PRX: nem csak egy új modell, hanem egy komplett fejlesztési folyamat A PRX nem csupán egy újabb neurális hálózat a sok közül, hanem egy olyan projekt, amely a teljes fejlesztési folyamatot – az ötleteléstől a finomhangolásig – nyilvánossá teszi.…

  • Mesterséges intelligencia

    SILMA TTS: Könnyű kétnyelvű beszédszintetizáló modell

    Az AI és a természetes nyelvi technológiák világában egyre nagyobb figyelmet kapnak a beszédszintetizáló rendszerek, vagyis a text-to-speech (TTS) modellek. Ezek az eszközök lehetővé teszik, hogy a gép által generált hang természetes módon szólaljon meg, legyen szó akár asszisztensekről, oktatási anyagokról vagy akadálymentesítési megoldásokról. Nemrégiben a SILMA AI bemutatta legújabb fejlesztését, a SILMA TTS v1-et, amely egy könnyű, mindössze 150 millió paraméteres, kétnyelvű modell, amely kiválóan kezeli az arab és az angol nyelvet. Ez a megoldás különösen fontos lépés a kevésbé támogatott nyelvek számára, miközben nyílt forráskódú koncepciójával széles körben elérhetővé teszi a legmodernebb technológiát. Miért volt szükség a SILMA TTS-re? Az arab nyelv világszerte több mint 400 millió beszélővel…

  • Mesterséges intelligencia

    Hatékonyabb nyelvi modellek a normatartó biprojektált ablációval

    A mesterséges intelligencia fejlődése során egyre nagyobb hangsúlyt kap a nyelvi modellek biztonságos működése, különösen a visszautasító (refusal) viselkedések kezelése. Ezek a viselkedések, amikor a modell nem kívánt vagy káros tartalmakra nem reagál, kulcsfontosságúak a megbízhatóság szempontjából. Egy új, úgynevezett normatartó biprojektált ablációs technika jelentős előrelépést hozhat ezen a téren, miközben javítja a modellek érvelési képességeit is. Mi az abláció és miért fontos? Az abláció alapvetően egy olyan módszer, amely a nyelvi modellek aktivációs terében található „visszautasítási irányokat” célozza meg, hogy eltávolítsa a nem kívánt viselkedéseket. Ezt a korábbi megközelítések egyetlen átlagos visszautasítási irány alapján végezték, ami ugyan hatékony volt, de nem vette figyelembe a visszautasítás és a károsság elkülönülését.…

  • Mesterséges intelligencia

    Bemutatkozik a Mistral Small 4: az új nyitott AI csúcsteljesítmény

    A Mistral csapata bemutatta legújabb fejlesztését, a Mistral Small 4-et, amely egyetlen modellben egyesíti a korábbi zászlóshajóik legjobb tulajdonságait. Ez az innovatív hibrid AI képes egyszerre kezelni a gyors válaszokat, a mély komplex gondolkodást és a multimodális feladatokat, vagyis egyszerre érti a szöveget és a képeket is. A Mistral Small 4 nyílt forráskódú, Apache 2.0 licenc alatt érhető el, így bárki számára testreszabható és elérhető, ami tovább erősíti a nyílt és együttműködésen alapuló mesterséges intelligencia fejlesztések iránti elkötelezettséget. Az összetett képességek új mércéje A Mistral Small 4 egy igazi univerzális AI-modell, amely egyszerre alkalmas általános beszélgetésekre, bonyolult kódolási feladatokra, ügynöki működésre és komolyabb érvelésre is. Az architektúrája lehetővé teszi, hogy…

  • Mesterséges intelligencia

    Hogyan válik valóban hasznossá az Agentic AI a vállalatoknál?

    Az Agentic AI nem csupán egy bekapcsolható funkció, hanem alapvető változást hoz abba, hogy miként definiáljuk a munkát, kik végzik el, és hogyan születnek a döntések. Sok cég tapasztalja meg ezt a nehéz úton: amikor az AI-prototípusok a valós folyamatok, rendszerek és szabályozások közé kerülnek, gyakran megakadnak. Vannak homályos felhasználási esetek, adatproblémák, autonómia és kontroll egyensúlyának hiánya, valamint megfelelőségi akadályok, amelyek miatt a pilotok nem jutnak túl a tesztfázison. A legnagyobb kihívás azonban az, hogy nem születik világos konszenzus arról, mit is jelent a siker. Miért nem működik az AI, ha nem változtatunk a működésen? Sok vállalat azt hiszi, hogy egy új AI-modell vagy szolgáltató hiányzik ahhoz, hogy áttörést érjen…