• Mesterséges intelligencia

    Antonio Torralba és három MIT-alumni az ACM 2025-ös díjazottjai között

    Antonio Torralba, az MIT mesterséges intelligencia és döntéshozatal szakértője, valamint három, a Massachusettsi Műszaki Egyetemen végzett alumnus is bekerült az Association for Computing Machinery (ACM) 2025-ös díjazottjai közé. Ez a rangos elismerés a számítástechnika és az információtechnológia területén kiemelkedő eredményeket elért szakembereknek szól, akik tudományos és szakmai munkájukkal jelentős hatást gyakoroltak az iparágra és a tudományos közösségre. Antonio Torralba kutatási irányai és szakmai pályája Torralba professzor a MIT Elektronikai és Számítástudományi Tanszékén dolgozik, emellett ő vezeti az egyetem mesterséges intelligencia és döntéshozatal területi kutatásait. Kutatásai középpontjában a számítógépes látás, a gépi tanulás és az emberi látásérzékelés állnak. Célja olyan rendszerek fejlesztése, amelyek képesek az emberi szemhez hasonlóan értelmezni és feldolgozni…

  • Mesterséges intelligencia

    GIST: Forradalmi megoldás az okos adatminta kiválasztására

    A modern gépi tanulás robbanásszerű fejlődése egyre nagyobb és összetettebb adatállományok feldolgozását követeli meg, ami komoly kihívások elé állítja a kutatókat és fejlesztőket. Nagy nyelvi modellek vagy számítógépes látás rendszerek esetében nem egyszerű feladat hatékonyan kezelni az elképesztő mennyiségű adatot, amelyet a tanuláshoz felhasználnak. Éppen ezért egyre fontosabbá válik a megfelelő adatminta kiválasztása, azaz egy kisebb, reprezentatív adatcsoport kijelölése, amely elegendő információt biztosít a modell hatékony kiképzéséhez. A kihívás: a diverzitás és hasznosság összehangolása Az adatminta kiválasztásának lényege, hogy megtaláljuk az egyensúlyt az adatpontok sokszínűsége és a hasznosságuk között. A diverzitás azt jelenti, hogy a kiválasztott pontok ne legyenek egymáshoz túl hasonlóak, így nem pazaroljuk az erőforrásokat ismétlődő információkra. A…

  • Mesterséges intelligencia

    WAXAL: Nyitott adatbázis afrikai nyelvű beszédfeldolgozáshoz

    A hangvezérelt technológiák, mint a virtuális asszisztensek vagy az automatikus átírás, forradalmasították a számítógépes interakciókat. Ugyanakkor ezek az újítások elsősorban a világ legelterjedtebb és legtöbb erőforrással rendelkező nyelveit támogatják, így több százmillió ember – különösen Szaharától délre fekvő Afrikában, ahol több mint 2000 nyelv él – nem tudja anyanyelvén használni ezeket a lehetőségeket. Ezt a jelentős egyenlőtlenséget kívánja kezelni a Google Research több éves munkája nyomán létrejött WAXAL projekt, amely egy nagyszabású, nyílt hozzáférésű beszédadatbázist hozott létre 27 afrikai nyelven. Mi az a WAXAL? A WAXAL egy olyan adatgyűjtemény, amely több mint 100 millió anyanyelvi beszélő által használt afrikai nyelvet fed le, és amelyet több mint 26 országban használnak. A…

  • Mesterséges intelligencia

    Sequential Attention: Az AI modellek gyorsabb és hatékonyabb működése

    A mesterséges intelligencia fejlődésével párhuzamosan egyre nagyobb kihívást jelent, hogy a gépi tanulás és a mélytanulás során megtaláljuk a legfontosabb bemeneti jellemzőket, azaz a feature-ket. Ezek a jellemzők a modell teljesítményének sarokkövei, ám a nagy mennyiségű adat és a bonyolult, nemlineáris összefüggések miatt a kiválasztásuk nem egyszerű feladat. A Google kutatói által kifejlesztett Sequential Attention (Szekvenciális Figyelem) egy innovatív megoldás, amely képes hatékonyan és gyorsan megtalálni a legértékesebb részeket anélkül, hogy a modell pontosságából engedne. A feature kiválasztás nehézségei a modern AI-ban A feature selection, vagyis a jellemzők kiválasztása alapvető lépés a gépi tanulásban, amikor a lényegtelen vagy ismétlődő információkat igyekszünk kiszűrni a bemeneti adatok közül. Ez azonban matematikailag egy…

  • Mesterséges intelligencia

    Google AI: személyre szabott intelligencia és oktatási újítások 2026-ban

    Januárban a Google ismét jelentős előrelépéseket mutatott be mesterséges intelligencia fejlesztéseiben, amelyek nemcsak a mindennapi digitális élményt teszik gördülékenyebbé, hanem az oktatásban és a kreatív munkafolyamatokban is új lehetőségeket nyitnak meg. Az elmúlt több mint két évtizedben a vállalat folyamatosan fektetett be az AI és gépi tanulás kutatásába, hogy olyan termékeket alkosson, amelyek valóban segítik a felhasználókat. Az idei év első hónapjában a fókusz a „Személyes Intelligencia” új korszakának elindításán volt, amely a kereséstől a levelezésen át a böngészésig minden területen megjelenik. „Személyes Intelligencia” a mindennapokban A Google Gemini alkalmazásában januárban debütált a „Személyes Intelligencia” funkció, amely lehetővé teszi, hogy a Gmail, Google Fotók, YouTube és a Kereső alkalmazások biztonságosan…

  • Mesterséges intelligencia

    AWS és NVIDIA új szintre emeli az AI infrastruktúrát 2026-ban

    Az AI fejlesztése napjaink egyik legdinamikusabb területe, ahol már nem elég a kísérletezés: a vállalatoknak megbízható, nagy teljesítményű és biztonságos rendszerekre van szükségük, amelyek valódi üzleti eredményeket hoznak. Ezt a kihívást ismerte fel az AWS és az NVIDIA, akik a 2026-os NVIDIA GTC konferencián bejelentették stratégiai együttműködésük bővítését. Az új technológiai integrációk az AI megoldások fejlesztését és zavartalan működtetését segítik elő a gyakorlatban, akár a legnagyobb méretű modellek esetében is. Több mint egymillió NVIDIA GPU világszerte az AWS felhőjében 2026-tól az AWS több mint egymillió új NVIDIA GPU-val bővíti globális adatközpontjait, beleértve a legújabb Blackwell és Rubin GPU architektúrákat. Ez az eddigi legnagyobb GPU-kínálat, amelyet egyetlen felhőszolgáltató biztosít az AI…

  • Mesterséges intelligencia

    Hatékony offline feature store építése Amazon SageMaker-rel

    A gépi tanulás (ML) korszerű alkalmazásában az egyik legnagyobb kihívás a jellemzők, vagyis a „feature”-ök kezelése és skálázható menedzsmentje. Gyakran előfordul, hogy a különböző csapatok, legyenek azok adatmérnökök, adatkutatók vagy ML üzemeltetők, elkülönült adatfolyamokat és eltérő definíciókat használnak, ami megnehezíti az együttműködést és a megbízható modellezést. Ha nincs központosított rendszer a jellemzők tárolására és újrafelhasználására, akkor a modellek könnyen elavult vagy nem összehangolt adatokon tanulhatnak, ami pontatlan eredményekhez és adatkezelési problémákhoz vezethet. Mi az az offline feature store és miért fontos? Az offline feature store egy olyan strukturált adattár, amely történeti jellemzőadatokat tárol a modellek képzéséhez és validálásához. Ez a megoldás biztosítja, hogy az adatok pontosan időhöz kötötten, konzisztensen álljanak…

  • Mesterséges intelligencia

    Mesterséges adatokkal erősített Python-tudás a nagy nyelvi modellekben

    A nagy nyelvi modellek (LLM-ek) fejlesztése során nem csupán az adat mennyisége, hanem annak minősége és célzott jellege is kulcsfontosságú. Bár a jelenlegi előképzési adathalmazok hatalmas információtömeget tartalmaznak, gyakran hiányzik belőlük az a koncepcionális fókusz, amely például a programozási képességek vagy a logikai következtetés fejlesztéséhez szükséges. Egy új kutatási megközelítés most ezt a hiányt igyekszik pótolni: egy olyan skálázható, koncepció-alapú szintetikus adatgenerálási folyamatot dolgoztak ki, amely lehetővé teszi a specifikus készségek célzott erősítését. Az első eredményként 15 millió Python programozási feladatból álló mesterséges adatbázist hoztak létre, amely a Nemotron-Pretraining-Code-Concepts névre hallgat, és a Nemotron-Pretraining-Specialized-v1.1 adatcsomag része. Célzott adatgenerálás a programozási tudás mélyítésére A fejlesztők egy alaposan felépített, hierarchikus programozási fogalomtaxonómiára…

  • Mesterséges intelligencia

    Claude Opus 4.6: Új szint az AI-alapú pénzügyi elemzésekben

    Az AI technológia egyre mélyebben hatol be a pénzügyi szektor mindennapjaiba, és ennek egyik legfrissebb bizonyítéka a Claude Opus 4.6 megjelenése. Ez az új verzió jelentős előrelépést hoz a pénzügyi döntéshozatal támogatásában, hiszen nemcsak hogy pontosabb elemzéseket készít, de komplex feladatok során is megőrzi fókuszát, miközben kiváló minőségű, professzionális eredményeket produkál. A fejlesztés különlegessége, hogy nem csak egyetlen területre koncentrál, hanem a többfeladatos munkavégzést és a hosszabb, lépésről lépésre haladó folyamatokat is magabiztosan kezeli. Hatékonyabb kutatás és elemzés a pénzügyekben A pénzügyi szakemberek számára az egyik legfontosabb feladat a releváns információk gyors és pontos összegyűjtése, elemzése, majd ezek alapján értékelhető anyagok létrehozása. A Claude Opus 4.6 ebben mindhárom területen kiemelkedő…

  • Mesterséges intelligencia

    Forradalmi módszer: szövegből képet tanítanak 24 óra alatt

    A mesterséges intelligencia és a gépi tanulás területén az elmúlt években hatalmas fejlődés zajlott le, különösen a szövegből képet generáló modellek esetében. Egy új kutatás most megmutatja, hogy ezek a modellek nem csak egyre pontosabbak, hanem képzésük is sokkal gyorsabbá és költséghatékonyabbá vált. A PRX Part 3 projekt keretében a kutatók egy mindössze 24 órás „speedrun” során tanítottak be egy text-to-image modellt, amelyhez eddig akár millió dolláros költségek is társultak. Gyors és hatékony képzés a pixel térben A korábbi, hagyományos modellek általában több lépcsőben tanultak, kezdve az alacsonyabb felbontású képektől, majd fokozatosan növelve azt. Ezzel szemben a PRX csapata rögtön 512 pixeles felbontással indított, majd finomhangolták a modellt 1024 pixeles…