• Mesterséges intelligencia

    Sequential Attention: Az AI modellek gyorsabb és hatékonyabb működése

    A mesterséges intelligencia fejlődésével párhuzamosan egyre nagyobb kihívást jelent, hogy a gépi tanulás és a mélytanulás során megtaláljuk a legfontosabb bemeneti jellemzőket, azaz a feature-ket. Ezek a jellemzők a modell teljesítményének sarokkövei, ám a nagy mennyiségű adat és a bonyolult, nemlineáris összefüggések miatt a kiválasztásuk nem egyszerű feladat. A Google kutatói által kifejlesztett Sequential Attention (Szekvenciális Figyelem) egy innovatív megoldás, amely képes hatékonyan és gyorsan megtalálni a legértékesebb részeket anélkül, hogy a modell pontosságából engedne. A feature kiválasztás nehézségei a modern AI-ban A feature selection, vagyis a jellemzők kiválasztása alapvető lépés a gépi tanulásban, amikor a lényegtelen vagy ismétlődő információkat igyekszünk kiszűrni a bemeneti adatok közül. Ez azonban matematikailag egy…

  • Mesterséges intelligencia

    Hatékonyabb skill-fejlesztés: tesztelj, mérj és finomíts Claude képességeit

    Az AI-alapú munkafolyamatokban egyre nagyobb szerephez jutnak az úgynevezett „skill”-ek, vagyis speciális képességek, amelyekkel a modellek egyedi feladatokat képesek elvégezni. A Claude.ai most új eszközöket kínál a skill-creator funkció továbbfejlesztésére, amelyek segítségével nemcsak létrehozhatjuk, de folyamatosan tesztelhetjük, mérhetjük és finomhangolhatjuk is ezeket a készségeket. Ez a megoldás különösen hasznos azok számára, akik nem programozók, hanem inkább szakértők a saját területükön, és szeretnék biztosítani, hogy a skill-ek mindig a legjobb formájukat hozzák a modellek fejlődése mellett is. Kétféle skill – kétféle megközelítés A skill-ek alapvetően két kategóriába sorolhatók. Az első típus a képességnövelő skill-ek, amelyek olyan funkciókat valósítanak meg, amit az alapmodell vagy nem tud, vagy csak következetlenül tud elvégezni. Például…

  • Mesterséges intelligencia

    Asztalra költözik a szuperintelligencia: NVIDIA DGX Spark és Station

    Az mesterséges intelligencia fejlődése soha nem látott sebességgel zajlik, és az NVIDIA legújabb asztali AI szuperszámítógépei, a DGX Spark és DGX Station, ezt a lendületet hivatottak még tovább fokozni. Ezek a rendszerek lehetővé teszik, hogy a fejlesztők, kutatók és vállalatok helyben, akár az irodájukban vagy otthonukban futtassák a legújabb, nyílt forráskódú és élvonalbeli AI modelleket – legyen szó akár 100 milliárd vagy egészen 1 billió paraméteres modellekről. Asztali AI teljesítmény a csúcson Korábban az ilyen hatalmas modellek futtatásához hatalmas adatközpontokra volt szükség, ám az NVIDIA Grace Blackwell architektúrája, a nagy kapacitású egyesített memória és a petaflopos számítási teljesítmény most mindezt elhozza az asztalunkra. A DGX Spark egy plug-and-play megoldás, amely…