-
NEO-unify: Az új generációs natív multimodális mesterséges intelligencia
Az elmúlt években a multimodális mesterséges intelligencia (AI) egyik legnagyobb kihívása az volt, hogyan lehet egyszerre hatékonyan feldolgozni és összekapcsolni a vizuális és szöveges információkat. A hagyományos megközelítésekben külön modulokat használtak a képek és a szövegek kezelésére, például látásfeldolgozó kódereket (VE) és generatív variációs autoenkódereket (VAE), amelyek gyakran kompromisszumokra kényszerítették a modell teljesítményét. Most azonban a SenseTime és a NTU közös fejlesztése, a NEO-unify egy teljesen új paradigma felé nyit utat, amely natív módon, end-to-end tanulással dolgozik, és elhagyja a korábbi előfeldolgozó rétegeket. Mi az a NEO-unify? A NEO-unify egy forradalmian új multimodális AI modell, amely nem használ sem látásfeldolgozó kódereket, sem variációs autoenkódereket. Ehelyett közvetlenül, közel veszteségmentes formában dolgozza…