• Mesterséges intelligencia

    Innovatív technikák a nagyméretű AI-modellek hatékony tanításához

    A mesterséges intelligencia fejlődésével párhuzamosan egyre nagyobb és összetettebb modellek kifejlesztése vált szükségessé. A Character.ai korai kutatócsapata éppen ezen dolgozott, hogy a nagyméretű transzformer-alapú modellek előképzését gyorsabbá és hatékonyabbá tegye. Az általuk kidolgozott módszerek közül most több is nyilvánosságra került, betekintést engedve abba, hogyan lehet erőforrásokat spórolva megőrizni a modell pontosságát és stabilitását. Hatékony kommunikáció: a Squinch algoritmus A Squinch egy különleges, 6 bites gradiens-kompressziós technika, melyet Noam Shazeer, a Character.ai társalapítója fejlesztett ki. Ez az algoritmus lehetővé tette, hogy a hálózaton átvitt adatmennyiséget jelentősen csökkentsék anélkül, hogy a modell teljesítménye romlott volna. Emiatt a csapat olyan számítógépes klasztereken is tudott hatékonyan dolgozni, ahol a sávszélesség töredéke volt a mai…