-
IBM Granite 4.0 1B Speech: Kompakt, többnyelvű és az élvonalban az edge eszközökre
Az IBM legújabb beszédfelismerő modellje, a Granite 4.0 1B Speech, egy igazi mérföldkő a vállalati alkalmazások számára optimalizált, erőforrás-korlátozott eszközök világában. Ez a kompakt, mégis rendkívül hatékony modell nemcsak a hangfelismerés pontosságát emeli új szintre, hanem a többnyelvű támogatás és a gyors működés terén is komoly előrelépést hoz. Az IBM új fejlesztése a korábbi verziók paraméterszámának felével dolgozik, miközben még jobb eredményeket produkál, így ideális választás lehet az edge computingban rejlő lehetőségek kiaknázására. Többnyelvű és hatékony – új mércéket állít fel az ASR terén A Granite 4.0 1B Speech egyik legfőbb újdonsága, hogy most már hat nyelvet támogat, köztük az angolt, franciát, németet, spanyolt, portugált és japánt. Ez különösen fontos…
-
Voxtral Transcribe 2: Villámgyors és pontos beszédfelismerés 13 nyelven
A beszédfelismerő technológiák fejlődése újabb mérföldkőhöz érkezett a Voxtral legújabb, Transcribe 2 névre keresztelt megoldásával. Ez a fejlett rendszer két különféle modellt kínál: a Voxtral Mini Transcribe V2-t, amelyet elsősorban felvétel alapú, nagy mennyiségű adat feldolgozására terveztek, valamint a Voxtral Realtime-ot, amely élő, valós idejű alkalmazásokhoz készült. Mindkettő kimagasló pontosságot, többnyelvűséget és gyorsaságot ígér, miközben a költséghatékonyság terén is kiemelkedik. Voxtral Realtime: valós idejű beszédfelismerés alacsony késleltetéssel A Voxtral Realtime különlegessége a valósidejű, stream-alapú architektúrában rejlik, amely nem csak az offline modellek darabokra bontott feldolgozását alkalmazza, hanem azonnal, a hang beérkezésével párhuzamosan végzi a transzkripciót. Ez azt jelenti, hogy a késleltetés akár 200 milliszekundum alá is csökkenthető, ami forradalmi újítás…