• Mesterséges intelligencia

    Tucano 2: Nyílt forráskódú nyelvi modellek a portugál nyelvért

    A mesterséges intelligencia világában az angol nyelv uralkodik, ám a globálisan több száz millióan beszélt portugál nyelv gyakran háttérbe szorul a nyílt forráskódú nyelvi modellek fejlesztése során. Ezt a hiányt igyekszik betölteni a Tucano 2 projekt, amely egy teljesen átlátható, a portugál nyelv sajátosságaira optimalizált nyelvi modellcsaládot hozott létre 0,5 milliárdtól egészen 3,7 milliárd paraméterig. Ebben a cikkben bemutatjuk, hogyan született meg ez a kezdeményezés, milyen kihívásokkal szembesültek a fejlesztők, és miért lehet ez mérföldkő a nyílt nyelvi modellek között. Miért van szükség portugál specifikus modellekre? Bár a nagy, többnyelvű modellek, mint például a Qwen3, Gemma 3 vagy Falcon 3 tartalmaznak portugál nyelvű adatokat, ezek nem igazán optimalizáltak a nyelv…