Intelligens AI fejlesztés szakértelemmel az Amazon Nova Forge segítségével

Az utóbbi években a nagy nyelvi modellek (LLM-ek) jelentős előrelépést tettek az általános feladatok megoldásában, azonban a speciális, iparági vagy vállalati adatokkal kapcsolatos munkákban még mindig komoly kihívásokkal néznek szembe. A szakértői finomhangolás (supervised fine-tuning, SFT) teszi lehetővé, hogy egy alapmodell alkalmazkodjon az adott szervezet egyedi igényeihez, de ennek két eltérő módszere létezik: a paraméterhatékony finomhangolás (PEFT), amely csak a modell egy részét frissíti, és a teljes paraméterfrissítés, azaz full-rank SFT, ami minden paramétert átdolgoz. Míg az előbbi gyorsabb és olcsóbb, addig a teljes finomhangolás több domain-specifikus tudást képes beépíteni – ám ezzel együtt gyakran jelentkezik a „katasztrofális felejtés” problémája, amikor a modell elveszíti általános tudását és képességeit.

Az Amazon Nova Forge megoldása

Az Amazon Nova Forge egy új szolgáltatás, amely lehetővé teszi, hogy a vállalatok saját, személyre szabott mesterséges intelligencia modelljeiket építsék fel a Nova platformon. A különlegessége, hogy a fejlesztők korai modell-ellenőrzőpontokról indulhatnak, és a saját titkos adataikat kombinálhatják az Amazon által válogatott tanítóanyagokkal. Így nemcsak a domain-specifikus tudás épül be, hanem a modell megtartja általános intelligenciáját és instrukciókövető képességeit is, miközben biztonságosan futtatható az AWS felhőben.

Valós vállalati kihívás: ügyfélvélemények osztályozása

Képzeljünk el egy nagy e-kereskedelmi céget, ahol naponta több ezer ügyfélvisszajelzés érkezik a termékekről, szállításról, fizetési problémákról vagy az ügyfélszolgálatról. Ezeket a visszajelzéseket pontosan kell kategorizálni ahhoz, hogy a megfelelő részleghez kerüljenek – legyen az logisztika, pénzügy vagy fejlesztés –, és gyors, hatékony válaszokat lehessen adni, illetve automatizált munkafolyamatokat lehessen indítani. Ehhez mély iparági szakértelem szükséges. Ugyanakkor az LLM-nek a vállalaton belül más területeken is jól kell teljesítenie, például ügyfélkommunikációban, adatfeldolgozásban vagy dokumentációk készítésében, ami általános nyelvi és logikai képességeket igényel.

Hogyan vizsgálták a Nova Forge hatékonyságát?

Az AWS China Applied Science csapata egy összetett, több szintű címkézési feladattal tesztelte a Nova Forge-t, több mint 16 000 ügyfélvélemény alapján. A feladat négy szintű hierarchiában, összesen 1420 kategóriában osztályozta a visszajelzéseket, ami komoly kihívást jelentett a rendkívül kiegyensúlyozatlan adathalmaz miatt. A szakértők két fő szempontot mértek: a domain-specifikus feladatok pontosságát és a modell általános képességeinek megőrzését a MMLU benchmark segítségével, amely több tudományterületen teszteli a nyelvi modelleket.

Eredmények: szakértelem és intelligencia kéz a kézben

Az eredmények egyértelműen alátámasztották a Nova Forge előnyeit. A finomhangolás után a domain-specifikus osztályozási feladat F1 pontszáma 17%-kal javult, miközben a modell megőrizte általános tudását és instrukciókövető képességeit, ami ritka eredmény a teljes körű finomhangolás során. Ez azt jelenti, hogy a vállalatok nem kell kompromisszumot kössenek a specializált tudás és az általános intelligencia között, így széles körben használhatják a modellt különböző üzleti területeken.

Az Amazon Nova Forge tehát egy ígéretes megoldást kínál azoknak a cégeknek, amelyek szeretnének saját, testreszabott AI-modellt fejleszteni anélkül, hogy fel kellene áldozniuk a modell általános használhatóságát. A részletes technikai ismertető és a teszteredmények elérhetők az Amazon hivatalos blogján, ahol minden érdeklődő mélyebb betekintést nyerhet a Nova Forge működésébe és előnyeibe.