Agent API: Az intelligens munkafolyamatok új generációja

Az AI világában egyre nagyobb kihívás a különböző modellek, keresők és eszközök hatékony összefűzése egyetlen, gördülékenyen működő rendszerbe. A Perplexity legújabb fejlesztése, az Agent API, éppen ezt a problémát oldja meg: egy menedzselt futtatókörnyezetet kínál, amely intelligensen szervezi az ügynöki munkafolyamatokat, egyesítve a keresést, eszközhasználatot és több modell összehangolását egyetlen platformon.

Az ügynöki ciklus, mint számítási modell

A hagyományos processzorok egy előre meghatározott, determinisztikus ciklust követnek: utasítást olvasnak, értelmeznek, végrehajtanak és eltárolják az eredményt. Az Agent API ezzel szemben egy teljesen másfajta modellt valósít meg, ahol a processzor maga egy élvonalbeli nyelvi modell. Ez a modell kap egy célt, majd önállóan bontja le feladatokra, kiválasztja a rendelkezésre álló eszközök közül a megfelelőt, végrehajtja a lépéseket, értékeli az eredményeket, és ha kell, újraindítja a folyamatot, amíg el nem éri a kitűzött célját.

Vegyünk egy példát: egy értékesítési megbeszélés előkészítését egy olyan ügyféllel, akivel már többször beszéltünk. Az Agent API-hoz elegendő elküldeni egyetlen kérést, amely tartalmazza azokat az eszközöket, amiket használhat: a belső CRM keresőt, webes keresőt és URL-tartalom letöltőt. A modell először a CRM-ből gyűjt információkat a korábbi beszélgetésekről, majd webes kereséssel friss híreket és versenytársi információkat keres. A találatok közül két írásos anyagot mélyebben is átnéz a fetch_url segítségével. Így három lépésben egy átfogó, megalapozott válasz születik, amely összefoglalja a belső adatokat és a friss külső információkat.

A teljes munkafolyamat összehangolása egyetlen platformon

Fontos különbséget tenni az Agent API és a hagyományos modellrouter szolgáltatások között. Az Agent API nem csupán egy modellválasztó réteg, hanem egy menedzselt futtatókörnyezet, amely kézben tartja az egész ügynöki ciklust: az adatlekérést, eszközhasználatot, következtetést és akár több modell egymás utáni használatát is. Egyetlen API végponton keresztül helyettesíti a korábbi különálló komponenseket, mint a keresőréteg, az embedding szolgáltató, a sandbox környezet vagy a monitoring rendszer.

Ráadásul a rendszer modellfüggetlen, azaz bármelyik élvonalbeli nyelvi modell szolgáltatóval kompatibilis. A magas rendelkezésre állás érdekében pedig támogatja a modell fallback láncokat: ha az elsődleges modell nem elérhető, automatikusan próbálkozik a következővel, így közel 100 százalékos stabilitást garantál.

Beépített és testreszabható eszközök

Az Agent API két alapértelmezett eszközt kínál: a webes keresőt (web_search) és az URL alapú tartalomlekérőt (fetch_url). A web_search több szűrési lehetőséget is tartalmaz, például domain alapú engedélyezést vagy tiltást, frissesség szerinti szűrést, nyelvi preferenciákat, valamint egyéni tartalmi költségkeretet oldalonként. A fetch_url segítségével pedig egy adott weboldal teljes tartalma letölthető és feldolgozható.

Emellett a fejlesztők saját funkciókat is csatlakoztathatnak, így az Agent API könnyen integrálható bármilyen belső adatbázissal, backenddel vagy API-val, ami tovább növeli a rugalmasságát és alkalmazhatóságát.

Optimalizált előbeállítások a hatékony használathoz

Az optimális ügynöki konfiguráció kialakítása nem egyszerű feladat: a megfelelő modell kiválasztása, a gondolkodás mélységének beállítása, az eszközök és tokenkeretek finomhangolása mind fontos szempont. A Perplexity ezt a folyamatot folyamatosan optimalizálja saját termékeihez egy belső értékelő csapattal, akik valós használati esetek alapján tesztelik és finomhangolják a beállításokat.

Ezekből az eredményekből születnek meg a presetek, azaz előre konfigurált, átlátható beállítások, amelyek egy-egy konkrét feladatra – legyen az gyors tényellenőrzés, kiegyensúlyozott kutatás vagy mély, többforrásos elemzés – vannak optimalizálva. Mindezekhez elérhetők a javasolt rendszerparancsok, eszközök és költségprofilok is, így a fejlesztők könnyen elindulhatnak, majd igény szerint testreszabhatják a paramétereket.

A Deep Research 2.0 például a Perplexity fogyasztói termékét is működtető többlépéses elemzőmotor, amely több tucatszor végez keresést, több száz forrást olvas át, és iteratív módon finomítja a válaszát – a teljesítményét pedig neves benchmarkokon is sikeresen igazolták.

Az Agent API már elérhető, és részletes dokumentációval, valamint gyors indulást segítő útmutatókkal várja az érdeklődő fejlesztőket. Ha mélyebben érdekel a technológia működése, érdemes megtekinteni a hivatalos blogbejegyzést, ahol még több részletet találhatsz a megoldásról.