Új dimenzió a kreativitásban: a Gemini most zenét is készít

A Gemini alkalmazás, amely eddig a képek és videók kreatív megjelenítését segítette, most egy izgalmas új funkcióval bővült: zene generálására is képes. A Google DeepMind legújabb generatív zenei modellje, a Lyria 3, most béta verzióban elérhető a Gemini appban. Ennek segítségével néhány másodperc alatt olyan egyedi, hangulatos zeneszámokat hozhatunk létre, amelyek akár dalszöveggel is kiegészülnek, mindössze egy ötlet vagy egy kép megadásával.

Hogyan működik a zene generálás a Gemini appban?

Elég egy kreatív szöveges leírás, például „egy vicces R&B lassú szám egy zokniról, aki megtalálja a párját”, és a Gemini perceken belül elkészíti a hozzá illő dallamot. A funkció lehetővé teszi, hogy akár képet vagy videót is feltöltsünk, majd az app ezekből merítve alkosson zenét, amely tökéletesen illeszkedik a hangulathoz. Például „készíts egy dalt a kutyámról, Duncanról, amint az erdőben túrázik” – és már szól is a hozzá passzoló, személyes zenei aláfestés.

Lyria 3: a zenei mesterséges intelligencia új generációja

A Lyria 3 a korábbi modellekhez képest három fő területen fejlődött jelentősen. Először is, nem kell saját dalszöveget írni, mert a rendszer automatikusan generálja azt a megadott téma alapján. Másodszor, sokkal nagyobb szabadságot ad a stílus, a vokálok és a tempó beállításában, így a felhasználó jobban személyre szabhatja az elkészült zenét. Harmadszor pedig a korábbinál élethűbb és összetettebb hangszerelést kínál, amely már valódi zenei élményt nyújt. Az így létrejött 30 másodperces trackeket ráadásul egyedi borítóképpel is ellátja a Nano Banana technológiája, megkönnyítve ezzel a megosztást barátokkal vagy közösségi felületeken.

Alkalmazási lehetőségek és kreatív szabadság

A Gemini zenealkotó funkciója nem arra törekszik, hogy mesterműveket hozzon létre, hanem hogy szórakoztató és egyedi módon segítse a kreatív önkifejezést. Használhatjuk akár egy nosztalgikus afrobeat szám elkészítésére, ami az anyánkkal töltött gyerekkori emlékeket idézi fel, vagy egy vidám dalt, amely egy belső viccet vagy személyes történetet jelenít meg. Ez a lehetőség új dimenziót nyit a digitális tartalomkészítésben, különösen azok számára, akik szeretnének rövid, ütős zenei anyagokat hozzáadni videóikhoz vagy történeteikhez.

Biztonság és felelős mesterséges intelligencia-fejlesztés

A Google a Lyria 3 fejlesztése során nagy hangsúlyt fektetett a jogi és etikai szempontokra, együttműködve a zenei közösséggel. A rendszer nem másolja le konkrét művészek stílusát, hanem inkább csak általános inspirációként használja fel őket, és szigorú szűrőkkel ellenőrzi a tartalmakat, hogy elkerülje a szerzői jogok megsértését. Ezen túlmenően a Gemini alkalmazásba beépítették a SynthID nevű vízjelet, amely egy láthatatlan azonosítóként segít felismerni az AI által generált zenét, ezzel is támogatva az átláthatóságot. A felhasználók pedig könnyedén ellenőrizhetik, hogy egy adott zenei, képi vagy videós tartalom szintén AI-generált-e.

Hol érhető el és hogyan próbálhatjuk ki?

A Lyria 3 jelenleg a Gemini appban érhető el minden 18 éven felüli felhasználó számára angol, német, spanyol, francia, hindi, japán, koreai és portugál nyelven, és a közeljövőben további nyelvekkel bővül a kínálat. A funkció már asztali gépen is használható, a mobilos megjelenés pedig folyamatosan terjed. A Google AI Plus, Pro és Ultra előfizetők pedig magasabb használati limitet is kapnak.

Ha szeretnél egyedi, személyre szabott zenéket készíteni egyszerűen egy ötlet vagy kép alapján, érdemes kipróbálni az új lehetőségeket, amelyeket a Gemini app Lyria 3 generatív zenemodellje kínál. Ez az innováció nem csak az alkotók, hanem a mindennapi felhasználók számára is új utakat nyit a kreatív önkifejezésben.