Zenét generál a Gemini: új dimenzió a kreatív önkifejezésben
A Gemini applikáció eddig is lehetőséget adott arra, hogy képekkel és videókkal fejezzük ki kreativitásunkat, most azonban egy izgalmas új funkcióval bővült: már zenét is képes alkotni. A Google DeepMind legfrissebb generatív zenei modellje, a Lyria 3, már elérhető a Gemini app béta verziójában, és szinte pillanatok alatt képes egyedi, minőségi dallamokat létrehozni. Csak annyit kell tennünk, hogy leírjuk az elképzelésünket vagy feltöltünk egy képet, majd a Gemini máris megalkotja hozzá a megfelelő zenét – akár egy humoros R&B slow jam-et egy zokniról, ami megtalálja a párját.
Hogyan működik a Lyria 3 és miben jobb elődjénél?
A Lyria 3 jelentős előrelépéseket hozott a zenei generálás terén. Először is, már nem kell saját dalszöveget írnunk, hiszen a modell ezt is elvégzi a megadott prompt alapján. Emellett sokkal több kreatív beállítást kínál: választhatunk stílust, vokált vagy épp tempót, így a zene igazán személyre szabottá válik. A legfontosabb viszont, hogy a zenék hangzásvilága sokkal élethűbb és összetettebb, mint korábban, így a végeredmény valóban élvezetes hallgatnivaló.
Szövegből, képből vagy videóból – a zene minden formában
Használhatjuk a Gemini új funkcióját egyszerűen úgy, hogy szöveges leírást adunk meg egy zenei hangulatról vagy akár egy belső viccről. Például elkészíthetünk egy nosztalgikus afrobeat dallamot, amely egy családi emléket idéz fel, vagy egy vidám számot a kedvenc kutyánkról egy erdei túrán. De ennél is izgalmasabb, hogy egy fotó vagy videó feltöltésével is elindíthatjuk a zenekészítést: a Gemini az adott kép vagy mozgókép hangulatából merítve alkot egy 30 másodperces, egyedi dalt, amelyhez a Nano Banana által generált egyedi borítókép is jár.
AI-ellenőrzés és felelősségteljes fejlesztés
Fontos megemlíteni, hogy minden zeneszámot a Gemini egy úgynevezett SynthID vízjellel lát el, amely segít azonosítani, hogy a tartalom Google AI által generált-e. Az alkalmazásban ráadásul már nem csak képek vagy videók, hanem hanganyagok eredetiségét is ellenőrizhetjük, így könnyen kideríthető, ha valami mesterséges intelligencia által készült. Ez a lépés része a Google elkötelezettségének, hogy a generatív AI technológiát felelősen fejlessze, különös tekintettel a szerzői jogokra és a zenei közösséggel való együttműködésre.
Kik és hogyan használhatják a Gemini zenei funkcióját?
A Lyria 3 jelenleg az angol, német, spanyol, francia, hindi, japán, koreai és portugál nyelveken érhető el, és hamarosan további nyelvekkel is bővül a kínálat. A Gemini alkalmazásban minden 18 éven felüli felhasználó kipróbálhatja az új zenekészítést, a Google AI Plus, Pro és Ultra előfizetők pedig magasabb használati limithez jutnak. A zenék nem arra szolgálnak, hogy mesterműveket hozzanak létre, hanem hogy egyedi, szórakoztató módon segítsék a személyes önkifejezést – legyen szó akár egy rövid videó aláfestéséről vagy egy különleges emlék megidézéséről.
Ha kíváncsi vagy, hogyan varázsolhatja zenévé az ötleteidet a Gemini, érdemes kipróbálni a legújabb funkciókat, amelyek új színt visznek a digitális kreativitás világába.