Google giver Gemini-appen funktion til at generere musik fra tekst, prompt og billeder

Lyria 3
(Foto: Lyria)

Google har præsenteret en beta-udgave af musikgenerering i Gemini-appen, hvor brugere kan lave 30 sekunders lydspor via tekstbeskeder eller uploadede billeder. Funktionen drives af Google DeepMind’s seneste model, Lyria 3.

Nyt AI-værktøj til at generere korte musikstykker i en fart

Google beskriver tre centrale forbedringer fra tidligere Lyria-modeller: automatisk tekstskrivning ud fra brugerens prompt, mere detaljeret styring af musikalske elementer samt mulighed for at skabe mere komplekse kompositioner. Hvert spor udstyres med et genereret coverbillede produceret af Nano Banana og kan deles via download eller link.

Artiklen fortsætter nedenfor

Funktionen har primært til formål at give brugerne en let måde at udtrykke sig kreativt på, frem for at skabe fuldt udproduceret musik. Lyria 3 kan desuden afprøves af skabere på YouTube gennem Dream Track, der nu rulles ud i flere lande. Her skal modellen forbedre de korte lydspor, der bruges i Shorts, eksempelvis ved at generere vers eller baggrundslyde til videoskabere.

Google udvider samtidig verificeringsværktøjerne i Gemini-appen, så brugere kan undersøge, om en lydfil er AI-genereret. Alle lydspor får indlejret SynthID, virksomhedens vandmærke til identificering af indhold skabt med Google-modeller, og appen kan kontrollere både vandmærke og andre signaler i en uploadet fil.

Funktioner:

  • Generering af 30 sekunders musikstykker via tekst eller billeder
  • Automatisk oprettelse af sangtekster
  • Valg af stil, vokaltype og tempo
  • Coverbillede genereret af Nano Banana
  • Understøttelse af verificering via SynthID
  • Integration med YouTube Dream Track til Shorts-produktion

Lyt til eksempler på musik skabt af Lyria 3 på YouTube via linket herunder:

Lyria 3 | Music Generation comes to Gemini - YouTube Lyria 3 | Music Generation comes to Gemini - YouTube
Watch On

Sådan fungerer det

Lyria 3 forbedrer lydgenereringen fra tidligere Lyria-modeller på tre måder:

Fra tekst til track: Beskriv en specifik genre eller stemning – og få et track med tekst og vokal retur med det samme. Bed fx om et afslappende jazznummer med blødt klaver, jazzede akkorder og et roligt tempo.

Skab lyd til dine billeder: Upload et foto, en PDF eller et slide. Gemini analyserer indholdet og komponerer et musikstykke, der matcher stemningen. Det kunne fx være et soundtrack til et billede af din hund på vandretur i skoven.

Del dine øjeblikke: Forvandl interne jokes eller hverdagens små højdepunkter til musik, som hurtigt kan deles med venner og familie via et link. Fx: “lav et 90'er-skatepunk-track, der fortæller min roomie, at han skal tage opvasken - med høj energi og hurtige trommer.” Kan også være et “min morgen” med et ‘vibe of the day’ til familie og venner.

Sådan kan funktionen bruges:
Tekst til musik: Beskriv en bestemt genre, stemning, intern joke eller et minde for at skabe unikke spor med sangtekst eller instrumental lyd, der passer til det ønskede udtryk.
Fra fotos og videoer til musik: Upload et foto eller en video, og Gemini omsætter indholdet til et spor med sangtekst, der passer til stemningen.

Gemini-appen genererer 30 sekunders musikstykker med et tilhørende coverbillede skabt af Nano Banana. Det giver mulighed for hurtig deling via download eller et delingslink. Du kan selv prøve Lyria 3 her.


TOPICS
Peter Hoffmann
Redaktør TechRadar Danmark

Peter er journalist og har arbejdet som tech-journalist på forskellige tech-medier. Samlet set har han beskæftiget sig professionelt med tech og forbrugerelektronik siden 1996. Peter interesserer sig for mange forskellige områder inden for forbrugerelektronik. Han er vild med lyd – både høretelefoner og højttalere i alle mulige afskygninger. Men han kan også bruge rigtig langt tid på at teste mobiltelefoner og computere. Samtidig er han altid på udkig efter sære og skæve produkter, der kan være interessante at kigge nærmere på, selv om de måske ikke passer ind i de traditionelle produktgrupper.