Con Google Gemini è possibile creare musica: ecco il funzionamento del nuovo modello Lyria 3.
Google ha reso nota l’integrazione di Lyria 3, l’ultima versione di audio generativo creata da DeepMind, all’interno dell’app Gemini.
Questa innovazione consente agli utenti di convertire un prompt – l’istruzione testuale che si affida a un’IA per ottenere il risultato desiderato – in una traccia audio originale in pochi istanti.
Il concetto è chiaro: l’utente esprime ciò che desidera ascoltare e, in un attimo, Gemini trasforma il prompt in una traccia “divertente e orecchiabile”.
Una nuova modalità di espressione creativa
Per Gemini, il chatbot di Google attualmente basato sul modello Gemini 3, si tratta di un ulteriore progresso. Oltre alla generazione di testo, immagini, video e anche voci – quelle sintetiche protagoniste di brevi podcast su temi scelti dall’utente – si aggiunge il tassello mancante: la musica.
Attualmente, la generazione è limitata a “soli” 30 secondi.
Secondo Joël Yawili (Senior Product Manager, app Gemini) e Myriam Hamed Torres (Senior Product Manager, Google DeepMind), responsabili del progetto, l’apertura di Lyria 3 al pubblico si inserisce in una strategia più ampia di Google volta a fornire strumenti di espressione creativa che spaziano dalle immagini ai video, fino alla composizione di melodie.
Il servizio è attualmente in fase di distribuzione globale per tutti gli utenti maggiorenni e supporta diverse lingue, incluso l’italiano.
Funzionamento di Lyria 3
Gemini offre varie modalità di interazione per la creazione di contenuti audio.
Dopo aver effettuato l’accesso via web – google.gemini.com – o tramite app, gli utenti possono descrivere un genere o un’atmosfera specifica attraverso il testo per ottenere tracce strumentali o accompagnate da versi cantati.
Una delle funzionalità più avanzate consente di caricare foto, documenti PDF o addirittura video affinché l’intelligenza artificiale ne interpreti il contenuto per comporre un brano coerente con l’atmosfera visiva o testuale fornita.
Le tracce generate sono accompagnate da copertine personalizzate create da Nano Banana, il modello di Gemini specializzato nella generazione di immagini.
Google evidenzia che queste composizioni sono pensate per la rapida condivisione tra amici o come colonne sonore per momenti quotidiani, piuttosto che per aspirare al titolo di capolavori musicali.
To try Lyria 3, head to https://t.co/382WL5xSvc and select “Create music” in the tools menu, then describe what you want to hear.
Gemini will transform your prompt into a high-quality track. You can even ask Gemini to take inspiration from a photo or video you upload.
Here are… pic.twitter.com/lg1wUsIsEs
— Google Gemini (@GeminiApp) February 18, 2026
In concomitanza con l’annuncio di Lyria 3, Google ha anche condiviso alcuni esempi di utilizzo e relativi prompt. Uno di questi, per dare un’idea, si propone di creare un “sottofondo rilassante per cucinare”:
Ecco il prompt concepito da Google:
“Crea un sottofondo musicale rilassante ideale per ascoltare mentre preparo la cena. La musica dovrebbe avere un’atmosfera calma e accogliente, con melodie delicate e rilassanti. Includi la chitarra acustica come strumento principale, eventualmente accompagnata da suoni leggeri di pianoforte o strumenti soft per arricchire l’atmosfera.”
Non è la prima “musica via prompt”
Lyria 3 si inserisce in Gemini in un periodo in cui la “musica generata a comando” è già diventata una consuetudine per un numero crescente di creator.
Due nomi, in particolare, hanno reso comune l’idea che sia sufficiente descrivere in poche righe un genere o un mood, e magari aggiungere anche alcuni versi in rima, per ottenere una canzone pronta da condividere: Suno e Udio.
Google, presentando Lyria 3 in Gemini, sottolinea proprio questa facilità di utilizzo, anche per chi non ha conoscenze musicali o non sa suonare uno strumento.
Il contesto legale: la battaglia delle major discografiche
Tuttavia, la stessa semplicità che rende questi strumenti così popolari è anche ciò che li pone al centro della disputa sul copyright.
Nel 2024 Universal, Sony e Warner (tramite la RIAA) hanno citato in giudizio Suno e Udio negli Stati Uniti, accusandole di aver utilizzato senza autorizzazione materiali protetti da copyright per addestrare i loro modelli e di generare output che “suonano troppo simili” a brani esistenti. L’accusa delle major, insomma, è quella di plagio e appropriazione di materiali coperti da diritto d’autore.
Da allora, la situazione si è evoluta: una parte dell’industria ha iniziato a esplorare accordi e modelli “licenziati”, mentre altre cause e rivendicazioni continuano a esercitare pressione sul settore.
In sostanza, la questione che grava su ogni modello “text-to-music” – Lyria 3 incluso – non è solo quanto sia valida la musica, ma da dove provenga realmente l’abilità del modello: se derivi da addestramenti autorizzati e tracciabili o da un enorme prelievo non consensuale di cataloghi protetti.
Il marchio di Google sull’audio generato dall’IA
Rispetto a Suno e Udio, che consentono di creare brani veri e propri, di una durata anche superiore ai tre minuti, Lyria 3 presenta delle limitazioni: i brani che genera, come già accennato, sono molto brevi e in aggiunta presentano una filigrana SynthID incorporata che consente di stabilire con certezza che l’audio proviene da un’intelligenza artificiale.
“Basta caricare su Gemini un file e chiedere se è stato generato utilizzando Google AI – comunica Google –. A quel punto Gemini verificherà il SynthID”
I commenti sono chiusi.