Google ha oficializado la implementación del avanzado modelo de inteligencia artificial Lyria 3 dentro de su ecosistema Gemini. Esta innovadora herramienta permite a los usuarios desarrollar pistas musicales con una duración máxima de 30 segundos, las cuales vienen acompañadas de una carátula diseñada de forma automatizada por la IA Nano Banana.
La fase beta de Lyria 3 se encuentra habilitada desde este miércoles directamente en la plataforma de Gemini. El proceso de creación es intuitivo: basta con ingresar una instrucción textual o comando, como por ejemplo «crea una canción rock sobre la pereza que da madrugar un lunes», para que el sistema procese y entregue la pieza sonora breve en instantes.
Personalización mediante imágenes y sonidos
La versatilidad de este sistema permite también el uso de archivos visuales para refinar la creación artística. Por ejemplo, si un usuario carga la fotografía de su mascota, Gemini es capaz de interpretar sus rasgos físicos para incluirlos en la composición, logrando un nivel de personalización superior. Paralelamente, el generador Nano Banana sincroniza el estilo visual de la portada con la atmósfera y el género de la canción generada.
La intención detrás de esta novedad no es sustituir el arte profesional ni crear composiciones complejas. Según ha explicado la firma tecnológica en un comunicado oficial:
«El objetivo de estas pistas no es crear una obra maestra musical, sino ofrecerte una forma divertida y única de expresarte»
.
Por otro lado, la tecnología de Lyria 3 no se limita exclusivamente a Gemini. Esta IA también se encuentra operativa en la funcionalidad ‘Dream Track’ de YouTube, donde los creadores de contenido pueden emplearla para diseñar bandas sonoras originales destinadas a sus vídeos en formato Shorts.
Edición avanzada y soporte multilingüe
Pese a que las pistas tienen un límite de 30 segundos, el sistema ofrece flexibilidad para modificar diversos componentes técnicos. Los usuarios pueden ajustar:
- La voz y el tiempo rítmico.
- La instrumentación y la letra de la canción.
- El idioma de la composición.
Actualmente, el servicio soporta español, inglés, alemán, francés, hindi, japonés, coreano y portugués, aunque se ha confirmado que se añadirán nuevas lenguas progresivamente.
Seguridad y ética en la creación artificial
En cuanto a la autenticidad, todo el material producido con Lyria 3 integra ‘SynthID’, una marca de agua invisible que permite identificar que el audio fue creado por una IA.
«Además, ofrecemos más herramientas para identificar el contenido generado por IA, ampliando nuestras capacidades de verificación en la app de Gemini para incluir audio, imágenes y vídeos»
, precisó la empresa.
Frente a los debates éticos, la compañía aclaró que las pistas buscan la expresión original y no la imitación de celebridades. Si alguien solicita música con el estilo de Queen, la IA recreará la estética sonora de la banda sin replicar su obra exacta. Ante tal petición, Gemini responde de forma descriptiva:
«Aunque no puedo replicar directamente la obra de artistas específicos, he capturado esa esencia teatral y grandiosa que buscabas. He diseñado una pista de ‘Arena Rock’ con una producción masiva: pianos potentes que marcan el ritmo, guitarras eléctricas con armonías vertiginosas y, por supuesto, una muralla de voces corales»
.
Finalmente, se informó que esta versión beta está disponible por ahora para mayores de 18 años en la versión de escritorio de Gemini, con una expansión prevista para la aplicación móvil en los próximos días.
Fuente: Fuente