Meta ha lanzado su propio generador de música impulsado por IA, llamado MusicGen, y a diferencia de Google, lo ha liberado como código abierto.
Esta herramienta de generación musical de Meta puede convertir una descripción de texto (por ejemplo, «una canción pop de los 80 con baterías pesadas y sintetizadores en segundo plano») en aproximadamente 12 segundos de audio. MusicGen también puede ser «guiado» con audio de referencia, como una canción existente, intentando seguir tanto la descripción como la melodía. Según Meta, MusicGen fue entrenado con 20,000 horas de música, incluyendo 10,000 pistas de música con licencia de alta calidad y 390,000 pistas instrumentales de ShutterStock y Pond5, una extensa biblioteca de medios en stock. La compañía no ha proporcionado el código utilizado para entrenar el modelo, pero ha puesto a disposición modelos pre-entrenados que cualquier persona con el hardware adecuado, principalmente una GPU con alrededor de 16 GB de memoria, puede ejecutar.
¿Cómo se desempeña MusicGen? Bueno, diría que, aunque no lo suficientemente bien como para reemplazar a los músicos humanos. Sus canciones son razonablemente melódicas, al menos para indicaciones básicas como «música chiptunes ambiental», y, según mi criterio, están a la par (si no ligeramente mejores) que los resultados del generador de música AI de Google, MusicLM. Sin embargo, no ganarán ningún premio.
La música generada está mejorando, eso está claro (ver Riffusion, Dance Diffusion y Jukebox de OpenAI). Sin embargo, aún existen importantes problemas éticos y legales por resolver. La IA, como MusicGen, «aprende» a partir de la música existente para producir efectos similares, un hecho con el que no todos los artistas o usuarios de IA generativa se sienten cómodos.
Cada vez más, pistas caseras que utilizan IA generativa para evocar sonidos familiares que se pueden pasar como auténticos, o al menos lo suficientemente cercanos, se vuelven virales. Las discográficas han sido rápidas en señalarlas a los socios de streaming, citando preocupaciones de propiedad intelectual, y generalmente han salido victoriosas. Sin embargo, todavía existe una falta de claridad sobre si la música «deepfake» viola los derechos de autor de los artistas, discográficas y otros titulares de derechos.
Es posible que pronto haya orientación sobre este asunto. Varios litigios en curso tendrán probablemente un impacto en la IA generadora de música, incluido uno relacionado con los derechos de los artistas cuyo trabajo se utiliza para entrenar sistemas de IA sin su conocimiento o consentimiento.
Por su parte, Meta, que no impone restricciones sobre cómo se puede utilizar MusicGen, asegura que toda la música en la que fue entrenado MusicGen estaba «cubierta por acuerdos legales con los titulares de derechos», incluido un acuerdo con Shutterstock.
We present MusicGen: A simple and controllable music generation model. MusicGen can be prompted by both text and melody.
— Felix Kreuk (@FelixKreuk) June 9, 2023
We release code (MIT) and models (CC-BY NC) for open research, reproducibility, and for the music community: https://t.co/OkYjL4xDN7 pic.twitter.com/h1l4LGzYgf