Imagen vía Pixabay (stevepb)

MusicGen es la nueva inteligencia artificial de Meta que genera melodías

El boom de la inteligencia artificial (IA) lleva meses entre nosotros. Hemos visto propuestas llamativas. Las mismas nos entregan resultados diversos: chatbots conversacionales, producciones escritas e imágenes creativas. Pero ahora los de Meta han incursionado en otra área: la música. Es así como produjeron su nueva IA llamada MusicGen.

MusicGen es una IA generativa. También es modelo simple/único de lenguaje (LM, por sus siglas en inglés). La tecnología se desarrolló en una sola etapa con patrones de tokens eficientes entrelazados. Utiliza el componente EnCodec — audio de 32Khz — propio de Meta. Gracias a ello, se trata de un modelo rápido y eficiente.

El equipo creador compartió algunos detalles acerca de su proceso de elaboración. Usaron 20.000 horas de música con licencia para entrenar. De allí, abarcaron 10.000 pistas de música en alta calidad. Asimismo, se valieron de datos musicales de Shutterstock y Pond5.

Investigadores de Audiocraft señalan algo. En GitHub se encuentran disponibles “las muestras de música, el código y los modelos”. Es decir, MusicGen es un proyecto de código abierto (open source).

Los investigadores se valieron de tres modelos con diferentes tamaños. Hubo uno de 300 millones, otro de 1.500 millones y uno de 3.300 millones de parámetros. Los modelos más grandes produjeron audio de mayor calidad. No obstante, los humanos calificaron mejor el modelo de 1.500 millones de parámetros. Además, el modelo de 3.300 millones parámetros se considera como el mejor para hacer coincidir con precisión la entrada de texto y la salida de audio.

El usuario podrá introducir como prompt una descripción escrita. Incluso, está la opción de combinar esas indicaciones con pequeños fragmentos musicales. Como resultado, la IA arrojará sus propias melodías. Al respecto, Europa Press y La Voz del Interior señalan la posibilidad de MusicGen en crear melodías de hasta 12 segundos. Aunque, en el sitio web de MuscGen hay ejemplos de hasta 30 segundos. Esos ejemplos aparecen comparados con músicas de otras inteligencias artificiales similares.

Fuentes: Europa PressLa Voz del InteriorXataka