Blog de Canto
Google revoluciona la música con MusicLM
En las últimas semanas el mundo se ha vuelto loco por la nueva tecnología de Chat GPT, la cual ha abierto un nuevo paradigma a lo que podría venir en el futuro próximo y qué es lo que podría cambiar de manera radical gracias a las nuevas tecnologías. Quizás una de las industrias que más movimiento tenga y de la cual hay que estar muy al pendiente es la de la composición y de la música, ya que el avance que hay en este campo es impresionante. Y esta semana la gran noticia es la nueva herramienta de Google llamada MusicLM, la cual asegura Google que “puede transformar melodías silbadas y tarareadas según el estilo descrito en una leyenda de texto”. También puede generar "música de alta fidelidad a partir de descripciones de texto como 'una melodía relajante de violín respaldada por un riff de guitarra distorsionado'". Así es que conozcamos más de MusicLM.
Aún no está lista para uso público, sin embargo, ya es una realidad y sólo hay que esperar a que Google nos deje acceder a ella. Y lo más seguro es que sea de manera muy económica como todo lo que hoy estamos viendo que se desarrolla con IA. MusicLM funciona de diferentes maneras, sin embargo, la más impresionante es que podemos tararear o cantar una canción acapella, incluso sin estar completamente afinados, y la herramienta convertirá esa melodía tarareada en lo que nosotros le pidamos con el estilo que queramos. Por ejemplo, en su sitio podemos encontrar algunas pruebas que se han hecho en donde un joven canta Bella Ciao, canción que se hizo popular en el mundo hace poco tiempo gracias a la serie “La casa de papel”. Podemos escuchar la versión original en donde el joven la canta y después se le pide que nos dé esa versión en diferentes estilos, con diferentes instrumentos, con coros, en otra voz, etc. De verdad es impresionante el resultado tomando en cuenta que la tecnología es nueva. Es decir, que escucharemos ruido de fondo y una calidad baja, pero es la primera versión. Podemos imaginarnos que no pasarán más de 2 años en lo que esto mejore de manera asombrosa para tener un sonido HD desde el momento en que el modelo comience a obtener datos para mejorarlo.
También podemos solamente decirle con prompts que cree una canción a partir de una imagen. En los ejemplos vemos imágenes muy conocidas que tienen una clara descripción en Wikipedia. A partir de esa descripción se le pide a la herramienta crear una canción y nuevamente podemos escuchar los resultados, algo verdaderamente increíble. Y de esa misma manera, tal como ya lo podemos hacer con Dall-E de OpenAI, Midjourney o Stable Diffusion, en lugar de obtener imáganes a partir de prompts, ahora obtendremos canciones. Lo que podemos deducir de esto es que pasará exactamente lo mismo que pasa ahora con los diseñadores gráficos, creando manifestaciones en internet y con varias asociaciones internacionales por el uso de estas tecnologías que les están quitando el trabajo a una velocidad que pareciera que es más rápida que la luz. Es decir, que ahora si queremos una canción triste, en piano y violín, con toques románticos, en alta fidelidad, con una duración de 3 minutos, que tenga un puente con chelos y coros, etc., sólo tendremos que escribirlo, esperara unos 2 minutos, revisar si es lo que queremos y sino es justo lo que nos imaginábamos, sólo habrá que cambiar algún prompt, darle clic para que vuelva a crearla y listo.
El mundo de la música está a punto de cambiar y seguramente plataformas como Epidemic Sound están temblando después de todo lo que han tenido que desarrollar e invertir para que la gente pudiera tener piezas musicales sin derechos, porque es muy probable que como las plataformas de text-to-image ya mencionadas, cueste centavos o incluso gratis si tenemos los requerimientos técnicos o conocemos un poco de programación en Colab. Las agencias de publicidad ya no necesitarán acudir a Audio Jungle para encontrar música y los músicos y compositores sufrirán un fuerte golpe si no se adaptan rápidamente a cómo beneficiarse de estas tecnologías para incrementar su productividad desarrollando nuevas ideas que estas plataformas aún no puedan crear.
Keunwoo Choi, científico de IA en Gaudio Lab, una empresa de tecnología de audio de IA, tuiteó: “Vaya, esto es más grande que ChatGPT para mí. Google casi resolvió la generación de música, diría yo”. Tan sólo hay que pensar en que MusicLM será el Chat GTP de la música. Sólo hay que esperar como dije, en que esté abierto al público, lo cual podría tardar unos meses hasta que Google esté seguro que no tendrá problemas legales, ya que en realidad esa es la razón por la que no la ha lanzado, después de ver el revuelo que han tenido las aplicaciones de creación de imágenes y la batalla legal que están teniendo con los diseñadores y los derechos de autor. Pero seguramente habrá otras empresas que podrían adelantarse arriesgándose con el dicho “es mejor pedir perdón que pedir permiso”.
Aquí les dejo el link para que puedan darse cuenta de lo que podría ser la revolución de la música.
Comments