MusicLM es un modelo, basado en IA, que genera música de alta fidelidad desde inputs visuales o verbales; dile palabras o dale imágenes y te generará música con apariencia de grabación profesional. Podría quizás considerarse como una de las primeras incursiones serias contra nuestra esencia humana. En la historia reciente no nos hemos privado de artefactos que potencien y nos sustituyan en nuestras limitaciones (la calculadora y el Excel para elevar nuestras capacidades de cálculo, el coche o el avión, para llevarnos lejos y rápido, la electricidad para, entre otras cosas, llevar la luz a la oscura noche, los tractores para trabajar de forma extensiva...), pero el ámbito de la creatividad nunca había sido seriamente atacado, seguía siendo uno de nuestros grandes baluartes. El arte es casi una expresión consustancial a nuestra condición humana. Y, por primera vez, nos empiezan a competir en condiciones de igualdad.
Puedo contar en primera persona el largo proceso que supone la grabación de un disco. Toda la fase de creatividad (un complejo y hermoso mundo), de organización de ideas, el proceso de plasmar esa incorporeidad, atarla al mundo físico al interpretarla con instrumentos reales o virtuales, procesamiento de sonido, la fase de compartir con el resto de músicos, de grabarlo, de mezclarlo, de ecualizarlo, de masterizarlo, de distribuirlo. Un proceso trascendente a nivel personal, parte de nuestra construcción como persona, y con reflejo en nuestras relaciones sociales. Eso es lo que se nos va a arrebatar con un simple input verbal.
¿Cuál es la diferencia respecto al "antes"? Antes todas las máquinas y robots eran creados bajo la tutela humana, bajo nuestro amparo: sistemas de lógica sencilla (no digo sencilla en el sentido de su implementación sino en la comprensión conceptual de su objetivo, por ejemplo, hacer un cohete que nos lleve a la Luna: increíblemente complejo, pero conceptualmente sencillo: cohete a Luna) en la que las prestaciones mecánicas nos prestaban un gran servicio. ¿Cuál es el "ahora"? Sistemas que sobrepasan los límites desde los que se crearon, que avanzan en cualquier sentido al que apuntemos.
Ahora con sencillas instrucciones podremos alimentar ese modelo generativo y obtenemos pura magia. El humano comienza a sobrar. Podemos decirle a la máquina que haga una música que responda a una imagen que le aportamos. Podemos decirle que durante 20 segundos responda a una descripción desde un texto y luego en el siguiente tramo que haga una transición hacia otro estado que le definiremos con unas sencillas frases. Y sonarán sintetizadores, violines y flautas, percusiones y cualquier instrumento imaginado, sonando con una calidad de estudio; vomitarán un bonito resultado.
Distopicemos: crearemos una nueva polarización. Habrá defensores de ese nuevo estilo de crear música ("sin" intervención humana) y habrá, por contra, defensores de la concepción artística tradicional (arte creado por humanos). Estos últimos hablaremos de arte "vacío" o "generativo" (ya elegiremos la palabra adecuada que se erija como representativa de nuestro sentimiento) y diremos que lo vacío es artificio que nos deshumaniza. En cualquier caso existirán herramientas para que el más tonto cree hermosa música: devaluaremos su valor, y, al menos en una primera fase podremos agarrarnos a la endogamia generativa que posiblemente exista: el carácter disruptivo del arte en este primer estadio seguirá siendo un atributo humano: desde la música clásica al pop ha habido una transición ligada a nuestra propia evolución social. La disrupción que pueden suponer artistas como Björk o Béla Bartók no estarán tan fácilmente al alcance de ningún modelo. Por contra, lo cotidiano se verá invadido y superado por lo vacío creado desde chips de silicio. Ahí viviremos. La historia de los humanos se está comenzando a escribir sin los humanos.
Comentarios
Publicar un comentario