Roc Nation acusa al creador de «usar ilegalmente una IA
El magnate del hip-hop Jay-Z se ha convertido en una fuente de inspiración poco probable dentro de la comunidad en ciernes de la suplantación impulsada por la inteligencia artificial, conocida coloquialmente como deepfakes, y el sello discográfico del icono del rap ha tomado nota y ha emitido huelgas de derechos de autor para cerrar algunas de ellas.
No es que se esté difamando a Jay-Z sin su consentimiento, ya que la mayoría de las falsificaciones tienden a hacerse pegando la cabeza de las celebridades femeninas y otras mujeres en los cuerpos de las actrices de películas para adultos. Se trata más bien del mundo de las falsificaciones seguras para el trabajo, sólo de audio, que se dedican principalmente a la parodia, así como a mostrar la asombrosa sofisticación técnica que este campo ha producido en tan sólo unos pocos años.
LA NACIÓN ROC HA EMITIDO ATAQUES CONTRA ALGUNAS FALSIFICACIONES DE AUDIO JAY-Z
En una fascinante inmersión profunda del cofundador del festival XOXO, Andy Baio, en su sitio web Waxy, Baio busca en YouTube imitaciones de Jay-Z impulsadas por la IA, específicamente un creador que usa la voz icónica de Jay-Z y el flujo del hip-hop para rimar clásicos como el soliloquio «Ser o no ser» de William Shakespeare de Hamlet y «No iniciamos el fuego» de Billy Joel.
En un extraño giro de los acontecimientos, Roc Nation LLC, la agencia de entretenimiento de servicio completo de Jay-Z, presentó huelgas de derechos de autor contra las subidas a YouTube de los mencionados deepfakes. Los avisos citan específicamente a la IA, con Roc Nation escribiendo, «este contenido utiliza ilegalmente una IA para hacerse pasar por la voz de nuestro cliente», según las conversaciones de Baio con el creador, que permanece anónimo y se rige por el mango online de Síntesis de Voz. El canal en sí tiene casi 40.000 suscriptores, y muchos de sus videos han acumulado cientos de miles de vistas.
Por extraño que parezca, los videos de Jay-Z deepfake con la voz sintética del rapero rimando el Libro del Génesis y el infame meme copypasta del Navy Seal permanecen en YouTube. Pero no se puede atribuir a los que son libres de usarlos; «Nosotros no iniciamos el fuego» está, por supuesto, protegido por derechos de autor, pero las obras de Shakespeare son de dominio público.
Todos los vídeos de «Sintetizador de voz» se crean alimentando el modelo de texto a voz de código abierto Tacotron 2 de Google con canciones y letras de Jay-Z y haciendo que la voz sintética lea el texto preescrito. La situación plantea fascinantes preguntas sobre qué es exactamente lo que se está infringiendo aquí si la voz sintética está simplemente produciendo contenido original usando la semejanza de una celebridad. Para una mirada más profunda en los temas de derechos de autor en juego aquí, le sugiero que lea el análisis de Baio en su totalidad, porque entra en los detalles más finos del uso legítimo y por qué las demandas de Jay-Z no pueden sostenerse en la corte.
«Parece razonable asumir que un modelo y el audio generado a partir de grabaciones de audio con derechos de autor se consideren obras derivadas. ¿Pero es una infracción de los derechos de autor? Como prácticamente todo en el mundo de los derechos de autor, depende de cómo se ha utilizado y con qué propósito», explica Baio. Utiliza el ejemplo de un productor discográfico que presenta a Jay-Z en un nuevo sencillo sin su permiso como una transgresión legal obvia antes de argumentar por qué la síntesis vocal puede estar en el derecho aquí.
Deepfakes se sitúa en un turbio terreno legal. Algunos estados de EE.UU. como California han prohibido a los candidatos políticos la difusión de deepfakes para tratar de influir en una elección, mientras que Virginia el año pasado amplió sus leyes de pornografía de venganza para cubrir las imágenes generadas por ordenador y el vídeo. Varias plataformas sociales -entre ellas Facebook, Reddit y Twitter- tienen prohibiciones de falsificación profunda de libros que abarcan una amplia variedad de contenidos, en la mayoría de los casos para prohibir el vídeo o el audio manipulado o engañoso que está diseñado para causar daño.
«HASTA DONDE SÉ, ESTA FUE LA PRIMERA VEZ QUE YOUTUBE RETIRÓ UN VIDEO POR HACERSE PASAR POR UNA VOZ USANDO I.A.»
Pero ninguna de estas prohibiciones parece cubrir el entretenimiento inofensivo, bajo el cual parecen caer los videos de síntesis de voz. «Me sorprendió bastante recibir la orden de desmontaje. Hasta donde yo sé, esta fue la primera vez que YouTube ha eliminado un video por hacerse pasar por una voz usando la IA», el creador de la cuenta le dice a Baio en una entrevista, que definitivamente deberías leer en su página web. «He estado posteando este tipo de videos durante meses y no se han eliminado otros videos por esta razón. También hay varios otros canales que hacen videos de síntesis de voz similares a los míos, y no tengo conocimiento de que ninguno de ellos haya sido eliminado por esta razón.»
La síntesis de voz tiene un punto; la suplantación de voz con IA está en todo el internet, especialmente en YouTube. Es sólo que, en este caso en particular, una celebridad muy conocida se dio cuenta cuando se convirtió en el sujeto y tomó una acción que puede tener algunas consecuencias de gran alcance si se convierte en una práctica estándar para moderar este tipo de falsificaciones en el futuro.
«No soy abogado y no he estudiado derecho de propiedad intelectual, pero lógicamente no entiendo realmente por qué imitar la voz de una celebridad utilizando un modelo de IA debe ser tratado de manera diferente a alguien que naturalmente hace una impresión (extremadamente precisa) de la voz de esa celebridad», argumenta la síntesis de voz.
YouTube no respondió inmediatamente a una solicitud de comentarios. Roc Nation no incluye en su sitio web números de teléfono o direcciones de correo electrónico para contactar a la empresa o a su filial discográfica.
Dejar un comentario