Potencial Humano

¿Pueden coexistir la IA generativa y los derechos de autor?

La IA generativa tiene el potencial de aportar grandes beneficios a la industria y la sociedad. Pero para lograrlo, se necesitan alianzas más transparentes y sólidas entre las empresas tecnológicas y las industrias creativas.

Según un informe reciente del sector, las industrias creativas «centrales» —aquellas que producen libros, software de entretenimiento, publicaciones periódicas, películas, música grabada, televisión y videojuegos— contribuyeron con 1.8 billones de dólares al PIB de Estados Unidos en 2021. Eso equivale a casi el 8 % de la economía estadounidense. Por lo tanto, es un asunto serio que las empresas de IA generativa estén utilizando materiales con derechos de autor no licenciados de estas industrias para entrenar sus modelos. Ya existen evidencias de líderes del sector e investigaciones académicas que indican que las herramientas de IA han reemplazado trabajadores en otras áreas clave de la economía, y no resulta difícil imaginar que podrían hacer lo mismo con los artistas. Por eso, los titulares de derechos en estas industrias han presentado más de 40 demandas en tribunales federales contra empresas de IA por entrenar sus modelos con contenido protegido sin licencia. Dos tribunales del Distrito Norte de California emitieron los primeros fallos en estos casos, y ninguno fue especialmente favorable para los titulares de derechos.

En el primer caso, Bartz contra Anthropic, presentado por tres autores contra la empresa Anthropic, el juez William Alsup determinó que entrenar modelos de IA generativa con material protegido por derechos de autor constituye uso legítimo (fair use), y por tanto puede hacerse sin compensar a los titulares. “Como cualquier lector que aspira a ser escritor”, escribió el juez Alsup, “el modelo de lenguaje de Anthropic [LLM] fue entrenado no para replicar o reemplazar las obras, sino para dar un giro radical y crear algo distinto”.

En el segundo caso, Kadrey contra Meta, interpuesto por 13 autores contra Meta, el juez Vincent Chhabria adoptó una postura distinta, considerando que el uso no autorizado de material con derechos para el entrenamiento probablemente no sea uso legítimo, ya que el contenido generado por IA es fundamentalmente distinto del creado por humanos. “Usar libros para enseñar a los niños a escribir”, razonó el juez Chhabria, “no se parece en nada a usar libros para crear un producto que una sola persona podría emplear para generar obras competidoras incontables en una fracción ínfima del tiempo y esfuerzo creativo que normalmente se requeriría”.

Somos expertos en transformación digital y hemos reflexionado profundamente sobre este tema. De hecho, recientemente participamos en una mesa redonda de 10 economistas convocada por la Oficina de Derechos de Autor de EE. UU. para estudiar las implicaciones de la IA generativa en la política de propiedad intelectual. Sabemos que estas dos resoluciones distan mucho de ser la última palabra sobre el tema; sin duda serán apeladas ante el Noveno Circuito y posiblemente lleguen a la Corte Suprema. Pero mientras tanto, ya hay muchas lecciones que pueden extraerse sobre las implicaciones de la IA generativa para los negocios, lecciones útiles tanto para los líderes de las industrias creativas como para las empresas tecnológicas.

Lecciones para los titulares de derechos

Como titular de derechos en el entorno actual, puedes tomar varias medidas para proteger tu negocio.

Reconoce que es posible eliminar el contenido protegido del corpus de entrenamiento

Puede parecer que la batalla ya está perdida: una vez que un contenido entra en el corpus de entrenamiento de un modelo, ¿no hay forma de sacarlo? En realidad, no es así. Cuando los modelos de lenguaje se actualizan a nuevas versiones (por ejemplo, de ChatGPT 3 a ChatGPT 4), suelen volver a entrenarse desde cero con un corpus completo. En ese momento, existe la oportunidad de excluir contenido protegido por derechos de autor o de obtener una orden judicial que obligue a hacerlo.

Haz valer tus derechos contra las empresas de IA que usen tu contenido sin licencia

Si sospechas que tu contenido se está utilizando sin licencia, este podría ser un buen momento para unirte a la lista de más de 40 demandantes que han acudido a los tribunales. Algunos fallos recientes ofrecen una posible ruta legal: convencer al tribunal de que los modelos de IA podrían destruir los medios de vida de los mismos artistas que se les está pidiendo que los entrenen gratuitamente. Es un argumento difícil, pero al menos es un punto de partida.

Considera otorgar licencias cuando sea adecuado

Más de 70 titulares de derechos —incluidos HarperCollins, Universal Music, Reddit, Shutterstock y The Wall Street Journal— ya han licenciado su contenido para el entrenamiento de modelos. Si aún no lo has hecho, este puede ser el momento para explorar acuerdos de licencia, incluso desarrollando conjuntos de datos curados que resulten atractivos para los desarrolladores de IA. Aunque negocias en desventaja por la tendencia judicial actual, tu ventaja es la calidad y el momento: las empresas podrían estar dispuestas a pagar ahora por contenido limpio, confiable y legal, en vez de esperar años a que los tribunales resuelvan.

Considera retirar tu contenido protegido de la web abierta

Muchas empresas de propiedad intelectual ofrecen parte de su contenido gratuitamente como estrategia de negocio. Sin embargo, con la llegada de la IA generativa, estas estrategias deben reevaluarse. Los contenidos protegidos que están detrás de muros de pago han sido precisamente los más valiosos en los acuerdos de licencia recientes, ya que resultan más difíciles de recopilar masivamente por los modelos de IA.

Protege el contenido que aún está en la web abierta

En cuanto a la recopilación masiva de datos (scraping), existen medidas para intentar proteger la propiedad intelectual, aunque ninguna es infalible. Se puede usar el archivo robots.txt para indicar a los bots de IA que no deben recopilar contenido del sitio (aunque depende de que lo respeten). También pueden bloquearse los bots desde el servidor o establecer políticas de monetización para el acceso de IA a ciertos contenidos. Existen además herramientas emergentes como Glaze o Nightshade, que ayudan a proteger obras visuales contra su uso en el entrenamiento de modelos generativos.

Lecciones para las empresas de IA generativa

Si eres líder en una empresa de IA generativa, podrías pensar que lo mejor es seguir haciendo lo que estás haciendo, dadas las decisiones recientes de los tribunales. Pero eso podría ser un error. Aquí te mostramos en qué deberías estar pensando —y qué deberías estar haciendo— mientras los tribunales resuelven el panorama legal.

Tomen en cuenta los riesgos financieros

Aunque el juez Alsup concluyó que el uso de obras protegidas por parte de Anthropic fue uso legítimo, lo hizo con una advertencia: el contenido no debía haber sido obtenido mediante piratería. Señaló que “la piratería de copias legalmente disponibles es, por naturaleza, infracción irreparable, incluso si se destinan inmediatamente a un uso transformador”. Esto implica un riesgo financiero significativo. Según la ley estadounidense (17 U.S.C. § 504), los tribunales pueden otorgar hasta 30 mil dólares por obra infringida, y hasta 150 mil si la infracción fue intencional. Alsup determinó que Anthropic usó 7 millones de libros pirateados y ordenó juicio para determinar los daños. Esto podría representar hasta 1.05 billones de dólares en sanciones. Y no es el único caso: en Kadrey v. Meta, se descubrió que Meta utilizó al menos 82 TB de libros pirateados para entrenar sus modelos. Demandas como Tremblay v. OpenAI y O’Nan v. Databricks hacen acusaciones similares.

Firmen licencias

Dado estos riesgos, ahora podría ser un buen momento para negociar licencias con titulares de derechos, especialmente si la tendencia judicial incentiva acuerdos rápidos.

Desarrollen herramientas de exclusión voluntaria

Tal como lo hicieron YouTube y Facebook al permitir que los titulares de derechos eliminen contenido de sus plataformas, las empresas de IA podrían ofrecer herramientas similares para excluir datos de sus modelos de entrenamiento.

Considera si vale la pena usar datos no licenciados

Eleuther.ai, una organización de investigación en IA, publicó recientemente un conjunto de datos de 8 TB llamado Common Pile v0.1, compuesto solo de contenido con licencia o de código abierto. Aseguran que los modelos entrenados con esta base tuvieron un rendimiento comparable a los entrenados con datos no licenciados. Aunque no podemos verificar sus afirmaciones, dada la magnitud del riesgo legal, quizá sea hora de cuestionar si los beneficios marginales de usar contenido sin licencia justifican los costos.

La IA generativa tiene el potencial de aportar grandes beneficios a la industria y la sociedad. Pero para lograrlo, se necesitan alianzas más transparentes y sólidas entre las empresas tecnológicas y las industrias creativas. De lo contrario, corremos el riesgo de matar a la gallina —o en este caso, a los autores, músicos, programadores y cineastas— que puso los huevos de oro sobre los que se construye el valor actual y futuro de la IA generativa.


Artículo por: Michael D. Smith, profesor de tecnología de la información y políticas públicas en Heinz College; y por Rahul Telang, profesor Trustee de Sistemas de Información en Heinz College. [Archivo digital]. – Recuperado de: https://hbr.org/2025/07/can-gen-ai-and-copyright-coexist?language=es

Este artículo es meramente informativo. No pretende ser o parecer de autoría propia de revista Potencial Humano. Los derechos pertenecen y son únicamente de HBR. Los créditos de dicho artículo están expresados claramente en el mismo. Las opiniones expresadas son sólo responsabilidad de sus autores y son completamente independientes de la postura y la línea editorial de Revista Potencial Humano.

¿Quieres conocer más sobre Inteligencia Artificial y el derecho? Conoce más artículos relacionados

| Leer más

Podcast

Felipe Ugalde, Artísta gráfico

Felipe Ugalde, artista gráfico cuya obra ha dejado una huella inconfundible en el panorama visual contemporáneo.
Liderazgo

Salvador Zerboni

La fama puede desestabilizar si no tienes los pies bien plantados. Es fundamental mantener claros los objetivos y rodearse de personas de confianza.
Jurídico

¿Pueden coexistir la IA generativa y los derechos de autor?

La IA generativa tiene el potencial de aportar grandes beneficios a la industria y la sociedad. Pero para lograrlo, se necesitan alianzas más transparentes y ...
Scroll to Top