Todo el Mundo Infringe los Derechos de Autor
Sobre la demanda del New York Times contra OpenAI
Sobre la demanda del New York Times contra OpenAI
Imagen generada por Dall-e
Por: Harold Godsoe, abogado canadiense y estadounidense
He aquí una amplia visión de las cuestiones que rodean la demanda del New York Times (NYT), a partir de las opiniones más destacadas de la red.
Un editorial sorprendentemente completo y agresivo sobre los derechos de autor
Avram Piltch (EIC, Tom's Hardware) escribe:
La cuestión no es sólo «¿plagian mi trabajo textualmente?», sino «¿es el mero hecho de utilizar estos materiales para crear software de IA un acto de infracción?».
Sin duda, el New York Times piensa que el propio acto de «entrenamiento» es una infracción. En la página 60 de la demanda, escribe que «al almacenar, procesar y reproducir los conjuntos de datos de entrenamiento que contienen millones de copias de Times Works para entrenar los modelos GPT en la plataforma de supercomputación de Microsoft, Microsoft y los demandados de OpenAI han infringido directamente y de forma conjunta los derechos exclusivos del Times sobre sus obras protegidas por derechos de autor».
Una refutación en Twitter del concepto de que los LLM «almacenan» y «reproducen» obras protegidas por derechos de autor
Kevin Bryan (Universidad de Toronto) escribe que los artículos famosos del NYT («texto común y único») son tan imposibles de ignorar para los LLM como para un alumno de tercer curso de EE.UU. no recordar el juramento de lealtad:
La demanda NYT/OpenAI malinterpreta por completo el funcionamiento de los LLM, y si los jueces se equivocan en esto, perjudicarán enormemente a AI..... Los LLM no «memorizan» ni pueden «memorizar» hechos o textos de entrenamiento; sólo predicen las palabras siguientes basándose en todo el texto en inglés; el texto inusual comúnmente repetido es fácil de predecir la palabra siguiente; los derechos de autor no son adecuados para esto.
En otras palabras...
En la práctica, se puede pensar que ChatGPT comete una infracción de los derechos de autor si y sólo si todo el mundo comete una infracción de los derechos de autor sobre ese mismo pasaje, haciendo que se duplique tan a menudo que se aprenda que es algo que la gente reproduce.
Pero no va a ser fácil explicar todo el texto en rojo a un jurado
Cecilia Ziniti (CEO, Consejera General AI) escribe:
¿Mi opinión? OpenAI no puede defender realmente esta práctica sin algunos cambios importantes en las instrucciones y un montón de litigios sobre cómo funciona la tecnología. Será más inteligente llegar a un acuerdo que luchar. Las pruebas visuales de la copia en la demanda son contundentes. El texto copiado en rojo, las nuevas palabras GPT en negro: un contraste diseñado para influir en el jurado. Ver la Prueba J aquí.
Y ya se está determinando la forma de los acuerdos
Del Atlantic:
Aunque OpenAI tiene un acuerdo para utilizar material de archivo de Associated Press, Axel Springer es, al parecer, la primera editorial que proporciona noticias continuas.... Todos los sitios web, toda la redacción: Es la fontanería de un grifo digital. Con el aumento de contenidos frescos, ChatGPT será más viable como ventanilla única a través de la cual experimentar Internet.
Pero, ¿y si NYT quiere su libra de carne?
Zvi continúa sabiamente:
[Un acuerdo con OpenAI] presupone que The New York Times está de humor para llegar a un acuerdo y aceptará un precio razonable, de forma que se siente un precedente de que OpenAI puede permitirse pagar por todos los demás. Si eso fuera cierto, ¿por qué se permitió que las cosas llegaran tan lejos? Así que supongo que las dos partes están muy distanciadas. O que el NYT busca sangre, no dinero.
Yo tendría cuidado si fuera el Times. Su reputación y la del periodismo y los medios heredados en general ya no es lo que era. ChatGPT proporciona mucho más valor a más personas del que le está quitando a un periódico.... ¿Qué daño se le está haciendo al New York Times? Sí, hubo momentos en los que ChatGPT sacaba artículos enteros del NYT si conocías el código secreto. Pero esos códigos [secretos] pierden validez si mucha gente los utiliza, así que el daño siempre será limitado.
La otra cara de la moneda es que el público es muy anti-AI, y la mayoría de la gente no utiliza ChatGPT.... Necesitas una forma de apoyar a los creadores. Necesitas respetar la propiedad.
Lo ideal es que encontremos una forma que funcione para todos, tanto para los libros como para los datos.
Las primeras medidas dicen que si esto no se resuelve, es probable que gane NYT. Sin embargo, creo que es una pregunta equivocada. Lo que importa es el precio.
Sobre la AI Industry Foundation y AIIF legal
La AI Industry Foundation (AIIF) se fundó para rendir cuentas a la industria de la IA. Son una alianza de representantes de miembros corporativos que entienden que la IA seguirá cambiándolo todo y que quieren integrar su experiencia especializada con la de otros para adelantarse a los riesgos y oportunidades.
La AIIF trabaja para generar y recoger los intereses de los miembros en la IA a nivel personal, y luego atender esos intereses con conocimientos procesables sobre cuestiones de IA relacionadas con la estrategia empresarial, el uso interno, los riesgos sociales, el cumplimiento, los datos, las capacidades, las condiciones comerciales, la explicabilidad y la propiedad intelectual.
Sus conocimientos sobre IA se imparten a través de simposios públicos presenciales e híbridos, sesiones ejecutivas a puerta cerrada e informes escritos y externalizaciones.
AIIF legal es el boletín jurídico de insight de la AIIF.
Nota: Queremos agradecer a Harold Godsoe su colaboración en este artículo, cuyo original en inglés es: