El talón de Aquiles de ChatGPT es que no puede funcionar sin robar contenido

David Soriano Publicado el 10 de enero, 2024 • 18:30

El mundo de la Inteligencia Artificial tal y como lo conocemos podría cambiar para siempre con la guerra que tiene OpenAI, creadores de ChatGPT, contra algunos autores y medios que han denunciado que se han incluido sus contenidos protegidos para entrenar al sistema, lo que vulnera las leyes de copyright.

Lejos de admitir su culpa, OpenAI se ha defendido de una manera cuanto menos curiosa, reconociendo que sin estos datos de interés, por mucho que tengan copyright, los chatbots de IA serían poco más que herramientas inútiles si solamente usaran contenido no protegido.

ChatGPT y el uso de contenidos con copyright

En las últimas semanas, OpenAI, la empresa detrás del fenómeno ChatGPT, ha estado en boca de todos a raíz de la denuncia del New York Time el pasado 27 de diciembre de 2023 ante el Tribunal Federal del Distrito de Manhattan. El mítico periódico denunció que se han utilizado millones de artículos e investigaciones para entrenar al modelo de lenguaje detrás de la tecnología GPT-4. Esto, según los afectados, es una vulneración de los derechos de autor y otros contenidos que se han utilizado sin autorización para entrenar chatbots.

Herramienta ChatGPT de OpenAI

OpenAI y otras empresas rivales han sido acusadas de aprovecharse ilegalmente del trabajo de otros autores y artistas. Este uso no ético del trabajo realizado por terceros se acentúa todavía más desde el punto de vista de que ChatGPT y otras herramientas potenciadas por IA ganan un beneficio económico aprovechándose de la propiedad intelectual de otros.

Esto ha llevado a un efecto dominó por el que por ejemplo autores de prestigio como John Grisham (El Informe Pelícano) y George RR Martin (Canción de Hielo y Fuego) han demandado a la empresa por el uso de sus libros para entrenar ChatGPT. En cuanto a quien destapó todo este escándalo, el New York Times, ha exigido que OpenAI destruya cualquier sistema que haya sido entrenado utilizando su trabajo. En el lado contrario, OpenAI sí ha llegado a acuerdos con editores como Associated Press y Axel Springer para obtener acceso a su contenido.

Los chatbots serían inútiles

OpenAI valoró la presentación de estas demandas advirtiendo que la prohibición del uso de noticias y libros para entrenar chatbots condenaría el desarrollo de la Inteligencia Artificial en una de sus formas más populares (y más exitosas desde el punto de vista económico).

ChatGPT es infalible no te fíes

Parece ser que según los responsables de OpenAI, basar los entrenamientos de sus modelos de lenguaje solamente en contenido no protegido volvería prácticamente inútiles e inservibles sus creaciones.

“Debido a que los derechos de autor hoy cubren prácticamente todo tipo de expresión humana, incluidas publicaciones de blogs, fotografías, publicaciones en foros, fragmentos de código de software y documentos gubernamentales, sería imposible entrenar los principales modelos de IA actuales sin utilizar materiales protegidos por derechos de autor. Limitar los datos de entrenamiento a libros y dibujos de dominio público creados hace más de un siglo podría generar un experimento interesante, pero no proporcionaría sistemas de inteligencia artificial que satisfagan las necesidades de los ciudadanos de hoy”.

¿Están entonces cometiendo un delito? Según OpenAI no, ya que cumplen con todas las leyes de derechos de autor al entrenar sus modelos porque “creemos que legalmente las leyes de derechos de autor no prohíben el entrenamiento”.