![]()
Escándalo en el sector de la IA: Acusan a NVIDIA de entrenar sus modelos con millones de libros sin autorización
Una nueva demanda colectiva presentada por autores y editoriales alega que NVIDIA utilizó un conjunto de datos masivo, que incluye millones de libros protegidos por derechos de autor, para entrenar sus modelos de inteligencia artificial sin haber obtenido licencias ni compensado a los creadores originales.
Los detalles de la controversia:
-
El origen de los datos: La acusación sostiene que la empresa utilizó repositorios de datos que contienen obras literarias completas obtenidas de sitios de piratería y bibliotecas digitales no autorizadas. Estos textos habrían sido fundamentales para mejorar la capacidad de comprensión y generación de lenguaje natural de sus sistemas.
-
La defensa de NVIDIA: Aunque la empresa no ha emitido una respuesta formal detallada ante el tribunal, su postura histórica en casos similares es que el entrenamiento de modelos de IA constituye un «uso legítimo» (fair use), ya que el resultado final es una herramienta transformadora y no una copia directa de las obras.
-
Presión sobre la propiedad intelectual: Este caso se suma a una serie de litigios similares contra otras empresas como OpenAI y Meta. Los autores argumentan que si la IA puede resumir, imitar el estilo o responder preguntas basadas en sus libros, está explotando comercialmente su propiedad intelectual de manera injusta.
-
Posibles consecuencias: De prosperar la demanda, NVIDIA podría enfrentarse a multas multimillonarias y a la obligación de establecer sistemas de pago de regalías. Además, esto podría forzar a las tecnológicas a ser mucho más transparentes sobre las fuentes de datos utilizadas en el entrenamiento de sus chips y algoritmos.
