14/10/2025

Negocios

Apple, bajo la lupa por su IA: dos neurocientíficos la acusan de entrenar con libros pirateados

Susana Martínez-Conde y Stephen Macknik aseguran que sus obras habrían terminado -sin permiso ni pago- dentro del set de datos que alimenta la inteligencia artificial de Apple. La demanda, presentada en California, pide compensaciones y que se frene el uso de material protegido. Más allá del gigante de Cupertino, el expediente podría marcar cómo se negocian licencias, transparencia y límites en toda la industria.

Cuando Apple presentó Apple Intelligence, la promesa fue simple y poderosa: una IA que entienda el contexto, respete la privacidad y "potencie" al usuario sin invadirlo. Ahora, esa narrativa choca con una acusación incómoda: dos neurocientíficos sostienen que la compañía entrenó sus modelos con copias no autorizadas de libros protegidos por copyright, supuestamente obtenidas de las llamadas shadow libraries (repositorios pirata que circulan por la web). Entre los títulos mencionados figuran Sleights of Mind y Champions of Illusion, obras que mezclan divulgación científica y neuropsicología de la percepción.

El planteo jurídico no discute sólo "de dónde vienen los datos", sino cómo fueron obtenidos. No es lo mismo que un modelo "haya visto" fragmentos dispersos en Internet, a que un sistema haya copiado corpus completos desde repositorios creados para eludir licencias. Si el tribunal entendiera que hubo copias previas ilícitas para armar el dataset, la causa podría ubicarse en el cuadrante más riesgoso del mapa legal: allí donde el fair use deja de ser escudo y empieza a contar el rastro documental de cada archivo.

¿Y qué pide la demanda? En esencia, dos cosas: dinero -por el uso no autorizado- y freno -que Apple no pueda seguir entrenando con ese material-. Pero lo verdaderamente interesante está en el "mientras tanto". El proceso de descubrimiento (la etapa probatoria) podría forzar a abrir la caja negra: ¿qué datasets se usaron?, ¿con qué licencias?, ¿hubo filtrado para excluir obras protegidas?, ¿quién decidió qué se quedaba y qué no? Esa trazabilidad, si se publica, puede convertirse en precedente para todo el sector.


En paralelo, la causa se inserta en un nuevo clima: en los últimos meses, la industria de IA enfrentó reclamos de autores, editoriales y medios que ya no apuntan al output (si el modelo "imita" o no un estilo), sino al origen del entrenamiento. Ese desplazamiento es clave. Obliga a las Big Tech a pensar menos en "lo que su IA puede hacer" y más en "cómo la alimentaron". Para Apple, que construyó su marca alrededor de la privacidad y el control, la contradicción reputacional duele el doble: ¿se puede prometer IA responsable si no hay claridad total sobre los datasets?

Hay otro matiz estratégico. La presión regulatoria y los acuerdos extrajudiciales recientes están encareciendo el entrenamiento. Si tribunales y reguladores consolidan la tesis de "licencias o exclusión", los grandes modelos deberán pagar por catálogos (libros, música, imágenes) o construir datasets más pequeños pero curados, con un impacto directo en costos y, quizás, en performance. El resultado probable: más alianzas con editoriales, más auditorías externas y etiquetado fino de procedencia de datos.

Para el ecosistema creativo en español -autores, sellos y periodistas de la región- la lectura es pragmática: no se trata de "ir contra la IA", sino de negociar reglas claras. Licencias colectivas con tarifas previsibles, herramientas de opt-out realmente efectivas y transparencia sobre qué material se usa... o no. Quien logre ese equilibrio antes, monetiza. Quien no, litiga.


¿Y Apple? Hasta ahora, la compañía suele responder en estos casos con el libreto clásico: cumplimiento de la ley, respeto por la propiedad intelectual y compromiso con la privacidad. El desafío de fondo es otro: demostrarlo con documentos, contratos y pipelines de datos auditables. Si lo hace, puede salir fortalecido -y hasta fijar estándar-. Si no, esta demanda puede convertirse en el primer hilo que, al tirar, deshilache la alfombra sobre la que descansa Apple Intelligence.

Lo que se juega en una frase: la IA es devoradora de datos; el futuro depende de si esos datos son legales, licenciados y trazables. Este caso no es un capítulo más del drama tech: es el guion que definirá cómo se escribe -y se cobra- el conocimiento en la era de los modelos generativos.

COMPARTE TU OPINION | DEJANOS UN COMENTARIO

Los comentarios publicados son de exclusiva responsabilidad de sus autores y las consecuencias derivadas de ellos pueden ser pasibles de sanciones legales.

Subscribite para recibir todas nuestras novedades