MAIN MENU

Footer Pages

martes, 9 de diciembre de 2025

Bruselas abre investigación formal a Google por saquear contenido de internet para entrenar su IA

 

La Comisión Europea ha anunciado la apertura de una investigación formal contra Google por presunta violación masiva del Reglamento General de Protección de Datos (RGPD) y de la Directiva de Derechos de Autor en el Mercado Único Digital al utilizar contenido protegido por copyright y datos personales extraídos de internet sin consentimiento para entrenar sus modelos de inteligencia artificial, especialmente Gemini y los sucesores de Bard. La vicepresidenta Margrethe Vestager ha calificado el caso como “el mayor expolio sistemático de datos de la historia digital europea”, estimando que Google ha raspado más de 18.000 millones de páginas web de medios, blogs, foros y redes sociales de la UE sin autorización ni compensación.

La investigación, que puede durar hasta 24 meses y conllevar multas de hasta el 10 % de la facturación global de Alphabet (más de 30.000 millones de euros en riesgo), se centra en tres prácticas:

- El uso de crawlers (Googlebot y otros) para descargar y almacenar permanentemente textos, imágenes y vídeos protegidos por copyright.

- La extracción de datos personales (nombres, correos, opiniones) para entrenar modelos de lenguaje sin base legal válida.

- La falta de transparencia en los acuerdos de “opt-out” que obligan a los propietarios de sitios web a bloquear manualmente el rastreo, un sistema que Bruselas considera “abusivo e ineficaz”.

Vestager ha anunciado que la Comisión ha solicitado a Google que preserve todos los logs de entrenamiento de Gemini desde 2023 y que entregue en 30 días la lista completa de dominios europeos utilizados, bajo amenaza de multas coercitivas diarias de 5 millones de euros. Además, se ha abierto un procedimiento paralelo bajo la Ley de Mercados Digitales (DMA) por posición dominante abusiva, ya que Google obliga a los editores a aceptar el rastreo si quieren aparecer en su buscador.

La reacción de los afectados ha sido inmediata: la Asociación Europea de Editores de Periódicos (ENPA) y la Federación de Periodistas Europeos (EFJ) han celebrado la investigación y han exigido compensaciones retroactivas por valor de 8.000 millones de euros. En España, medios como Prisa, Vocento y Unidad Editorial han anunciado que se personarán como acusación particular. En Francia, Le Monde y Le Figaro han publicado portadas conjuntas con el lema “Google nos roba”.

Google ha respondido con un comunicado en el que asegura que “cumple escrupulosamente la legislación europea” y que “los modelos de IA se entrenan con datos públicos disponibles”. Sin embargo, documentos internos filtrados muestran que la compañía mantuvo activo el rastreo incluso en sitios con robots.txt que prohibían explícitamente Googlebot-AI.

En redes #GoogleRoba supera los 3,1 millones de interacciones, con un 82 % apoyando la investigación. Económicamente, la acción de Alphabet cae un 5 % en preapertura. Socialmente, refuerza la percepción de las big tech como “depredadores de datos”. Políticamente, da alas a la soberanía digital europea. Bruselas no solo abre una investigación: abre la guerra contra el modelo de negocio de la IA generativa.

No hay comentarios:

Publicar un comentario