Google

Google permite que los medios bloqueen su uso de datos para procesos de IA sin perjudicar al posicionamiento

| 3 OCTUBRE 2023 | ACTUALIZADO: 3 OCTUBRE 2023 13:17

Una nueva herramienta denominada Google-Extender habilitará en lo sucesivo a los administradores de cualquier web para que determinen si quieren o no que sus datos sean utilizados por el gigante de las búsquedas en sus procesos de inteligencia artificial. Y, lo que es más importante, permitirá denegar ese acceso sin que por ello se vea perjudicada la visibilidad SEO del sitio, algo crucial para muchos medios que dependen en gran parte de ese tráfico.

Esta medida va en línea con lo ya hecho hace algunas semanas por OpenAI, cuyo registro de negativas ha ido en aumento e incluye a medios como The New York Times o The Guardian. Igual que en el caso de la compañía creadora de ChatGPT, Google reconocerá los eventuales bloqueos a través del archivo robots.txt, donde tradicionalmente se detallan las instrucciones que cualquier sitio web facilita a los bots que rastrean su contenido.

Y la compañía ha indicado además que explorará “enfoques adicionales legibles por máquina para la elección y el control de los editores”, de cara a un futuro en el que se prevé que las aplicaciones basadas en inteligencia artificial crecerán exponencialmente. Algunos críticos con Google u OpenAI apelan a que la mayor parte de la ingesta de datos necesarios para sus servicios ya se habría producido, y por tanto las webs que habiliten a partir de ahora el rechazo al rastreo enfocado a sus procesos de inteligencia artificial no podrán evitar el aprovechamiento de su trabajo previo.

Hasta el momento no existe forma de saber cuánto de ese contenido habría sido revisado y agregado por esos bots, ni cuánto de él habría sido empleado en las diferentes aplicaciones actuales de la inteligencia artificial generativa. Por ejemplo, News Corp distingue tres usos a día de hoy: entrenamiento de procesos, respuestas de bots conversacionales y agregación o sintetización en respuestas monetizadas por terceros.

Google ya había confirmado en julio que está entrenando a su bot conversacional, denominado Bard y desarrollado para competir con ChatGPT, con datos públicos alojados en diferentes webs. Y hasta la fecha quienes quisieran proteger su contenido de esta práctica no podía discriminar el rastreo dedicado a ese fin con el que les garantiza aparecer en búsquedas, lo que estaba generando un malestar creciente en la industria de los medios. En agosto, The New York Times cambió los términos de uso de su inventario general de piezas publicadas precisamente para vetar el uso de sistemas de ese tipo sobre él.