The New York Times veta el uso de su contenido para entrenar sistemas de inteligencia artificial

Medios

martes 15 de agosto del 2023

Actualizado el 18/08/2023 10:05

En esta noticia se habla de:

The New York Times

El pasado 3 de agosto The New York Times actualizó sus términos de uso para incluir la prohibición de la ingesta de sus contenidos de cara a entrenar cualquier sistema basado en aprendizaje automático o inteligencia artificial. Además, la editora del periódico veta que robots de rastreo con fines de indexación para posicionamiento sean aprovechados con ese objetivo en una cláusula que apunta directamente a Google y Microsoft.

Eso protege en principio el enorme archivo de texto, imágenes o ilustraciones acumulado en los 172 años de historia del diario, sumado al inventario multimedia que ha realizado desde el estreno de su versión digital en 1996. Pero en todo caso, la lista de formatos no es exhaustiva e incluye también metadatos o el propio diseño de la experiencia de usuario como forma de impedir que un tercero emplee sin licencia cualquier propiedad de The New York Times. Lo que esos términos no concretan es la sanción a la que se expondría un eventual infractor y desde el diario no hay mayor concreción, según refleja AdWeek tras haber elevado consulta al respecto.

Uno de los aspectos más problemáticos de la prohibición es que precisamente los sistemas que utilizan esos datos son muy similares a los bots con los que los buscadores rastrean las webs para indexar su contenido. Y de momento los medios no tienen la posibilidad de discriminar la intención de esos procesos para permitir operar a unos frente a otros sobre su contenido. Eso, por ejemplo, hace posible que aplicaciones de inteligencia artificial generativa puedan acceder a piezas colocadas tras un muro de pago para aflorar respuestas a preguntas directas en búsquedas o conversaciones con bots, con el eventual perjuicio que eso pueda generar a los editores.

Eso deja en manos de los creadores de esa tecnología la opción de dar mayor control a los medios sobre el acceso a su trabajo. Mientras OpenAI, creadora de ChatGPT, ha estrenado recientemente un bot que en principio sí permitirá restringir a voluntad el rastreo de contenidos con fines de aprendizaje automático, Google y Microsoft no han indicado nada al respecto. Los dos gigantes tecnológicos están compitiendo en el ámbito de las respuestas directas y enriquecidas mediante inteligencia artificial generativa de sus servicios Bing y Bard, y hasta el momento no han habilitado nada que permita a los medios distinguir lo que pueden rastrear en función de su objetivo.

Una reciente investigación de The Washington Post concluía precisamente que compañías como Google y Meta había estado usando contenido de unos 15 millones de sitios para entrenar sus modelos de lenguaje natural a gran escala, entre ellos el de grandes medios. Y en este escenario, aún por definir a nivel legal, empiezan a producirse acercamientos como el que se ha sustanciado en un acuerdo entre OpenAI y Associated Press para que la primera use el archivo de la segunda hasta 1985. Todo ello mientras editores importantes preparan un frente común del que el propio The New York Times se habría descolgado, según informa Semafor.

The New York Times veta el uso de su contenido para entrenar sistemas de inteligencia artificial

martes 15 de agosto del 2023

otras noticias de Medios

Netflix flaquea ante las exigencias del mercado y acumula una caída del 40% en el último año

Lucía González será la nueva directora de El HuffPost tras dirigir el tráfico de El País

BBC pierde la mayor cantidad de hogares que pagan el canon desde la pandemia y su modelo sigue en discusión

El Gobierno concentra el 90% de las intervenciones políticas en el programa de Intxaurrondo

El Terrat dispara sus ingresos un 40% hasta los 30 M€ tras la llegada de La Revuelta

iVoox apuesta por el pago único de podcasts como nueva vía de monetización

Noticias relacionadas:

Disney y The New York Times se unen para influir en el debate regulatorio sobre la inteligencia artificial

The New York Times acumula gastos de más de 20 M en demandas contra startups de IA

The New York Times más que duplica el crecimiento de ingresos publicitarios digitales en un año

The New York Times emplea a 2.300 periodistas tras haber incorporado un 50% más en los últimos 10 años

Berkshire Hathaway invirtió en The New York Times en el último trimestre de Warren Buffett como consejero delegado

La publicidad supera las expectativas de The New York Times e impulsa un nuevo récord de ingresos digitales

The New York Times demanda a Perplexity por usar su contenido sin licencia

El aumento de demanda y los nuevos emplazamientos disparan un 20% la publicidad digital de The New York Times