Ricardo Baeza-Yates es uno de los grandes referentes mundiales en el ámbito de la ciencia de la computación y la inteligencia artificial. Con una trayectoria brillante que combina la excelencia académica y la innovación empresarial, ha sido Director de Investigación de Yahoo Labs en Europa y América Latina, y actualmente ejerce como Director de Investigación en el Institute for Experiential AI de la Northeastern University, además de colaborar con prestigiosas instituciones españolas como la Universitat Pompeu Fabra.
Más allá de su faceta técnica, Baeza-Yates destaca por su constante compromiso ético frente al avance de los sistemas automatizados, siendo un pionero en el estudio y la denuncia de los sesgos en los datos y la inteligencia artificial.
¿Existe el riesgo de que los medios utilicen la IA de manera poco ética o irresponsable? ¿Sería necesario un código ético universal?
Debería haberlo, pero es una decisión de ustedes, los medios. Ya existe en la medicina, se está pensando también para los profesionales de la Informática. Creo que para cualquier tipo de profesión que use la IA, se debe tener un código ético, que van a ser muy parecidos en el fondo. Esos códigos ya existen tal vez implícitamente.
El problema ya lo tenemos sin IA. Hoy en día hay titulares falsos, contenido que se manipula o incluso todo el contenido es inventado o falso, que se utiliza mucho en política actualmente. El código ético debería existir de manera independiente a la IA. Ya hay un problema con todo esto.
El problema es que con la IA esto se puede multiplicar por mil. Lo dañino es que genera muy bien los textos, con sentido, bien escritos y que, por tanto, son más fáciles de creer. Sobre todo, por los sesgos de confirmación. Es decir, si tu ves algo con lo que estás de acuerdo o con lo que quieres creer porque te interesa esa posición, entonces lo haces como tuyo.
¿Crees entonces que la desinformación está aumentando por la IA?
Muchísimo. Hay que analizar lo que pasó en el 2024, que fue el año en el que más gente votó en el mundo. Miles de millones de personas. Hubo elecciones de distinto tipo en más de cien países. Puedes ver quiénes fueron elegidos en 2024 y 2025. Muchos gobiernos populistas, que tenían mucho dinero para invertir en el uso de bots y de la IA para manipular gente.
Los periodistas utilizamos las LLM como fuente de información ¿Es fiable?
No. Yo soy experto en buscadores. Hay que distinguir entre buscar información, verificar las fuentes… y predecir la información. Estos lenguajes lo que hacen es predecir la información. Por supuesto, en esa predicción pueden cometer un error. Cuanto más específico es el tema, más fácil es que se inventen algo.
«La fuente [para un periodista] no puede ser un modelo de lenguaje, tiene que ser algo con mucho más reputación».
Diría que si eres un buen periodista, no seas perezoso. Si utilizas un modelo de lenguaje, por favor verifica muy bien que eso sea cierto. Y es que el sistema puede haber aprendido de una noticia falsa que ya existía. La fuente no puede ser un modelo de lenguaje, tiene que ser algo con mucho más reputación.
¿Es ético, responsable, que la IA generativa escriba noticias hoy en día en medios de comunicación convencionales?
Yo no uso el verbo escribir. Escribir significa que entienden lo que generan. No lo entienden, son predictivos. Depende mucho de cómo se usa. Si tú le das todos los datos al sistema, estos son los hechos, se los das y pides que te lo escriba, lo único que estás evitando es escribir. No me parece tan grave. Es hacer tu trabajo más rápido. Me parece razonable.
El problema es cuando dejas que la IA lo haga todo. No hay ninguna contribución tuya. Y ahí se pueden inventar datos. Incluso cuando los datos existen, pueden ser tergiversados. Prefiero la palabra confabulación, mejor que la de alucinación. Hay que verificar.
Los medios hoy en día tienen un modelo de negocio un poco incierto. ¿Los periodistas debería tener miedo a perder su empleo tras la irrupción de la IA?
No deberían tenerlo. El periodismo no es escribir el artículo. Periodismo es conseguir los datos para tener una noticia muy buena. El periodista de investigación no puede ser reemplazado. Los verdaderos periodistas no deben tener miedo a la IA. Como decía, sí van a poder hacerlo más rápido.
Cualquier modelo de lenguaje, al ser puesto al servicio del público, debiera obligatoriamente tener una herramienta que permitiera saber si un texto fue generado por ese modelo, o no. Cualquier persona podría verificarlo y así tener más transparencia en si hay un algoritmo detrás o no lo hay.
«Para cualquier tipo de profesión que use la IA, se debe tener un código ético, que van a ser muy parecidos en el fondo».
¿Qué modelo de negocio crees que va a imperar en estas plataformas de IA? Google ha construido un negocio multimillonario con las búsquedas pagadas ¿Se podrá trasladar a herramientas tipo ChatGPT, Perplexity…?
Sí. De hecho, ChatGPT ya lo está haciendo. Es uno de los que ha comenzado con la venta de publicidad al lado de los textos que genera. Puede tener éxito porque todo el mundo lo está usando. El tráfico a los buscadores, de los sitios web ha bajado. La pregunta es cuáles son los conflictos de interés cuando uno tiene información pagada con respecto a la información generada. Va a haber un nuevo tipo de generación de contenidos en la web para manipular lo que estos sistemas aprenden.
El problema es que ya un porcentaje muy grande del contenido de la web es generado por estos sistemas. Una teoría dice que los sistemas, si utilizan lo que ellos mismos generan, van a colapsar. Lo que sí es cierto es que no van a aprender porque básicamente están generando las mismas cosas que ya procesaron antes. Se genera un círculo vicioso donde no se aprende nada nuevo.
Espero que haya algún tipo de regulación en el tema de la publicidad. Anthropic ya dijo que no iba a hacer publicidad. Hay dos visiones distintas.
La IA está provocando un descenso del tráfico en los medios, lo mencionabas antes. Hay plataformas que están llegando a acuerdos económicos con grandes medios ¿Puede ser la IA una tabla de salvación para el modelo económico de los medios?
No lo se. Lo que sí se es que es algo que deberían haber hecho antes. Hay muchos casos en Estados Unidos de violación de los derechos de autor. The New York Times, Getty Images son algunos ejemplos. Algunos casos llevan más de dos años y sus resultados van a ser muy importantes. Va a haber que decidir el alcance que tiene el derecho de autor en este tipo de modelos. No está determinado y no es algo que se haya considerado en la regulación europea.
¿Los resultados de la IA igualan a los medios periodísticos de referencia con otro tipo de webs desconocidas pero bien posicionadas para los buscadores?
Hago una respuesta hipotética. Los únicos que puede responder son las personas que trabajan dentro de OpenAI, Anthropic o de Google sobre cómo entrenan los modelos. Hay lo que se llama curar datos. Es decir, hay datos más importantes que otros, hay datos que no se usan porque son de mala calidad… Hay sitios web que no se usan porque se sabe que son basura.
No se si se hace así, pero podría haber pesos distintos para algo que viene de The New York Times a lo que viene de un sitio digital desconocido. Pero The New York Times también publica a veces cosas que no son ciertas. Es un asunto complicado. No es un asunto de qué medio es. Uno debería ir a qué noticia es. Aquí también se puede utilizar la IA para verificar la veracidad de la noticia. Pero, por supuesto, la IA también se equivoca.
Un tema que me gustaría mencionar es el de la colonización cultural. Si la mayor parte de los textos son entrenados en un cierto país, como por ejemplo Estados Unidos o por la cultura occidental, el sistema tiene los sesgos de esa cultura. Y hay mucha censura que nunca ves. Puede pasar con temas controversiales, como el aborto, el control de armas o la inmigración en Estados Unidos. Muchas veces no hay una respuesta única. Hay distintos puntos de vista. Generalmente, se suele tener un punto de vista, en vez de tres: el de Estados Unidos, el de China y el de Rusia, por ejemplo.
La colonización cultural acaba con la diversidad que tenemos. También de idiomas. Estas herramientas pueden ser usadas en unos 200 idiomas y realmente hay 7.100 en el mundo. Hay un 10% de la gente en el mundo que no habla ninguno de esos idiomas más populares. Y otro 35% que no tiene Internet. Lo que está ocurriendo es que estamos aumentando la brecha digital entre las personas con tecnología y sin tecnología. Tampoco es bueno, porque estás matando culturas y diversidad de opinión. Vamos a un mundo mucho más normalizado, lo que es dañino para la evolución del ser humano.
Las compañías están comenzando a invertir en proteger su reputación en las plataformas de IA ¿Realmente se puede entrenar a estas herramientas para que los mensajes que genere sean coherentes con el relato corporativo de las compañías?
Sí, esta comenzando a ocurrir. Ya pasaba antes con el SEO. Ahora existe lo que yo llamaría LLMO (Large Lenguage Model Optimization). Se puede hacer, pero es mucho más difícil que antes. No dependes de enlaces o de textos. Es más alquimia que ciencia. Hay mucha gente que vive de decir que eso se puede hacer.
Regulación
¿Qué modelo normativo apoya para que se regule todo esto de la IA?
Hay que regular. Así se evitan innovaciones dañinas. No toda la innovación es positiva. De hecho, las mejores innovaciones han ocurrido con muy buenas regulaciones o con restricciones que existieron en algún momento.
Los mayores inventos de la humanidad ocurrieron cuando no había mucha abundancia. Si no al revés, ocurren cuando hay restricciones. La legislación ayuda a que haya restricciones sensatas. Como son los Derechos Humanos, una regulación básica de cómo debemos comportarnos y que lamentablemente no se cumplen en todo el planeta todavía.
No iría a la regulación europea. Tiene graves problemas. Primero, porque nunca hemos regulado el uso de la tecnología. Es un experimento que no va a ir bien porque si tenemos que regular el uso de cualquier tecnología nueva, tiene que ser coherente con todos los usos de la tecnología antigua. Es un rompecabezas muy difícil para los abogados.
Hay que regular de forma sectorial, como se hace actualmente. Y que sea independiente de la tecnología. Como el tema de la privacidad: me da lo mismo qué tecnología usas, pero tiene que cumplir estas reglas. Deberíamos hacer lo mismo para cada tema. Por supuesto, es mucho más difícil porque la IA afecta a todo.
Otro problema es que no solo hay que regular la IA, hay que regular cualquier sistema algorítmico. Se puede hacer daño con cualquier software.
Y otro tema es el riesgo. El riesgo es una variable continua. Categorías como alto riesgo, riesgo bajo o sin riesgo son ficticias. Son categorías que nos van a complicar. ¿Cuál es la frontera entre la piel oscura y la piel clara? Ya cometimos ese error y aquí estamos cometiéndolo de nuevo.














