Meta debatió la compra de la editorial Simon & Schuster para entrenar sus procesos de IA
La necesidad de contar con amplios conjuntos de datos de calidad acucia a todas las compañías que están trabajando en aplicaciones de inteligencia artificial y ponen sobre la mesa posibles operaciones que hace poco hubieran resultado insólitas.
Ese es el caso de Meta, que el año pasado llegó a acoger una discusión entre ingenieros, jefes y abogados sobre la posibilidad de adquirir la editorial Simon & Schuster para valerse de su catálogo con ese fin, según grabaciones obtenidas por The New York Times.
Esa oportunidad surgió en el contexto de las urgencias de Paramount por deshacerse de esa subsidiaria de cara a reducir su enorme deuda y la imposibilidad de que el grupo editorial Penguin Random House pudiera comprarla debido al veto del Departamento de Justicia en 2022 por motivos de competencia. Y quedó descartada cuando la firma de inversión KKR, propietaria de Axel Springer y otro centenar de empresas, acordó su adquisición en agosto de 2023.
La posible operación de Simon & Schuster, creada en 1924 y tradicionalmente considerada una de las cinco grandes editoriales en inglés de todo el mundo, en principio facilitaba a Meta el acceso a un vasto archivo de manera legal. Pero para entonces el gigante de la web social ya habría comenzado un proyecto para registrar información de títulos de ficción y no ficción a través de personas subcontratadas en África, y en ese ejercicio había contenido sujeto a derechos por el que no pagaba a sus propietarios. Las grabaciones obtenidas por The New York Times muestran que participantes en esas reuniones defendieron esa estrategia para ahorrar tiempo y dinero en licencias.
De hecho uno de los motivos clave para no intentar finalmente la compra de esa editorial habría sido ese, en la medida en que los asistentes determinaron que Meta podía confiar en el precedente legal establecido en 2015 con Google. En aquel año el Tribunal Supremo desestimó el recurso de un sindicato de autores y mantuvo la decisión de una instancia menor que había dado la razón a la compañía tecnológica en su ejercicio de digitalización de libros bajo la perspectiva del “uso justo”.
El gigante de la web social descartó finalmente la operación porque se considera cubierto por la sentencia favorable de 2015 al “uso justo” en digitalización de libros por parte de Google.
Precisamente el encaje de esa doctrina en relación con el uso de contenidos para entrenar procesos de inteligencia artificial es quizás el debate jurídico clave para determinar el rumbo de las relaciones entre poseedores de derechos y operadores tecnológicos. En el mismo artículo en el que The New York Times revela esas tribulaciones internas de Meta también aflora que OpenAI detectó a finales de 2021 un problema de suministro de datos que le llevó a experimentar con obtener transcripciones de YouTube. Según las fuentes consultadas, la compañía habría extraído así más de un millón de horas de contenido para un uso ajeno a lo que la plataforma contempla en su normativa, con lo que se expone a un nuevo frente legal.