El coronavirus dejó sin clientes en cuestión de días a Narrativa, una exitosa startup que, en menos de cinco años, había logrado elaborar 300.000 noticias a la semana mediante herramientas de Inteligencia Artificial (IA), y suministrarlas a 25 medios diferentes. Pero el equipo de esta pequeña empresa decidió pasar de la frustración a la acción. El resultado fue crear la base de datos con el acceso estructurado (API) más grande del mundo en abierto, en torno a la COVID-19.

El ‘core business’ de Narrativa es la creación de contenidos automáticos basados en datos y producidos con IA y ‘machine learning’. Desde clasificaciones sobre fútbol o finanzas hasta textos más complejos. De forma similar a como las fábricas de licores ahora producen geles hidroalcoholicos, o como la industria textil ha virado para aportar batas y atuendos a los sanitarios, Narrativa ha decidido poner a disposición de medios e instituciones un recurso donde confluyen las fuentes de datos más grandes y conocidas del mundo en torno a la epidemia, además de fuentes de datos locales, regionales y provinciales.

Uno de los banner producidos por Narrativa a diario con IA.

“La publicidad ha desaparecido de los medios, y los clientes propusieron paralizar todos los contratos. Fue un duro golpe, pero en ese momento nos planteamos, ante el desastre que esto era para todos, qué podríamos hacer para ayudar. Descubrimos que no había fuentes de datos estructuradas accesibles y que el nivel de la información sobre datos estadísticos del coronavirus que ofrecen las autoridades es ínfimo. Ya que nadie estaba dando esa estructuración de datos decidimos hacerlo nosotros”, relata David Llorente, el CEO de Narrativa.

Todo el equipo de Narrativa -doce personas- trabajó intensamente en el proyecto durante 10 días. La base de datos es actualmente la más grande del mundo, y es empleada por empresas de verificación de bulos, medios de comunicación, startups, entidades financieras como el Banco Iberoamericano de Desarrollo o diarios como el Boston Globe. En ella se facilitan análisis, estudios y visualización de los datos estadísticos, y por tanto anónimos. 

Gracias a su acuerdo con la agencia Efe, la primera agencia de noticias en español del mundo distribuye entre sus clientes los gráficos y noticias de la COVID-19 que Narrativa produce con sus herramientas de IA. La corporación RTVE y el portal Infobae también colaboran con la iniciativa.

Mapa del coronavirus en el mundo generado cada día desde Narrativa con IA.

Medios dedicados al fact-checking, como Maldita, van a promover además un proyecto con esta fuente de datos, mientras que en Estados Unidos, el medio de comunicación de mayor prestigio en información sobre salud, STATnews.com, ha lanzado un tracker  (páginas web con enormes directorios de los archivos compartidos y campos de búsqueda) y utiliza la base de datos de Narrativa. También hay entidades como cámaras de comercio o asociaciones de empresarios que la están utilizando para sus asociados.

A priori, se trata de un proyecto pro bono, del que sus promotores no obtienen nada, aunque, según Llorente, les está dando bastante visibilidad. “No la buscábamos, pero ha sido un efecto colateral y bueno para nosotros”. Gracias a la Inteligencia Artificial, cada 30 minutos generan más de 6.000 noticias (actualizaciones), y lo mismo sucede con los gráficos. 

De la frustración a arrimar el hombro

“Este proyecto nació de la frustración, pero hay que salir de ella y pensar que todos tenemos que arrimar el hombro”, considera Llorente, para quien el Gobierno debería crear una base de datos en abierto de manera que investigadores, periodistas y curiosos pudieran colaborar. “Las administraciones tienen que despertar para que toda la comunidad trabaje sobre estos datos. Se puede usar para miles de cosas e iniciativas”, añade.

La necesidad de contar con datos estructurados en abierto no es solo un asunto de transparencia, a juicio de Llorente. “Se puede ser transparente con un pdf. Pero hay que entender que el mundo de los datos es el futuro. No puedes luchar contra una pandemia únicamente con médicos, porque en 24 horas no se forman médicos. El sistema no lo aguanta”, dice. 

“Lo que hay que hacer es trabajar con los datos. Ser capaces de detectar lo que está pasando a un nivel epidemiológico y evitar que el sistema se desborde. Para eso los datos son clave. Hay que hacer los datos abiertos para que la gente trabaje sobre ellos y aporte nuevos modelos. Eso no se hace con un pdf. Se necesita una base de datos abierto y con infraestructura como para soportar un volumen de llamadas altísimo. Es la filosofía de la transparencia, pero es mucho más que eso”.

Marta Sánchez Esparza | @martasesparza

Share This