Proyecto Stop The Clock. Extracción de datos de fuentes de información no estructuradas
Extracción y análisis de datos no estructurados y lenguaje natural
Stop the clock es un proyecto cuyo objetivo es la extracción y análisis de la información no estructurada, escrita en lenguaje natural, de la página web de la EFSA donde se publica la información en artículos PDF (informes, actas…), HTML y ficheros de texto, automatizando procesos de recopilación de datos estructurados, almacenables, comprensibles y analizables.
OBJETIVOS
Stop the clock ha sido creado con los siguientes fines:
- Facilitar y automatizar la recolección de información de fuentes externas con documentos redactados en lenguaje natural, como actas y documentación con recomendaciones y peticiones sobre diversos productos.
- Controlar el tiempo de respuesta desde la publicación de resultados en la fuente externa y la respuesta por parte de la empresa o institución al organismo oficial, reduciendo tiempos de análisis de todos los informes publicados y controlando los tiempos de respuesta de los organismos implicados.
Con este ciclo de trabajo se controla, a través de gráficos estadísticos, las reuniones, publicación, aprobación y seguimiento de los productos, que ayudan a comprender los tiempos de respuesta de ambas organizaciones. De esta manera, se puede mejorar la comunicación y gestión entre ellas, permitiendo ajustar los mecanismos para reducir los tiempos empleados en la toma de decisiones, ya que cada organismo tendrá un reloj de tiempo que registrará sus respuestas y acciones.
Con esta visión global se facilita la comprensión y el acceso a una información que, de otra manera, lleva meses de revisiones de actas y publicaciones web.
Duración: 2018-2021
Funding type: Private/industrial