sistemas de recuperación de información

Sistemas de recuperación de información desarrollados a partir del ‘dataset’ CORD-19

logo del conjunto de datos CORD19

Aquí os dejo enlace al artículo «Vista de Sistemas de recuperación de información implementados a partir de CORD-19: herramientas clave en la gestión de la información sobre COVID-19» que he publicado con Rosana López Carreño en la Revista Española de Documentación Científica (número de diciembre de 2020).

La investigación sobre el coronavirus ha generado una producción de documentos científicos extraordinaria. Su tratamiento y asimilación por parte de la comunidad científica ha necesitado de la ayuda de sistemas de recuperación de información diseñados de forma específica para esta cuestión. Algunas de las principales instituciones mundiales dedicadas a la lucha contra la pandemia han desarrollado el conjunto de datos CORD-19 que destaca sobre otros proyectos de similar naturaleza.

Los documentos recopilados en esta fuente han sido procesados por distintas herramientas de recuperación de información, a veces prototipos o sistemas que ya estaban implementados. Se ha analizado la tipología y características principales de estos sistemas concluyendo que hay tres grandes categorías no excluyentes entre ellas: búsqueda terminológica, visualización de información y procesamiento de lenguaje natural. En el artículo podemos ver que la gran mayoría de ellos emplean preferentemente tecnologías de búsqueda semántica con el objeto de facilitar la adquisición de conocimiento s los investigadores y ayudarlas en su ingente tarea.

Concluimos convencidos de que la crisis provocada por la pandemia ha sido aprovechada por los buscadores semánticos para encontrar su sitio. Y seguramente para no abandonarlo.

logo del conjunto de datos CORD19

Ha caído en mis manos una pequeña joya

cubierta del libro sobre las conferencias TREC

cubierta del libro sobre las conferencias TRECHa caido en mis manos, de forma temporal porque se lo he «quitado» a José Vicente, una pequeña joya: el libro ‘TREC: Experiment and Evaluation in Information Retrieval‘, editado por Ellen M. Voorhees y Donna K. Harman, que ha sido recientemente publicado por el MIT (nada más y nada menos).

Este libro constituye un verdadero homenaje a las conferencias TREC, el foro sobre recuperación de información que se convierte en el protagonista del libro. En el mismo, diversos especialistas comentan qué les ha parecido la evolución de estas conferencias en varios capítulos. Sólo he podido leer por encima un capítulo que dedican a la recuperación de información en idiomas diferentes del Inglés (entre ellos el idioma del inmortal Cervantes y del Fénix de los Ingenios), y otro donde proponen algunas medidas que se me habían «escapado» hasta ahora. Ya lo iremos comentando poco a poco, hasta que me lo pida su dueño.