2020

Sistemas de recuperación de información desarrollados a partir del ‘dataset’ CORD-19

logo del conjunto de datos CORD19

Aquí os dejo enlace al artículo «Vista de Sistemas de recuperación de información implementados a partir de CORD-19: herramientas clave en la gestión de la información sobre COVID-19» que he publicado con Rosana López Carreño en la Revista Española de Documentación Científica (número de diciembre de 2020).

La investigación sobre el coronavirus ha generado una producción de documentos científicos extraordinaria. Su tratamiento y asimilación por parte de la comunidad científica ha necesitado de la ayuda de sistemas de recuperación de información diseñados de forma específica para esta cuestión. Algunas de las principales instituciones mundiales dedicadas a la lucha contra la pandemia han desarrollado el conjunto de datos CORD-19 que destaca sobre otros proyectos de similar naturaleza.

Los documentos recopilados en esta fuente han sido procesados por distintas herramientas de recuperación de información, a veces prototipos o sistemas que ya estaban implementados. Se ha analizado la tipología y características principales de estos sistemas concluyendo que hay tres grandes categorías no excluyentes entre ellas: búsqueda terminológica, visualización de información y procesamiento de lenguaje natural. En el artículo podemos ver que la gran mayoría de ellos emplean preferentemente tecnologías de búsqueda semántica con el objeto de facilitar la adquisición de conocimiento s los investigadores y ayudarlas en su ingente tarea.

Concluimos convencidos de que la crisis provocada por la pandemia ha sido aprovechada por los buscadores semánticos para encontrar su sitio. Y seguramente para no abandonarlo.

logo del conjunto de datos CORD19

El origen de la palabra «ordenador».

IBM 650, finales de los años 50

Tanto la palabra «ordenador» como la palabra «informática» son de origen francés y ambas comparten una misma idea, que las máquinas que se estaban desarrollando de forma frenética en los años 60 servían para algo más que para contar, tal como hacían las calculadoras (concepto más cercano a la idea de ‘computer’ que había en esos tiempos).

Por esta razón, cuando la empresa IBM quiso introducir en Francia su equipo 650 en el año 1955, su responsable de publicidad en este país, François Girard, insistió en buscar una palabra más familiar en su lengua y para ello recurrió (hizo bien sin duda alguna) a un antiguo profesor de filología en la Sorbona. Jacques Perretquien «le puso en la pista» sugiriendo la palabra ‘ordonnateur‘ («alguien que lo pone todo en orden») que provenía del latín ‘ordinare’.

IBM 650, finales de los años 50

Finalmente, IBM no terminó de hacer caso del todo a las sugerencias del antiguo profesor e introdujo la palabra ‘ordinateurque termina introduciéndose como término de normal uso en francés y se «traslada» a otras muchas lenguas, como el español que usamos en Europa (porque en América se sigue usando «computador» o «computadora» de forma masiva).