2020

Sistemas de recuperación de información desarrollados a partir del ‘dataset’ CORD-19

logo del conjunto de datos CORD19

Aquí os dejo enlace al artículo «Vista de Sistemas de recuperación de información implementados a partir de CORD-19: herramientas clave en la gestión de la información sobre COVID-19» que he publicado con Rosana López Carreño en la Revista Española de Documentación Científica (número de diciembre de 2020).

La investigación sobre el coronavirus ha generado una producción de documentos científicos extraordinaria. Su tratamiento y asimilación por parte de la comunidad científica ha necesitado de la ayuda de sistemas de recuperación de información diseñados de forma específica para esta cuestión. Algunas de las principales instituciones mundiales dedicadas a la lucha contra la pandemia han desarrollado el conjunto de datos CORD-19 que destaca sobre otros proyectos de similar naturaleza.

Los documentos recopilados en esta fuente han sido procesados por distintas herramientas de recuperación de información, a veces prototipos o sistemas que ya estaban implementados. Se ha analizado la tipología y características principales de estos sistemas concluyendo que hay tres grandes categorías no excluyentes entre ellas: búsqueda terminológica, visualización de información y procesamiento de lenguaje natural. En el artículo podemos ver que la gran mayoría de ellos emplean preferentemente tecnologías de búsqueda semántica con el objeto de facilitar la adquisición de conocimiento s los investigadores y ayudarlas en su ingente tarea.

Concluimos convencidos de que la crisis provocada por la pandemia ha sido aprovechada por los buscadores semánticos para encontrar su sitio. Y seguramente para no abandonarlo.

logo del conjunto de datos CORD19

El origen de la palabra «ordenador».

IBM 650, finales de los años 50

Tanto la palabra «ordenador» como la palabra «informática» son de origen francés y ambas comparten una misma idea, que las máquinas que se estaban desarrollando de forma frenética en los años 60 servían para algo más que para contar, tal como hacían las calculadoras (concepto más cercano a la idea de ‘computer’ que había en esos tiempos).

Por esta razón, cuando la empresa IBM quiso introducir en Francia su equipo 650 en el año 1955, su responsable de publicidad en este país, François Girard, insistió en buscar una palabra más familiar en su lengua y para ello recurrió (hizo bien sin duda alguna) a un antiguo profesor de filología en la Sorbona. Jacques Perretquien «le puso en la pista» sugiriendo la palabra ‘ordonnateur‘ («alguien que lo pone todo en orden») que provenía del latín ‘ordinare’.

IBM 650, finales de los años 50

Finalmente, IBM no terminó de hacer caso del todo a las sugerencias del antiguo profesor e introdujo la palabra ‘ordinateurque termina introduciéndose como término de normal uso en francés y se «traslada» a otras muchas lenguas, como el español que usamos en Europa (porque en América se sigue usando «computador» o «computadora» de forma masiva).

La «sociedad red»

alegoría de la "Sociedad Red" de Castells

El eminente profesor, científico, y anterior ministro de Universidades Manuel Castells, es el autor del término «sociedad red«:

"En conclusión, internet es la sociedad, expresa los procesos sociales, los intereses sociales, los valores sociales, las instituciones sociales. ¿Cuál es, pues, la especificidad de internet, si es la sociedad? La especificidad es que es constituye la base material y tecnológica de la sociedad red, es la infraestructura tecnológica y el medio organizativo que permite el desarrollo de una serie de nuevas formas de relación social que no tienen su origen internet, que son fruto de una serie de cambios históricos pero que no podrían desarrollarse sin internet. Esa sociedad red es la sociedad que yo analizo como una sociedad cuya estructura social está construida en torno a redes de información a partir de la tecnología de información microelectrónica estructurada en internet. Pero internet en ese sentido no es simplemente una tecnología; es el medio de comunicación que constituye la forma organizativa de nuestras sociedades, es el equivalente a lo que fue la factoría en la era industrial o la gran corporación en la era industrial. Internet es el corazón de un nuevo paradigma sociotécnico que constituye en realidad la base material de nuestras vidas y de nuestras formas de relación, de trabajo y de comunicación. Lo que hace internet es procesar la virtualidad y transformarla en nuestra realidad, constituyendo la sociedad red, que es la sociedad en que vivimos".

fotografía del profesor Manuel CastellsEste párrafo corresponde con las conclusiones de su discurso de apertura del curso académico del programa de doctorado de la Sociedad de la Información y el Conocimiento (10 de marzo de 2003) en la UOC, que comenzaba con las siguientes palabras:

"Internet es el tejido de nuestras vidas en este momento. No es futuro. Es presente. Internet es un medio para todo, que interactúa con el conjunto de la sociedad y, de hecho, a pesar de ser tan reciente, en su forma societal (aunque como sabemos, internet se construye, más o menos, en los últimos treinta y un años, a partir de 1969; aunque realmente, tal y como la gente lo entiende ahora, se constituye en 1994, a partir de la existencia de un browser, del World Wide Web) no hace falta explicarlo, porque ya sabemos qué es internet. Simplemente les recuerdo, para la coherencia de la exposición, que se trata de una red de redes de ordenadores capaces de comunicarse entre ellos. No es otra cosa. Sin embargo, esa tecnología es mucho más que una tecnología. Es un medio de comunicación, de interacción y de organización social. Hace poco tiempo, cuando todavía internet era una novedad, la gente consideraba que, aunque interesante, en el fondo era minoritaria, algo para una elite de internautas, de digerati, como se dice internacionalmente. Esto ha cambiado radicalmente en estos momentos. Para recordarles brevemente la progresión, les diré que la primera encuesta seria sobre usuarios de internet que yo conozco, de finales del noventa y cinco señalaba que había unos 9 millones de usuarios. En este momento estamos en torno a los 350 millones de usuarios en el mundo. Las previsiones conservadoras prevén que, para mediados del año 2001, llegaremos a 700 millones, y en torno a 2005 -2007, a 2000 millones como mínimo. Es verdad que constituye sólo una tercera parte de la población del planeta, pero esto quiere decir, ponderando en términos de las sociedades más desarrolladas, que en las sociedades de nuestro contexto las tasas de penetración estarán en torno al 75% u 80%".

En statista estiman en un poco más de 5520 millones de personas el número de usuarios de internet en octubre de 2024. Un poquito por encima del número de usuarios de las redes sociales. En la siguiente imagen podemos ver el aumento paulatino producido en los últimos 20 años.

Evolución de los usuarios de internet

Fuente: https://www.statista.com/statistics/273018/number-of-internet-users-worldwide

Está claro que ya estamos en la «sociedad red» de Castells.