Bravo Ramón recuerda que una de las primeras manifestaciones de las humanidades digitales ocurrió en 1949, cuando el sacerdote Busa pidió ayuda a IBM, para elaborar un índice de concordancia (lista ordenada y clasificada por frecuencia de los términos que aparecen en un corpus de obras) de las obras completas de Santo Tomás de Aquino (más de 11…
Etiqueta: Recuperación de Información
Propuesta y desarrollo de un modelo para la evaluación de la recuperación de información en Internet
La recuperación de información, como disciplina claramente diferenciada de la recuperación de datos, posee una naturaleza determinista que provoca ineludiblemente ciertas dosis de incertidumbre a la hora de realizar una operación de búsqueda. Es por ello que, desde el inicio del desarrollo de esta disciplina, ha sugerido una considerable cantidad de propuestas de medida de…
Medidas basadas en el proceso de la recuperación de información
No todas las medidas que se emplean para medir el funcionamiento de los sistemas de recuperación de información se basan en los juicios de relevancia (o pertinencia). Meadow identifica dos grupos: las basadas en el proceso y las basadas en el resultado (medidas que, en realidad, sí hacen uso de la relevancia).
El carácter selectivo de la recuperación de información
Uno de los libros fundamentales sobre recuperación de información es la obra ‘Language and representation in information retrieval’ de D.C. Blair de 1990. Y una de sus principales aportaciones es, sin duda alguna, el llegar a establecer una clara diferenciación entre el término ‘data retrieval’ y el término ‘information retrieval’, utilizando como criterios distintivos: En recuperación de…
¿Recuperamos información o recuperamos datos?
En el campo de la recuperación de información, casi al principio de la disciplina, era normal encontrarnos con autores que empleaban la voz «recuperación de datos» cuando en realidad de lo que estaban hablando era de «recuperación de información». Esto se debía fundamentalmente a una clara influencia de la terminología informática, disciplina cuya rapidísima evolución ha…
Utilidad lineal.
La usabilidad lineal es una medida de la recuperación de información que, esencialmente asume que la presencia de documentos relevantes en la respuesta de un sistema de recuperación de información a una determinada pregunta debe tomarse como un rédito a favor del sistema, al mismo tiempo que los documentos no relevantes deben considerarse como un débito….
El Modelo del Espacio Vectorial: similitud entre vectores.
En algunas partes de esta web hablamos de Gerad Salton y de «su Modelo del Espacio Vectorial que implementan la mayoría de los motores de búsqueda lo implementan como estructura de datos y que el alineamiento suele realizarse en función del parecido (o similitud) de la pregunta con los documentos almacenados. Viniendo hacia el trabajo me he parado…
Precisión y exhaustividad normalizadas
Entre las medidas alternativas a la relevancia encontramos la Exhaustividad Normalizada como propuesta de diversos autores. Casi todo el mundo reconoce que el mayor problema de las medidas basadas en la relevancia es la alta dosis de subjetividad inherente a su determinación. Otro de los problemas que conlleva su uso reside en la secuencialidad de la lectura de los resultados….