La recuperación de información, como disciplina claramente diferenciada de la recuperación de datos, posee una naturaleza determinista que provoca ineludiblemente ciertas dosis de incertidumbre a la hora de realizar una operación de búsqueda. Es por ello que, desde el inicio del desarrollo de esta disciplina, ha sugerido una considerable cantidad de propuestas de medida de la efectividad del funcionamiento de los sistemas encargados de esta tarea: los sistemas de recuperación de información (SRI). La consolidación de la World Wide Web como ejemplo paradigmático del desarrollo de la Sociedad de la Información y del Conocimiento, y la continua multiplicación del número de documentos que en ella se publican cada día, propicia la creación de los sistemas de recuperación de información más avanzados, de mayor volumen de documentos gestionados y de mayor popularidad: los motores de búsqueda.
Seguir leyendo…
Evaluación
Medidas basadas en el proceso de la recuperación de información
No todas las medidas que se emplean para medir el funcionamiento de los sistemas de recuperación de información se basan en los juicios de relevancia (o pertinencia). Meadow identifica dos grupos: las basadas en el proceso y las basadas en el resultado (medidas que, en realidad, sí hacen uso de la relevancia).
Seguir leyendo…
Utilidad lineal.
La usabilidad lineal es una medida de la recuperación de información que, esencialmente asume que la presencia de documentos relevantes en la respuesta de un sistema de recuperación de información a una determinada pregunta debe tomarse como un rédito a favor del sistema, al mismo tiempo que los documentos no relevantes deben considerarse como un débito. Por lo tanto, esta medida establece su valor favoreciendo el acierto y penalizando al mismo tiempo el desacierto
Seguir leyendo…
Ha caído en mis manos una pequeña joya
Ha caido en mis manos, de forma temporal porque se lo he «quitado» a José Vicente, una pequeña joya: el libro ‘TREC: Experiment and Evaluation in Information Retrieval‘, editado por Ellen M. Voorhees y Donna K. Harman, que ha sido recientemente publicado por el MIT (nada más y nada menos).
Este libro constituye un verdadero homenaje a las conferencias TREC, el foro sobre recuperación de información que se convierte en el protagonista del libro. En el mismo, diversos especialistas comentan qué les ha parecido la evolución de estas conferencias en varios capítulos. Sólo he podido leer por encima un capítulo que dedican a la recuperación de información en idiomas diferentes del Inglés (entre ellos el idioma del inmortal Cervantes y del Fénix de los Ingenios), y otro donde proponen algunas medidas que se me habían «escapado» hasta ahora. Ya lo iremos comentando poco a poco, hasta que me lo pida su dueño.