admin

Los primeros buscadores de la web

En otra entrada comentamos que la expansión de la web a principios de los años 90 pronto desbordó el entorno académico, hábitat natural de internet, y comenzó a expandirse por otros ámbitos: administraciones, empresas, medios de comunicación y particulares (algo más adelante con los blogs), publicándose páginas y sitios web por su cuenta.

Algunos sitios web de prensa de los años 90

En estos primigenios sitios de la «Web 1.0” era frecuente incluir una página con enlaces a otras páginas que parecían interesantes y podían permitir ampliar información a los lectores, a modo de «misceláneas«. Se puede que esto era replicar, en cierto modo, el muy tradicional servicio de referencia que desde tiempos inmemoriales llevan a cabo las personas que trabajan en las bibliotecas. Esto constituyó el germen para el desarrollo de los primeros sistemas de recuperación de información (SRI) en la web: los índices o directorios, sistemas de los cuales Yahoo! fue durante un tiempo el mejor ejemplo.

Estos SRI, como muchos recordamos todavía, son un producto documental considerado una fuente de información de carácter secundario porque dirige a la fuente original, justo lo que hacían y actualmente hacen estos sistemas de recuperación. Una actividad de gestión de información vuelve a confluir con la tecnología de la web. Se llevaba a cabo un seguimiento generalista y se registraban apenas unas pocas páginas de cada sitio web, a diferencia de los motores de búsqueda cuyo propósito es indexar la totalidad de un sitio web (o intentarlo al menos).

Pantalla de inicio de yahoo directory

Con el paso del tiempo, el vertiginoso crecimiento de la web hizo imposible el rastreo manual de los nuevos sitios que iban surgiendo ni la actualización del contenido ya rastreado. El día que Yahoo! se convirtió en motor de búsqueda tras comprar Altavista, comenzó el final definitivo de estos sistemas.

pantalla principal del antiguo buscador Altavista

1989-2014: WWW, de una propuesta de gestión de información a un universo de información

En noviembre de 2014 estuve de visita en la Universidade Estadual Paulista «Julio de Mesquita Filho», más concretamente en el Campus de Marilia. El motivo de la misma fue participar en el Programa de Posgrado de Ciencias de la Información, impartiendo una conferencia el segundo día de mi estancia y un seminario sobre recuperación de datos y recuperación de información al final de la misma. Antes de proseguir quiero agradecer a los compañeros y estudiantes brasileños sus muchas atenciones hacia mi persona, son unos grandes anfitriones y mejores personas.

Edificio de aulas del campus de Marilia en la UNESP
Faculdade de Filosofia e Ciências – Universidade Estadual Paulista «Júlio de Mesquita Filho» – Câmpus de Marília (UNESP).

La conferencia se titulaba «1989-2014: WWW, de una propuesta de gestión de información a un universo de información por descubrir» y en la misma llevaba a cabo un pequeño homenaje a la creación de la WWW por parte de Berners-Lee como una propuesta de nuevo sistema para la gestión de la información, algo que muchos desconocen. 

fragmento de la primera página de la propuesta de Tim Berners Lee sobre la WWW
Fragmento de la portada de la propuesta de Tim Berners Lee sobre la WWW

He revisado algunos errores en la redacción original del texto de la conferencia y la he publicado en el respositorio Digitum de nuestra universidad. Espero que guste, hice un amplio recopilatorio de hitos y conceptos alrededor de la gestión y de la recuperación de información.   

Microdatos en páginas estáticas.

microdatos en páginas web - rich snnipets

Dedicamos una entrada al enriquecimiento de los sitios web con microdatos y, si bien pienso que creo quedó bastante completa, también es verdad que quedó algo teórica de más. Vamos a intentar mostrar algunas aplicaciones prácticas. Lo primero que vamos a hacer es recordar qué es un ‘Rich Snippet‘.

En la jerga de la web un ‘snippet‘ es el pequeño resumen informativo que aparece en un motor de búsqueda cuando se localiza una página web. Cuando «delegamos» en el motor la tarea de elaborar ese resumen de forma automática suele incluir las primeras palabras que encuentra en la página y lo cierto es que no suelen quedar muy bien, que digamos, Por ello, existe la posibilidad de personalizar de alguna manera esa presentación informativa aportando nosotros los datos, es decir, aportando microdatos.

página principal de la web académica de Francisco Javier Martínez Méndez en la UMU

Si tomamos como punto de partida mi página web académica en la Universidad de Murcia , el ‘snippet’ que ofrece Google es el siguiente:

datos estructurados Microdatos snippets Google

En estos resultados observamos que Google ha elegido algunas palabras de la presentación de esta página como las más representativas para diseñar el ‘snippet’. Esto se debe a que no ha encontrado texto enriquecido que el administrador de la misma haya querido destacar de alguna manera para que aparezca resaltado en la presentación de la misma por parte del motor de búsqueda. De hecho, si usamos la herramienta ‘Testing Tool’ de Google para verificar la presencia de microdatos, éste sería el resultado:

datos estructurados Microdatos snippets Google

Continuando con la tecnología que ofrece Google para trabajar con datos estructurados, encontramos un asistente para introducir este tipo de código en las páginas. Una vez hemos accedido a esta página nos encontramos con un pequeño inconveniente, el asistente solicita la URL (o el fragmento de texto) a enriquecer y el tipo de página web que queremos enriquecer (si se trata de una página de negocio local, de serie de televisión, de películas o de eventos, entre otras limitadas opciones que ofrece la iniciativa schema.org). Podemos entonces hacer dos cosas, incluir nosotros los microdatos directamente como hicimos en el post anterior (algo lento y farragoso), o bien intentar adaptarnos a lo más parecido de la «oferta» que disponemos. En nuestro caso vamos a optar por lo segundo y elegimos «Negocio local».

datos estructurados Microdatos snippets Google página web académica Francisco Javier Martínez Méndez

Aparecen dos subventanas, una es la página a enriquecer con microdatos, la otra es el asistente con los elementos de descripción previsto para «Empresa o Negocio local». De lo que se trata ahora es de ir marcando textos o imágenes en la subventana de la izquierda e ir asignándole elementos (marcas) en la subventana de la derecha, de la manera que se ve en la siguiente imagen:

datos estructurados Microdatos snippets Google página web académica Francisco Javier Martínez Méndez

En la imagen anterior se observa que hemos asignado marcas a textos e imágenes de la página objeto de mejora. El siguiente paso es generar ese texto enriquecido (parte del mismo se resalta en la imagen siguiente en la subventana de la derecha).

datos estructurados Microdatos snippets Google página web académica Francisco Javier Martínez Méndez

Lo siguiente que hemos de hacer es descargar ese texto y usarlo para sustituir el de la página original (la que no tiene datos estructurados). Transferir esa nueva página  a la web académica de la Universidad de Murcia y dejar al motor Google un tiempo prudencial para que la reindexe y podamos comprobar si hay algún efecto sobre el ‘snippet’.

El «ego organizacional» y la confianza en un sitio web

Gerry McGovern escribió en New Thinking sobre los problemas de «ego» en las organizaciones y cómo están acabando con la confianza que un sitio web transmite a sus visitantes. Pone como ejemplo la web de una organización ya de por sí no muy estimada – el Fondo Monetario Internacional – dirigido (tanto en la realidad como en su sitio web) por la política francesa Christine Lagarde.

Es muy posible que la vista de la página que tenía el autor en diciembre de 2014 no sea exactamente la que reproducimos ahora unos meses más tarde. El tema de diseño elegido dedica un porcentaje importante de la pantalla a un carrusel de diapositivas (cinco en este caso) que enlazan con distintos temas de interés para los responsables de esta web. La primera de ellas es la que estamos viendo, dedicada a una intervención de la directora del este organismo ante el Consejo Atlántico  (la más alta autoridad de la OTAN) y cuyo vídeo también podemos visualizar rápidamente porque ocupa uno de los cuatros «subtemas de interés» que se presentan en formato de recuadro en el centro de la pantalla. Pero está claro que la visita que hizo el autor en diciembre no debió de satisfacerle especialmente:

«Dominando la página aparece la jefa del FMI, Christine Lagarde, con una gran foto de sí misma. En lenguaje imperativo se informa que Lagarde acoge con satisfacción el compromiso del grupo G-20 de las economías avanzadas y emergentes para intensificar los esfuerzos en el impulso del crecimiento económico y la creación de puestos de trabajo. Esta arcaica redacción está fuera de paso con el mundo de los medios sociales. Esto no es excepcional, si usted visita, por ejemplo, la página de Bangladesh, leerá títulos como: «Comunicado de Prensa: Declaración de Subdirector Gerente del FMI Naoyuki Shinohara, al término de su visita a Bangladesh». Como usted puede observar fácilmente, se trata de una verdadera Realeza FMI, .todo en cuanto al FMI se refiere a la página web, el mundo y el universo es todo acerca de ellos. No se trata de lo que el cliente quiere hacer, sino qué cosas increíbles están haciendo los funcionarios imperiosas del FMI (sin saber muy bien para qué, esto lo añado yo). Lo dicho: un desenfrenado ego«.

recreación con IA de la página comentada (la original es de 2014 y no la hemos encontrado)-
Recreación con IA de la página comentada (la original es de 2014).

Estamos ante un caso muy claro de ausencia de comunicación entre la organización y su entorno. Este organismo internacional (o quizá «supranacional» podríamos decir porque las naciones le importan lo justo, especialmente sin son pobres y mediterráneas), no considera que su sitio web pueda ser la puerta de entrada para que gobiernos y otras instituciones puedan interaccionar con ellos. No, para ellos, el sitio web es su escaparate donde ellos pueden mostrar lo buenos e inteligentes que son, aunque luego dediquen la mitad del año a justificar por qué han fallado las previsiones que habían realizado durante la mitad del año anterior. El FMI reproduce en su sitio web uno de los principales problemas con los que deben lidiar los gestores de información a la hora de diseñar la arquitectura de una sede web, no reproducir la estructura de poder orgánico de la organización en la sede web («egos» les llama McGovern), porque eso no va a aportar nada positivo para la experiencia de sus usuarios.

«Esa es la naturaleza de las grandes organizaciones, qué vamos a decir de ello ahora. La gestión de la cadena es de más arriba hacia abajo y del ego más grande al menor en ese sentido. Es cierto que así es el camino organizacional seguido desde los tiempos de los emperadores de Roma o de los faraones de Egipto. Pero lo que es diferente hoy en día es cómo vemos a las organizaciones. Muchas organizaciones no han cambiado, pero las personas y la sociedad sí, de hecho, cada día que pasa, dejamos de confiar en más organizaciones«.

Prosigue el autor citando diversas estadísticas sobre esa pérdida de confianza en los gobiernos a la que estamos asistiendo en la última década especialmente y que está propiciando cambios en los modos de funcionamiento de la sociedad (y esperemos que en las urnas cuando nos toque ejercer nuestro derecho al voto). Y esa pérdida de confianza es poliédrica, afecta en varios planos y a muchos sectores, los medios de comunicación incluidos (en algunos estudios resultan menos fiables que los bancos, que ya es decir). ¿A qué se debe esa falta de confianza en los medios de comunicación? 

«La gente se ha vuelto más educada. Atienden a sus iguales más de lo que atienden a los líderes. Las organizaciones han abusado enormemente de la confianza que la gente les había conferido. Tengamos en cuenta que entre 1990 y 2010, el sueldo medio de un CEO creció un 533%, según Business Week, mientras que el salario de un trabajador ordinario creció un 32% Desafortunadamente, muchos directivos parecen pensar que la organización es un reino del más allá y que el resto estamos para servirles. En lugar de que el sitio web del FMI se centre en sus clientes, se centra en sus jefes. La página de inicio se convierte en una página de inicio para Christine Lagarde, con las otras páginas asignadas a los otros príncipes. El contenido web dice mucho acerca de quién eres en realidad y lo que realmente piensas. Un contenido web centrado (focalizado) en el cliente ayuda a las personas en sus tareas. Un diseño centrado en la destrucción de la confianza hacia la organización es un diseño centrado en los egos. No busca justificar o complacer, el mundo ha cambiado, pero muchas organizaciones todavía están atrapadas en una mentalidad medieval. Sus egocéntricas sedes web son anuncios y por ello no merecen confianza. Domar el ego es el primer paso en la reconstrucción de la confianza«.

Diseño web centrado en el usuario: flujo de pasos.
Diseño web centrado en el usuario: flujo de pasos.

Más allá de las consideraciones de tipo sociológico que emplea McGovern para criticar el planteamiento general de diseño de esta sede web (que es un buen ejemplo de otras muchas similares), queremos recordar la idea del Diseño Centrado en el Usuario, marco metodológico que (citando a Norman y Draper, 1986) nos presenta Hassan Montero y que podemos ver en la imagen anterior.

¿Por qué María Moliner merece una biblioteca a su nombre (y cientos seguramente)?

Sala de lectura de la Biblioteca General María Moliner de la UMU.
Sala de lectura de la Biblioteca General María Moliner de la UMU.

Versión web del discurso que pronuncié en representación de mis compañeros de la Facultad de Comunicación y Documentación de la Universidad de Murcia en el acto de cambio de nombre de la Biblioteca General del Campus de Espinardo, que a partir de ahora pasará a llamarse Biblioteca General María Moliner. Este acto tuvo lugar el 25 de marzo de 2015, dentro de las celebraciones del centenario de la Universidad de Murcia.

«Excmos. Sr. Rector y vicerrectores, queridos compañeros y estudiantes, la fecha del 25 de marzo de 2015 pasará a la historia de la Universidad de Murcia como aquella en la que nuestra institución rinde homenaje a la figura de la primera mujer que impartió clases en ella, la bibliotecaria y archivera por profesión, profesora y lexicógrafa por vocación, María Moliner Ruiz, una de las principales intelectuales españolas cuya obra aún pervive entre nosotros y seguramente nos sobrepasará en el tiempo.

María Moliner trabajando en su diccionario.
María Moliner trabajando en su diccionario

Hace más o menos un año que el exRector José Antonio Cobacho planteaba en el Consejo de Gobierno de nuestra universidad la necesidad de realizar un reconocimiento a la figura de esta insigne compañera. Más o menos por las mismas fechas, incluida ya dentro de los actos de conmemoración de nuestro centenario que tan bien coordina nuestro vicerrector y compañero José Antonio Gómez, tuvimos ocasión de asistir a la representación de la obra teatral “El diccionario”, dirigida por Manuel Calzada donde la actriz Vicky Peña rendía (tal como publicaba el diario El País cuando su estreno) “justicia escénica” a la figura de María Moliner. También en esas fechas pudimos leer el excelente artículo sobre la vida de la homenajeada escrito por nuestro compañero Juan Carlos Argüelles en el diario regional La Verdad.

Inmersos como estábamos en el proceso de elecciones a rector, esta idea se frenó un poco, si bien afortunadamente fue retomada por parte de los responsables culturales de nuestra universidad y fructificó tras la petición realizada por la Facultad de Comunicación y Documentación el 9 de octubre de 2014, aprobada de forma unánime por el Consejo de Gobierno, presidido ya por el Rector José Orihuela en su reunión de 21 de noviembre de 2014. Finalizaba nuestro escrito de petición al Consejo de Gobierno con el siguiente párrafo: “en este año de conmemoraciones, reconocimientos y recuerdos, por cumplirse el centenario de esta Universidad, estamos convencidos de que debemos mostrar nuestro reconocimiento a la trayectoria humana y profesional de Dª. María Moliner, otorgando su nombre a la Biblioteca General del Campus de Espinardo, denominación que pone además otro jalón en la historia de nuestra institución al reconocer las especiales circunstancias que propiciaron la relación afectiva, personal y profesional entre la autora, Murcia y su Universidad, que tuvo la fortuna de contar con su colaboración”.

Vista de la Facultad de Comunicación y Documentación en primer plano y la Biblioteca General "María Moliner" en segundo plano

Procede, a continuación, intentar precisar en unos breves párrafos con algo más de detalle por qué el nombre de una biblioteca, y no otro tipo de reconocimiento, era la mejor manera de homenajearla. En primer lugar, María Moliner fue archivera y bibliotecaria prácticamente a lo largo de toda su vida, perteneció al Cuerpo Facultativo de Archiveros, Bibliotecarios y Arqueólogos del estado creado en el año 1858 cuando el gobierno consideró necesario disponer de profesionales capacitados para gestionar el patrimonio bibliográfico cuyo volumen había aumentado considerablemente tras la aplicación de las medidas desamortizadoras del ministro Mendizábal. Para una profesional destacada en este campo, que llegó a Murcia para hacerse cargo del archivo de la Delegación de Hacienda y que terminó muchos años después jubilándose como directora de la biblioteca de la Escuela Técnica Superior de Ingenieros Industriales de Madrid (a pesar de haber sido represaliada tras la Guerra Civil y degradada hasta lugares ínfimos del escalafón por las autoridades franquistas), ¿qué mejor sitio podemos elegir para honrar su memoria? Sin duda alguna, una biblioteca universitaria aún sin nombre, hasta el día de hoy.

Una de las primeras ediciones del diccionario.

En segundo lugar, María Moliner es universalmente conocida por su más importante obra: el Diccionario de Uso del Español, editado entre los años 1966 y 1967 por la Editorial Gredos. La autora elaboró un diccionario como una guía del uso del español “trayendo todos los recursos de que el idioma dispone” (así aparece escrito en su presentación). María Moliner reunió un léxico muy amplio que organizó de acuerdo con el sistema de familias. De esta forma, cada entrada ofrece: (1) la definición del término en sentido estricto; (2) un amplio número de acepciones y subacepciones usuales y otras no tan usuales: (3) sinónimos y, finalmente, (4) informaciones sobre el régimen preposicional y otras características de las entradas. A este conjunto de aspectos lexicográficos de gran valor hay que añadir el uso de una prosa sencilla y precisa, tanto en las explicaciones como en los ejemplos propuestos, característica que facilita su consulta a un número mucho más amplio de lectores que el habituado a utilizar otros diccionarios, como, por ejemplo, el de la RAE. El profesor José Luis Aliaga Jiménez aporta otro aspecto relevante, quizá no muy comentado: “la ordenación de las entradas, conjugando con el alfabético el criterio etimológico como medio para el aprendizaje del léxico”.

La repercusión de esta diccionario es de carácter universal y las revisiones realizadas le permiten presumir de una actualidad que ya para sí quisieran otros diccionarios, elaborados por equipos de trabajo mucho más amplios. El grado de vinculación entre los diccionarios y las bibliotecas es altísimo, configuran un nexo casi vital. El diccionario es un material de referencia (o de consulta) para proporcionar significado, definición, etimología, ortografía, y en el caso de algunos idiomas, fijar su pronunciación. Hay varios tipos de diccionarios, siendo los más conocidos los de la lengua, los etimológicos, los de sinónimos y antónimos, los de idiomas y los de uso. A un nivel más especializado contamos con los léxicos, glosarios, tesauros, diccionarios históricos e ideológicos. La referencia es una de las principales tareas que se desarrollan en las bibliotecas, orientado y asesorando al usuario en su necesidad de información, por tanto, la sección que almacena las obras de referencia se convierte en uno de los pilares que sustentan la actividad bibliotecaria. Es tal la importancia que los diccionarios poseen en esta labor que sus ejemplares están habitualmente excluidos del préstamo, han de estar siempre en la biblioteca, forman parte de su “tesoro”. ¿En qué lugar, por tanto, debe buscar una biblioteca su denominación? La respuesta es sencilla, dentro de ese “tesoro” debe hallar una de las joyas que más brille, que seguramente será un diccionario, y nada mejor que el elaborado por nuestra compañera María Moliner.

Portada del proyecto de bases de organización de las bibliotecas del estado de 1939
Portada del proyecto de bases de organización de las bibliotecas del estado de 1939.

La autora estaba plenamente identificada con el espíritu de la Institución Libre de Enseñanza, plasmado posteriormente en las Misiones Pedagógicas que fueron auspiciadas por la II República para paliar las gravísimas carencias educativas y culturales de las poblaciones rurales. Además de la implantación de una amplísima red de bibliotecas rurales en la Comunidad Valenciana, María Moliner es capaz de redactar el primer plan nacional de planificación bibliotecaria, proyecto que, como recuerda la periodista Inmaculada de la Fuente es un “documento vanguardista sobre gestión bibliotecaria que gozó del reconocimiento de varias instituciones europeas y muchos bibliotecarios siguen considerándolo el mejor plan de bibliotecas diseñado hasta la actualidad”. El triunfo de las tropas golpistas de Franco impidió que ese plan se llevara a cabo. Hubo que esperar a la restitución de la democracia para que España dispusiera de un plan que, a pesar del tiempo transcurrido, incorporaba muchas ideas y planteamientos de la autoram una verdadera pionera en este campo.

Desgraciadamente han de pasar muchos años para que, ya en período democrático, estas ideas calasen en la mentalidad de nuestros gobernantes y se desarrollara este sistema bibliotecario, hoy muy golpeado por los recortes presupuestarios, y que sigue siendo necesario para preservar la educación y la cultura, constituyendo como recuerda UNESCO : “una fuerza viva de educación, cultura e información”.La homenajeada «fue una verdadera adelantada a su tiempo» tal como afirma la profesora Luisa Orera, y una institución como la nuestra, dedicada a promover y custodiar el conocimiento, no puede dejar de honrarla otorgando a uno de los pilares de esta tarea, el edificio de la Biblioteca General del Campus de Espinardo, el mejor nombre posible, el de María Moliner.

Muchas gracias a todos por su atención y por el apoyo a esta iniciativa.

La importancia del código HTML entre los factores de éxito de la «tabla periódica» del SEO

texto HTML código fuente
Fragmento del inicio de una página web en HTML

Retomamos el análisis de la «tabla periódica del SEO» que ha elaborado Search Engine Land prestando nuestra atención en el código HTML con el que se elaboran las páginas, factor que siempre ha aparecido como importantes en todas las recomendaciones elaboradas para obtener un buen posicionamiento de nuestro sitio web.

Etiqueta del título y su importancia en la SEO

Ht:la etiqueta del título (<TITLE>): al igual que si escribiéramos 100 libros no le podríamos el mismo título a cada uno de ellos sino que buscaríamos las palabras que mejor describen. el contenido de cada obra, lo mismo hemos de hacer con el título de la página web que estemos editando (tampoco vale asignarle un título vago o genérico, el problema es similar). El contenido de esta etiqueta es tan valorado por los motores de búsqueda que alguno de ellos, Google en concreto, si no lo considera adecuado lo cambia antes de almacenar la página en sus índices. El peso de esta etiqueta es +3 y si alguien quiere profundizar en esta cuestión, puede consultar el tutorial Writing HT;L Title Tags for Humans, Google & Bing elaborado también por Search Engine Land. Su peso es +3.

importancia de las metaetiquetas en el SEO

Hd: la meta-etiqueta de descripción: como pasa con la etiqueta del título es un factor siempre tenido en cuenta a la hora de elaborar recomendaciones para los webmasters. Algunos puristas del SEO pueden decir que esta meta-etiqueta no «describe» propiamente hablando en términos de recuperación de información sino que sirve para «presentar» la información dentro de la lista de sitios recuperados por un motor. Es cierto, lo que no le quita ningún valor a la misma y puede servir para aumentar el número de visitas a la página por la subjetividad del usuario que consulta la lista de respuestas y se puede sentir atraído por una correcta descripción frente a una genérica. Al igual que ocurre con el elemento anterior, los motores de búsqueda pueden llegar a modificarla si lo consideran oportuno. Su peso es +2.

las etiquetas de encabezados en el SEO

Hh: las etiquetas de los encabezados y subencabezados. Otro factor suficientemente conocido y presente en la mayoría de guías y recomendaciones para los diseñadores de sitios web. Además de establecer una secuencia lógica en la estructura de los mismos dentro de una página (es decir, no pasar de un encabezado de nivel a uno de nivel cuatro sin hacer uso del encabezado de nivel 3), estas etiquetas sirven para definir secciones en una página y, por tanto, cumplen una función parecida a la etiqueta del título de la página: «nombran» a la sección de la página. Por ello hay que llevar cuidado especial a la hora de elegir las palabras que representen el contenido de esas secciones. Su peso es algo inferior: +1 

la importancia de los datos estructurados

Hs: datos estructurados: todo lo que tiene que con los microdatos, microformatosschema.org ayuda sin duda alguna, al motor de búsqueda (y a sus usuarios) en el acceso a la información. No está del todo claro si son factores directos de éxito para el posicionamiento pero su importancia está ahí y debe ser tenida en cuenta. Su peso es +1