El liderazgo de wordpress en el mundo de los CMS (‘updated’)

logo wordpressEn 2019 publiqué la primera versión de este ‘post’ en el que recogía la tabla con datos estadísticos que les muestro curso a curso a mis estudiantes de la asignatura «Construcción de Servicios de Información Digital» (4º curso del Grado de Información y Documentación de la Universidad de Murcia y PCEO con Periodismo). En esa tabla recojo las estadísticas que recopilan en la web w3techs.com sobre el uso de los CMS. Basta mirar la imagen para comprobar que wordpress, en esa época, era el campeón de la competición y amenazaba con quedarse con todos los trozos del pastel.

estadísiticas de uso de los CMS en la web

Lo cierto es que he seguido haciendo esa presentación y la he expandido al nuevo grado, el de Gestión de Información y Contenidos Digitales porque en el mismo imparto la asignatura «Sistemas de Gestión de Contenidos» y hoy publico la versión actualizada de esta tabla (que tengo que ir pensando en rediseñar porque me queda poco espacio).

En la que se observa que el papel predominante de wordpress dentro de los CMS sigue vigente, si bien ha bajado un poco en los últimos dos años, al igual que lo han hecho los gestores clásicos como drupal o joomla, cuya presencia reducida de un 4% va camino de convertirse en residual (menos de un 1%). 

portada de una edición de "El señor de los anillos" de Tolkien.

Portada de una edición de «El señor de los anillos».

Al pie de ambas imágenes aparece un comentario que considero importante. Llama mucho la atención que aún un 31% de los sitios web visitados en la encuesta no usen todavía un CMS. Esto, hoy e día, es como querer escribir «El señor de los anillos» con pluma estilográfica. No obstante, cada vez son menos estos sitios gestionados de forma manual o desconocida, han pasado en 8 años de un 57,3% a un 31%). 

De los dos tercios de sitios web que usan CMS, wordpress está presente en el 63,2% de los casos. Han ganado algo de presencia gestores de comercio electrónico (shopify en concreto, casi un 6%) y gestores que permiten construir webs de forma sencilla, dando alojamiento y registro de dominios (wix, sobre un 3%). El predominio, si bien algo estabilizado en su crecimiento es absoluto. Todos los demás gestores van camino de la irrelevancia

También anualmente actualizo la gráfica de búsquedas realizadas en todo el mundo en Google utilizando los nombres de los principales CMS. Esta información la obtenemos de Google Trends

Sin necesidad de comparar datos, la gráfica certifica el predominio de wordpress, si bien se observa también el auge del interés por los gestores «emergentes«, como es el caso de shopify

tendencia de búsquedas en Google por los nombres del os principales CMS
Tendencia de búsquedas en Google por los nombres de los principales CMS.

El índice de concordancia: ¿origen de las humanidades digitales?.

El Padre Busa trabajando con ordenadores IBM

​​​​Bravo Ramón recuerda que una de las primeras manifestaciones de las humanidades digitales ocurrió en 1949, cuando el sacerdote Busa pidió ayuda a IBM, para elaborar un índice de concordancia (lista ordenada y clasificada por frecuencia de los términos que aparecen en un corpus de obras) de las obras completas de Santo Tomás de Aquino (más de 11 millones de palabras). Este índice se denomina ‘Index Thomisticus’.
Seguir leyendo…

No todo es Shangai en el mundo de los rankings

logos de los principales rankings de universidades

logos de los principales rankings de universidadesEn las primeras semanas de las elecciones a Rector en la Universidad de Murcia celebradas hace unos meses, el tema de moda era la repetida frase de uno de los candidatos sobre la necesidad de situar a nuestra institución en los 500 primeros puestos del mediático Ranking de Shangai (ARWU). Fue tal la pasión que se puso en el tema que creemos se está llegando a producir un cierto efecto rebote sobre esta cuestión, comenzando a generar rechazo hacia los rankings entre los miembros de la comunidad universitaria (muchos de ellos reacios a cualquier tipo de evaluación y/o comparación de su actividad).

Suele ser habitual leer de vez en cuando la necesidad de situar a una universidad en los 500 primeros puestos del mediático Ranking de Shangai (ARWU). Es un anhelo de una parte de la comunidad universitaria y además se ha convertido en una herramienta para criticarnos por parte de algunos sectores de la sociedad (produciendo un cierto efecto rebote sobre esta cuestión y comenzando a generar rechazo hacia los rankings entre los miembros de las universidades, algunos de ellos reacios a cualquier tipo de evaluación y/o comparación de su actividad).

Lo cierto es que el citado ranking no entró bien en el mundo universitario porque vino de la mano de uno de los peores ministros que este país ha tenido (hasta hace poco vivió en un exilio dorado de embajador en París). Es por ello que suele citarse normalmente en tono despectivo y no muy bien valorado entre los universitarios, si bien ha conseguido situarse en el centro de todas las conversaciones sobre el tema y no se mencionan habitualmente a otros rankings que sí pretenden reflejar con más cercanía a nuestro mundo el estado la cuestión.

Los compañeros Teodoro Luque-Martínez, Nina Faraoni y Luis Doña-Toledo (profesores de mi segunda alma mater, la Universidad de Granada), acaban de publicar el artículo «Meta-ranking de universidades. Posicionamiento de las universidades españolas» en la Revista Española de Documentación Científica. En este trabajo los autores proponen la elaboración de un meta-ranking que recoge a las 14 universidades españolas que aparecen en al menos cuatro de los cinco rankings globales considerados de reconocida notoriedad internacional (considerando tanto datos bibliométricos como otros aspectos y otras formas de recabar datos a partir de encuestas) y en el que recogen datos de cuatro rankings más (Shangai aparte). Las universidades españolas alcanzan mejores posiciones en los primeros que en los segundos poniéndose de relieve una debilidad mayor en la internacionalización, la reputación o el ratio estudiante-profesor que en los indicadores de investigación. Representan una loable excepción las universidades que destacan en las dos dimensiones. A la vista de estas conclusiones resulta evidente la necesidad de profundizar en una mayor internacionalización, en mejorar la reputación y mejorar la visibilidad internacional de la universidad española.

Los rankings utilizados con fuente en esta investigación son:

  1. University Ranking by Academic Performance (URAP): http://www.urapcenter.org
  2. Academic Ranking of World Universities (ARWU); http://www.shanghairanking.com
  3. National Taiwan University (NTU): http://nturanking.lis.ntu.edu.tw/
  4. Times Higher Education (THE): https://www.timeshighereducation.com/world-university-rankings
  5. Quacquarelli Symonds-QS ranking (QS): http://www.topuniversities.com/university-rankings

Los tres primeros utilizan básicamente indicadores bibliométricos especialmente referidos a investigación, mientras que los otros dos (THE y QS) además de algún indicador de esta naturaleza (principalmente citas), también utilizan otros ( internacionalización, reputación, ratio estudiantes por profesor o ingresos por investigación, por ejemplo) y alguno de ellos se obtiene mediante encuestas, como los referidos a la reputación, ya sea académica o de investigación. Estos rankings están entre los más conocidos y gozan de gran notoriedad en la comunidad universitaria internacional, se publican desde hace años y sus puntuaciones son accesibles en sus páginas web. Cada uno recoge datos con matices diferentes, por ello es interesante condensarlos para llegar a generar un meta-ranking. Y una vez elaborado, aplicarlo a las universidades españolas, representándolas y consiguiendo el posicionamiento de las diferentes universidades en dicho meta-ranking.

Las universidades españolas que han sido analizadas en este estudio son las siguientes: Barcelona, Autónomas de Madrid y de Barcelona, Pompeu Fabra, Complutense, Valencia, Granada, Politécnicas de Cataluña y de Valencia, Santiago, País Vasco, Zaragoza, Sevilla y Salamanca. 

En los resultados destacan dos aspectos fundamentalmente, el alto grado de correlación existente entre los rankings y que en los rankings que consideran datos de investigación principalmente, hay 7 universidades por encima de la media. La situación empeora al considerar otros indicadores basados en encuestas y no exclusivamente relacionados con investigación, puesto que solamente la Autónoma de Barcelona está por encima de la media. Dicha universidad es la única que aparece por encima de la media en las dos dimensiones. Siempre hablando en términos comparativos con el resto de las universidades analizadas para esta solución de dos dimensiones, hay que añadir que muchas universidades que tienen un buen desempeño en investigación (Valencia, Granada, Sevilla y Zaragoza), lo tienen claramente menor en la segunda dimensión analizada.

Esperemos que dentro de pocos años, si se repite este estudio o se desarrolla otro similar, haya una décimoquinta universidad en el mismo y que sea la nuestra (más que un deseo debería de ser una obligación para nosotros).

El contenido de poco valor termina «destrozando» un sitio web

problemas con el contenido

El contenido es el hecho diferencial entre un sitio web de éxito y un sitio web normal. También hemos recogido alguna vez el lema «Content is king» (que siempre había pensado que era uno de los lemas de Google y resulta que es una frase de Bill Gates). Es un hecho que necesita poca justificación, si uno accede a un portal web para recuperar información, le valdrá aquel portal que mas calidad de contenido disponga para sus usuarios, no el que menos (por muy bonito que sea el diseño de la hoja de estilo, algo que, obviamente también hay que cuidar pero que no debe ser el criterio decisivo).
Seguir leyendo…

Microdatos en páginas estáticas.

microdatos en páginas web - rich snnipets

El anterior post estuvo dedicado al enriquecimiento de los sitios web con microdatos y, si bien pienso que creo quedó completo, también es verdad que quedó algo teórico. Vamos a iniciar una pequeña serie de posts orientada a mostrar (o a intentarlo al menos) algunas aplicaciones prácticas. Lo primero que vamos a hacer es recordar qué es un ‘Rich Snippet‘. En la jerga de la web un ‘snippet‘ es el pequeño resumen informativo que aparece en un motor de búsqueda cuando se localiza una página web. Cuando «delegamos» en el motor la tarea de elaborar ese resumen de forma automática suele incluir las primeras palabras que encuentra en la página y lo cierto es que no suelen quedar muy bien, que digamos, Por ello, existe la posibilidad de personalizar de alguna manera esa presentación informativa aportando nosotros los datos, es decir, aportando microdatos.

microdatos en páginas web - rich snnipets

Si tomamos como punto de partida mi página web académica en la Universidad de Murcia , el ‘snippet’ que ofrece Google es el siguiente:

datos estructurados Microdatos snippets Google

En estos resultados observamos que Google ha elegido algunas palabras de la presentación de esta página como las más representativas para diseñar el ‘snippet’. Esto se debe a que no ha encontrado texto enriquecido que el administrador de la misma haya querido destacar de alguna manera para que aparezca resaltado en la presentación de la misma por parte del motor de búsqueda. De hecho, si usamos la herramienta ‘Testing Tool’ de Google para verificar la presencia de microdatos, éste sería el resultado:

datos estructurados Microdatos snippets Google

Continuando con la tecnología que ofrece Google para trabajar con datos estructurados, encontramos un asistente para introducir este tipo de código en las páginas. Una vez hemos accedido a esta página nos encontramos con un pequeño inconveniente, el asistente solicita la URL (o el fragmento de texto) a enriquecer y el tipo de página web que queremos enriquecer (si se trata de una página de negocio local, de serie de televisión, de películas o de eventos, entre otras limitadas opciones que ofrece la iniciativa schema.org). Podemos entonces hacer dos cosas, incluir nosotros los microdatos directamente como hicimos en el post anterior (algo lento y farragoso), o bien intentar adaptarnos a lo más parecido de la «oferta» que disponemos. En nuestro caso vamos a optar por lo segundo y elegimos «Negocio local».

datos estructurados Microdatos snippets Google

Aparecen dos subventanas, una es la página a enriquecer con microdatos, la otra es el asistente con los elementos de descripción previsto para «Empresa o Negocio local». De lo que se trata ahora es de ir marcando textos o imágenes en la subventana de la izquierda e ir asignándole elementos (marcas) en la subventana de la derecha, de la manera que se ve en la siguiente imagen:

datos estructurados Microdatos snippets Google

En la imagen anterior se observa que hemos asignado marcas a textos e imágenes de la página objeto de mejora. El siguiente paso es generar ese texto enriquecido (parte del mismo se resalta en la imagen siguiente en la subventana de la derecha).

datos estructurados Microdatos snippets Google

Lo siguiente que hemos de hacer es descargar ese texto y usarlo para sustituir el de la página original (la que no tiene datos estructurados). Transferir esa nueva página  a la web académica de la Universidad de Murcia y dejar al motor Google un tiempo prudencial para que la reindexe y podamos comprobar si hay algún efecto sobre el ‘snippet’.

La web precisa de «constructores de puentes».

construyendo puentes en la web

Gerry MCGovern propone en un post de New Thinking que los diseñadores web adopten el rol de «constructores de puentes» entre las múltiples islas que se han desarrollado de forma paralela y alrededor de la Web en los últimos años. Estas islas a las que se refiere el autor son (en primera instancia): la arquitectura de información, la experiencia del usuario, la experiencia del cliente, el diseño e implementación de servicios, la gestión de contenidos Web, el diseño de páginas web y (en un plano algo más alejado pero relacionado igualmente): programación de software Web, el ‘branding’, el marketing y la optimización en motores de búsqueda (SEO).
Seguir leyendo…

La importancia del código HTML entre los factores de éxito de la «tabla periódica» del SEO.

texto HTML código fuente

texto HTML código fuente

Retomamos el análisis de la «tabla periódica del SEO» que ha elaborado Search Engine Land prestando nuestra atención en el código HTML con el que se elaboran las páginas, factor que siempre ha aparecido como importantes en todas las recomendaciones elaboradas para obtener un buen posicionamiento de nuestro sitio web.

Etiqueta del título y su importancia en la SEOHt:la etiqueta del título (<TITLE>): al igual que si escribiéramos 100 libros no le podríamos el mismo título a cada uno de ellos sino que buscaríamos las palabras que mejor describen. el contenido de cada obra, lo mismo hemos de hacer con el título de la página web que estemos editando (tampoco vale asignarle un título vago o genérico, el problema es similar). El contenido de esta etiqueta es tan valorado por los motores de búsqueda que alguno de ellos, Google en concreto, si no lo considera adecuado lo cambia antes de almacenar la página en sus índices. El peso de esta etiqueta es +3 y si alguien quiere profundizar en esta cuestión, puede consultar el tutorial Writing HT;L Title Tags for Humans, Google & Bing elaborado también por Search Engine Land. Su peso es +3.

importancia de las metaetiquetas en el SEOHd: la meta-etiqueta de descripción: como pasa con la etiqueta del título es un factor siempre tenido en cuenta a la hora de elaborar recomendaciones para los webmasters. Algunos puristas del SEO pueden decir que esta meta-etiqueta no «describe» propiamente hablando en términos de recuperación de información sino que sirve para «presentar» la información dentro de la lista de sitios recuperados por un motor. Es cierto, lo que no le quita ningún valor a la misma y puede servir para aumentar el número de visitas a la página por la subjetividad del usuario que consulta la lista de respuestas y se puede sentir atraído por una correcta descripción frente a una genérica. Al igual que ocurre con el elemento anterior, los motores de búsqueda pueden llegar a modificarla si lo consideran oportuno. Su peso es +2.

las etiquetas de encabezados en el SEOHh: las etiquetas de los encabezados y subencabezados. Otro factor suficientemente conocido y presente en la mayoría de guías y recomendaciones para los diseñadores de sitios web. Además de establecer una secuencia lógica en la estructura de los mismos dentro de una página (es decir, no pasar de un encabezado de nivel a uno de nivel cuatro sin hacer uso del encabezado de nivel 3), estas etiquetas sirven para definir secciones en una página y, por tanto, cumplen una función parecida a la etiqueta del título de la página: «nombran» a la sección de la página. Por ello hay que llevar cuidado especial a la hora de elegir las palabras que representen el contenido de esas secciones. Su peso es algo inferior: +1 

la importancia de los datos estructuradosHs: datos estructurados: todo lo que tiene que con los microdatos, microformatosschema.org ayuda sin duda alguna, al motor de búsqueda (y a sus usuarios) en el acceso a la información. No está del todo claro si son factores directos de éxito para el posicionamiento pero su importancia está ahí y debe ser tenida en cuenta. Su peso es +1

Los hipervínculos y su importancia dentro del contenido de una página web.

links

Desde casi siempre comento a mis estudiantes del Grado en Información y Documentación que si de verdad queremos que nuestra web destaque sobre las demás hay que prestar especial atención a la calidad de los contenidos de la misma. Ese convencimiento también lo recogí en los tiempos históricos de este blog cuando en 2005 publiqué el post «El contenido es el Rey», lema que curiosamente, y contra lo que debía haber sido lo normal, no sabía que había sido acuñado nada más y nada menos que por Bill Gates en el muy lejano 1996 (era otro siglo y todo). Por eso me gustan post como el que leo de Gerry McGovern titulado ‘Content is critical for web success’ reincidiendo en esa idea y recordando que sin contenido no hay web.
Seguir leyendo…

Arquitectura de un sitio web y su importancia en la «tabla periódica» del SEO

logo de duplicación de las direcciones web

Rosenfeld y Morville establecieron su visión de la Arquitectura de Información para la Web a partir de cómo se podían organizar los siguientes elementos componentes de un sitio web;

  • Esquemas de organización del contenido.
  • Sistemas de navegación.
  • Sistemas de rotulación.
  • Sistemas de búsqueda, tesauros y vocabularios controlados

Ac: «recopilabilidad» del sitio web (‘site crawlability‘). Sabido es que los motores de búsqueda recopilan sitios web a partir de una serie de direcciones «semillas» desde las cuales inician sus rastreos e indexan todo el contenido de estas páginas, además de ir anotando todos los enlaces que en ellas vayan encontrando, tanto a efectos de mejor posicionamiento como para aumentar el tamaño de la colección del índice de los motores. Es uno de los factores más considerados, de hecho se le ha asignado un valor de +3 en la tabla. Si se desea atraer tráfico a un sitio web es fundamental (e incluso vital) que los elementos que forman parte del mismo no generen problemas a estos módulos recopiladores (los robots o ‘crawlers’ de los motores de búsqueda). La mayoría de los sitios en general no tienen problemas de rastreo, pero siempre hay cosas que pueden causar problemas y que, muchas veces nos pasan desapercibidas. Por ejemplo, el uso de las tecnologías JavaScript o Flash potencialmente pueden hacer invisible para los robots los vínculos presentes en las páginas y así haremos más complicado un rastreo profundo de nuestro sitio web. Cada sitio Web se beneficia de un presupuesto de rastreo, es decir, de una cantidad aproximada de tiempo o número de páginas que un motor de búsqueda rastreará cada día: Ese presupuesto será de mayor valor cuanta más confianza y autoridad reconocida tenga en nuestro sitio (y los elementos del diseño influyen en ello decisivamente). Los sitios más grandes pueden tratar de mejorar su eficiencia de rastreo para garantizar que las páginas «correctas» están siendo rastreadas con mayor frecuencia. El uso de robots.txt , estructuras de enlace internos e indicar de forma explícita a los motores de búsqueda no rastrear páginas con ciertos parámetros de URL, por ejemplo, pueden mejorar la eficiencia del rastreo. En la mayor parte de las ocasiones, los problemas de rastreo se pueden evitar fácilmente, destacando especialmente el uso de sitemaps porque tanto  HTML como XML lo aprovechan para hacer más fácil a los motores de búsqueda el rastreo.

logo de duplicación de las direcciones webAd: Duplicación / Canonicalización (‘Duplication / Canonicalization‘). A veces, el índice del motor de búsqueda se complica especialmente cuando, tras una operación de selección de información, se localiza un conjunto de páginas con contenido prácticamente similar (algo desgraciadamente frecuente en los blogs con un alto índice de copia directa de contenidos) y el algoritmo de ranking se encuentra con problemas para discernir cuál de esas muchas páginas es la más relevante para la necesidad de información planteada. Esto no es bueno (y ya hemos visto en este blog que, por ejemplo Google, lo penaliza por la vía de sus algoritmos Penguin y Panda).  

logo imagen AS DuplicationAs: Velocidad de descarga (‘site speed’). El interés por la velocidad de acceso al contenido de un sitio web es tal que Google ha declarado que aquellos sitios más rápidos tendrán una pequeña ventaja en su algoritmo de alineamiento (si bien será uno más de los muchos factores que emplea Google) Eso sí, cuando diseñamos una página pensando en su velocidad de descarga, también estamos mejorando de forma indirecta otros factores que contribuirán, sin duda alguna, a mejorar el posicionamiento de la misma. Por tanto, es algo importante a tener en cuenta. 

logo Imagen AU oro duplicateAu: URL descriptiva. Si bien no es un factor decisivo, desde siempre se ha recomendado que en la dirección del sitio web (URL) aparezcan la palabra o las palabras que mejor lo representan (por ejemplo, un blog sobre turismo en Tarifa podría tener una URL como turismoentarifa.com). Eso siempre ayuda y además, parece que a los usuarios de la web les aportan más confianzas estas URLs tan «concretas» en lugar de algunas algo más «difuminadas». También es conveniente que la URL indique el objeto principal del sitio web a la hora de presentar los datos estructurados en los resultados de la búsqueda, tal como hacen los motores.

Por lo tanto, observamos que guardar siempre una serie de buenos hábitos sobre la arquitectura del contenido de nuestro sitio web es positivo (y nunca negativo como dirían seguramente Van Gaal y un innombrable ex-entrenador del Real Madrid) para nuestro posicionamiento. Son pequeños detalles que siempre ayudan. El gusto por la vida, ya se sabe, es cuestión de detalles ..