Publicado por Viv Dehaes on 26-10-2005

Web mining en el diseño de sitios web

Es una técnica de análisis para webs que deriva del data mining. Se usa para el estudio de varios aspectos esenciales de un sitio y ayuda a descubrir tendencias y relaciones en el comportamiento de los usuarios que sirven como pistas para, por ejemplo, mejorar la usabilidad de un sitio.

El data mining se usa para descubrir información, conocimiento disponible pero no visible en documentos de una organización. Se asocia con la minería por la idea de excavar en busca de los datos. Generalmente se analizan grandes volúmenes de información, utilizando algoritmos y luego se los representa en modelos para que puedan ser analizados.  El web mining (minería web) traslada este modelo al análisis de sitios, procesando los datos disponibles para su posterior examen.

Cuando un sitio es navegado por los usuarios, los logs de los servidores que lo alojan van guardando información acerca de esa visita:

  • Qué día y a qué hora un usuario navega por el sitio,
  • si es la primera vez que visita el sitio o si es reincidente,
  • por cual archivo entra a visitar el sitio y por cual sale,
  • cuánto dura la visita y cuanto tiempo pasa en cada página,
  • de qué país es, qué navegador usa, qué sistema operativo,
  • desde donde llega a nuestra página,
  • Si llegó a través de un buscador, cuáles fueron las palabras clave usadas,
  • etc.

Esta información puede ser procesada por programas de estadísticas como awstats, webtrends o clicktracks, que, si bien son limitados en cuanto al proceso de la información, nos brindan pistas para mejorar un sitio, ya que devuelven información estructurada y significativa acerca de la navegación, por ejemplo:

  • Cantidad de visitas por hora, por día, por mes, etc.,
  • horas pico y horas de baja audiencia,
  • páginas más visitadas,
  • páginas de entrada y salida más frecuentes del sitio,
  • uso del buscador, ranking de palabras clave usadas para llegar,
  • Etc.

Entre las técnicas de data mining que más se utilizan en web mining mencionemos a: las reglas de clasificación y agrupamiento, las de asociación y los sucesos frecuentes que nos permiten por ejemplo clasificar y agrupar a nuestros usuarios y asignarles patrones de comportamientos según la reiteración de acciones que se detecten como clave y así poder ofrecerles productos o servicios acordes a sus perfiles.

El web mining. para mejorar su efectividad, se subdivide en áreas que abarcan el contenido del sitio, la estructura de navegación y el comportamiento de los usuarios antes los dos primeros:

  • Web Content Mining (minería de contenido web). Se centra en el contenido, y podemos obtener datos que acerca de la forma de escribir que es más atractiva para el usuario, de si la catalogación que usamos sirve para mejorar un ranking, si los temas que se tratan interesan o no.
  • Web Structure Mining (minería de estructura web). Obtenemos información acerca de si los usuarios encuentran la información, si la estructura de sitio es demasiado ancha o demasiado profunda, si los elementos están colocados en los lugares adecuados dentro de la página, si la navegación se entiende, cuáles son las secciones menos visitadas y su relación con el lugar que ocupan en la página central.
  • Web Usage Mining (minería de uso web). Esta extracción se refiere a patrones de navegación que podemos descubrir en nuestros usuarios y nos pueden servir para mejorar la misma, por ejemplo si el 80 % de nuestros usuarios recurren al campo de búsqueda cuando entran a nuestro sitio es que deberemos poner énfasis en la mejora de esa interfaz y que el motor que se encuentre detrás devuelva la información deseada.

El web mining es en definitiva un análisis significativo de los logs (registros que guardan los servidores) cuyo proceso genera información de valor acerca del sitio y sus usuarios, tales como: patrones de navegación, comportamiento de los usuarios ante cierta indexación de contenidos o estructuras de texto, preferencias del usuario, inconsistencias, etc.

Esto nos permite también inferir hipótesis sobre el comportamiento de nuestros usuarios,  realizar cambios y generar estímulos en nuestro sitio que nos permitan observar cómo reacciona el usuario y en base a ello mejorar nuestro sitio y así sucesivamente podemos jugar al científico de laboratorio.

Por ejemplo:

  • Ante la evidencia de que algunas página son más visitadas que otras, deberemos pensar en si puede ser por su ubicación dentro de la página, o porque su título no sea coherente, o porque simplemente es un tema que no tiene que ver con lo que el usuario promedio de nuestro sitio busca, luego de establecidas las hipótesis deberemos ponerlas a prueba y ver si los resultados la avalan o la descartan.
  • Ante ciertos cambios en la estructura del sitio, podremos observar cómo puede evolucionar el comportamiento de los usuarios. Inclusive se pueden testear cambios en el diseño, el tamaño de las tipografías, etc.
  • Qué pasa cuando agregamos un nuevo contenido al sitio: seguramente si está en la página principal sea más visto, si tiene el refuerzo de rss y boletines sus visitas deberían subir, igualmente deberán bajar cuando sea descartada del home.
  • En qué parte de la página un contenido tiene mejor visualización (contada por la cantidad de clic)
  • Cual es la profundidad de la navegación del usuario promedio en el árbol del sitio. Si esta no es muy profunda habrá que analizar la estructura de navegación, si los elementos están al alcance del usuario, en fin, podremos teorizar el porqué y ponerlo a prueba.
  • Índice de llegada desde los buscadores: si este es bajo puede ser que no estemos bien rankeados, en ese caso habrá que teorizar, nuevamente, el porque de este tema, puede ser que estemos usando flash para la navegación, por ejemplo, entonces ya tendremos la respuesta a por qué no estamos rankeados en un buscador ;)
  • En síntesis el análisis de las consultas nos permitirá mejorar la navegación de nuestro sitio a partir de las preferencias de nuestros usuarios.

Entonces, la idea es hacer el siguiente ejercicio. Sin meternos en terrenos complicados como la aplicación profesional del web mining, empecemos a prestarle atención a la información que podemos obtener del procesamiento de los logs del servidor y razonar los patrones de la navegación de nuestros usuarios. No es una tarea fácil pero es muy

El desafío que se viene en este campo va de la mano del que tiene la mayoría de los otros campos de la web que también sufren este tema y se habla tanto que va para leyenda urbana y es la estructuración semántica de la información en internet. Esto se torna fundamental para la visión que tenemos de la web del futuro es decir la necesidad de lenguajes de marca más estrictos dados por una ontología que nos permita sacar conclusiones a partir de la información.

Hasta la próxima.

Enlaces recomendados:

    1 Comentario

  1. Francisco dice:

    Me gustaria recibir datos mas precisos de web mining, con ejemplos

Dejá tu comentario