Análisis del Comportamiento del Usuario Web
Author
Professor Advisor
Abstract
Desde los orígenes de la Web en el CERN, ha existido una pregunta recurrente entre los
investigadores y desarrolladores: ¿Cual es la estructura y contenido correcto para que un sitio web
atraiga y/o retenga a sus visitantes? En parte, la respuesta a esta interrogante, se encuentra
fuertemente relacionada con una mayor comprensión de las motivaciones que posee un usuario al
visitar un sitio. En efecto, mientras más información y conocimiento se obtenga acerca de qué es lo
que el usuario busca al visitar un sitio web, mejores serán los contenidos y estructuras que se le
puedan ofrecer, permitiendo la implementación de sistemas que personalicen la experiencia del
usuario en un sitio.
Por otra parte, el análisis del comportamiento humano, ha sido abordado por una gran cantidad
de disciplinas como Psicología, Sociología, Economía, Lingüística, Marketing y Computación,
entre otras. Lo anterior permite la creación de un marco teórico práctico con un altísimo potencial
de ser aplicado en otras áreas del conocimiento, en particular el análisis del comportamiento del
usuario web. Las disciplinas antes mencionadas, recurren fundamentalmente a encuestas y a
muestreos experimentales para extrapolar el comportamiento de una persona ante determinadas
circunstancias. En el caso del usuario web, la mayor fuente de datos respecto de su comportamiento
de navegación y preferencias queda almacenada en archivos de Web Log, los cuales dan cuenta de
cada una de las acciones que un usuario ha efectuado cuando visita a un sitio. Dependiendo de la
cantidad de visitas del sitio, estos archivos pueden contener millones de registros, constituyendo
una de las mayores fuentes de datos sobre comportamiento humano.
El presente trabajo describe un nuevo enfoque que aplica teorías sobre la neurofisiología de la
toma de decisiones para describir el comportamiento de navegación del usuario web. La hipótesis
de investigación corresponde a: “Es posible aplicar teorías de la neurofisiología de la toma de
decisiones para explicar el comportamiento de navegación de los usuarios web”.
Para el análisis del comportamiento del usuario web, primero se requiere de una etapa de preprocesamiento
de datos. Esto es, reconstruir las secuencias de páginas visitadas (sesiones) de cada
visitante, el contenido de texto y la estructura de link del sitio web. Históricamente, el siguiente
paso es aplicar algoritmos y técnicas de minería de datos para la identificación y extracción de
patrones de comportamiento de los usuarios. Una importante contribución de este trabajo
corresponde al realizado en la etapa de pre-procesamiento. Es necesario asegurar la calidad de los
datos debido a que la etapa de calibración es sensible al conjunto de datos usados. Para estos fines,
fueron desarrollados nuevos algoritmos basados en programación entera para la extracción optima
de de las sesiones de usuario.
Esta tesis también propone un modelo estocástico para describir el proceso de navegación del
usuario web. Éste se basa en la teoría neurofisiológica de la toma de decisiones LCA (Leaky
Competing Accumulator). En ella se describe la actividad neuronal de diferentes regiones de la
corteza cerebral durante el proceso de determinación, por medio de un proceso estocástico que
evoluciona hasta que se alcance un cierto umbral que gatilla la decisión. Esta clase de modelos
estocásticos han sido estudiados experimentalmente por más de 40 años. En este contexto, un
usuario web se enfrenta a la decisión de elegir que link visitar de acuerdo a sus propias
motivaciones, el proceso se repite en cada visita a las paginas hasta salir del sitio. Los parámetros
del modelo son ajustados por medio del método de máxima verosimilitud, usando las secuencias de
páginas reales. Se concluye que cerca del 70% de la distribución real de sesiones de recupera
mediante este método. Este es un importante avance debido a su rendimiento sobresaliente en
relación a algoritmos tradicionales de web mining. Entonces se prueba la plausibilidad de la
hipótesis.
Identifier
URI: https://repositorio.uchile.cl/handle/2250/102596
Collections