Abstract | dc.description.abstract | En el contexto de la administración de datos para redes sociales, esta tesis aborda sus necesidades de manipulación de datos proponiendo un modelo de datos basado en un conjunto exhaustivo de casos de uso tomados del dominio de las redes sociales (SN, del inglés social networks ), y en el trabajo teórico existente sobre modelos de datos, bases de datos, y lenguajes de consulta.
Un modelo para la administración de datos de redes sociales debe permitir compartir los datos de redes sociales, así como su reutilización e integración, con apoyo para esquemas flexibles y metadatos apropiados para datos con estructura de grafos. El lenguaje de consulta deseado debe proveer la expresividad adecuada bajo límites factibles de complejidad, siendo además accesible y atractivo para los usuarios. Un requisito encontrado frecuentemente en los casos de uso de SN es la necesidad de reestructurar una red, por ejemplo creando nuevos nodos a partir de grupos existentes, o a partir de valores de atributos. Los lenguajes de consulta tradicionales que son capaces de crear valores u objetos suelen tener la capacidad de expresar todas las consultas computables, por lo tanto la evaluación de las consultas se vuelve computacionalmente costosa.
Para abordar estos requisitos se introduce un modelo de datos (SNDM), y un lenguaje de consulta (SNQL). La estructura de de datos utilizada es semiestructurada y está basada en un modelo de triples. SNQL se ha diseñado siguiendo las líneas de lenguajes de consulta ampliamente conocidos, usando como punto de partida una versión de Datalog con una extensión que facilita el cómputo de nuevos valores e identificadores de acuerdo a los requisitos de la manipulación de SN. Dicha extensión se basa en las "second-order tuple-generating dependencies", originalmente propuestas en el contexto de intercambio de datos para capturar la composición de asignaciones entre esquemas.
El lenguaje así definido resuelve, con una complejidad computacional eficiente, los requisitos de los casos de uso típicos del análisis de redes sociales. En efecto, su poder expresivo abarca todas las operaciones de SN relevantes, y su evaluación permanece en NLOGSPACE. Se muestra que las características de este lenguaje satisfacen estas metas demostrando sus propiedades formales y con implementaciones prototípicas del modelo, así como con traducciones desde y hacia a otros modelos. | es_CL |