Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento

dc.contributor.advisorGarcía D., Juan Carlos
dc.contributor.authorFuentes Mejía, Oscar Fernando
dc.coverage.campusUNAB Campus Bucaramangaspa
dc.coverage.spatialBucaramanga (Santander, Colombia)spa
dc.date.accessioned2024-09-19T20:07:01Z
dc.date.available2024-09-19T20:07:01Z
dc.date.issued2001
dc.degree.nameIngeniero de Sistemasspa
dc.description.abstractWeb Usage Mining es la aplicación de técnicas de minería de datos para descubrir patrones de uso desde un sítio web, para entender y mejorar las necesidades de servicio en sus aplicaciones. La VWWUM esta constituida por tres fases, preprocesamiento, descubrimiento de modelos y análisis de modelos. En este documento se describirán en detalle cada una de estas fases. Dando una aplicación potencial, a la minería de datos dentro de la web, pues ha mostrado un rápido incremento e interés dentro de la comunidades investigativas la aplicación de esta practica. En este documento se encontrara una taxonomía detallada del trabajo en esta área, incluyendo esfuerzos de investigación para un uso comercial.spa
dc.description.abstractenglishWeb Usage Mining is the application of data mining techniques to discover usage patterns from a website, to understand and improve the service needs in your applications. The VWWUM is made up of three phases, preprocessing, model discovery and model analysis. Each of these phases will be described in detail in this document. Giving a potential application to data mining within the web, since the application of this practice has shown a rapid increase and interest within the research communities. In this document you will find a detailed taxonomy of work in this area, including research efforts for commercial use.spa
dc.description.degreelevelPregradospa
dc.description.learningmodalityModalidad Presencialspa
dc.description.tableofcontentsINTRODUCCIÓN 1. CARACTERISTICAS DEL WORLD WIDE WEB 2 1.1. CLASIFICACION DE FUENTES 2 1.2 EL CLIENTE 3 1.3 PROXY Y GATEWAYS 5 1.4 EL SERVIDOR 5 1.5 APLICACIÓN SOBRE WWW 6 2. REVISION Y PROYECTOS EXISTENTES 8 2.1 DIMENSIÓN DE LOS PROYECTOS DE WUM 8 2.2 DOCUMENTACIÓN SOBRE PROYECTOS EXISTENTES 9 2.3 CARACTERÍSTICAS DE USO 11 3. WEB USAGE MINING 13 3.1 WEB DATA 13 3.1.1 Contenido 13 3.1.2 Estructura 14 3.1.3 Uso 14 3,1.4 Perfil de Usuario 14 4. TÉCNICAS 15 4.1 EXTRACCIÓN DE DATOS 15 4.2 PREPROCESAMIENTO 16 4.2.1 Preprocesamiento de Uso 16 4.2.2 Preprocesamiento de Contenido 20 4.2.3 Preprocesamiento de Estructura 21 4.3 DESCUBRIMIENTO DE PATRONES 21 4.4 ANÁLISIS ESTADÍSTICO 22 5. ALGORITMOS 23 5.1 TECNICAS 23 5.2 REGLAS DE ASOCIACIÓN 23 5.3 CLUSTERING 24 5.4 PATRONES SECUENCIALES 25 5.5 DEPENDENCIA DE MODELAMIENTO 26 5.6 ANÁLISIS DE MODELOS 27 6. SOFTWARE EXISTENTE EN EL MERCADO 29 6.1 CLASIFICACION DEL SOFTWARE 29 6.2 WUM 29 6.3 WEBTRENDS 32 6.3.1 Resultados de WebTrends 34 7. VENTAJAS DE UNA APLICACION DE WUM 35 7.1 PERSONALIZACIÓN 35 7.2 MEJORAS DEL SISTEMA 35 7.3 INTELIGENCIA DE NEGOCIOS 36 7.4 CARACTERÍSTICAS DE USO 36 8. HERRAMIENTA PROTOTIPO DESARROLLADA 38 8.1 EL ALGORITMO 38 8.2 DESCUBRIR ITEMSETS GRANDES 41 8.3 ALGORITMO APRIORI 42 8.4 DESCRIPCIÓN DE LA HERRAMIENTA 44 8.4.1 Funcionamiento de la Herramienta 46 8.4.2 Resultados parciales de la herramienta 48 8.4.3 Corrida de una caso de prueba 51 8.4.4 Archivo de entrada 52 8.4.5 Parte del Resultado del Log de la UNAB sin depurar el archivo principal. 55 8.4.6 Resultado final de la herramienta 55 8.5 INTERPRETACIÓN DE LAS REGLAS 60 8.6 EL PROGRAMA APRIORI 62 8.6.1 Opciones de ejecución del programa Apriori 62 8.7 INTERFASE DEL. PROGRAMA APRIORI UNAB 64 9. CONCLUSIONES 65 10. RECOMENDACIONES 67 BIBLIOGRAFÍA 68 ANEXOS 71spa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.identifier.repourlrepourl:https://repository.unab.edu.cospa
dc.identifier.urihttp://hdl.handle.net/20.500.12749/26645
dc.language.isospaspa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.publisher.programPregrado Ingeniería de Sistemasspa
dc.relation.referencesAgrawal, R. & Srikant, R, (1995) Mining Sequential Patterns, Proc. Int’! Conf. on Data Engineering, pp. 3-14.spa
dc.relation.referencesAnand, 8.5., Scotney, B,W,, Tan, M,G., McClean, S.1, Bell, D.A., Hughes, J.,G, & Magill, I1.C. (1997) Designing a Kernel for Data Mining, /EEE Expert, 12(2):65-74.spa
dc.relation.referencesAnand, S. S., A, R. Patrick, J. G. Hughes and D,. A, Bell. 1998. A Data Mining Methodology for Cross-Sales, Knowledge-based Systems Journal 10; 449-461.spa
dc.relation.referencesBüchner, A.G. & Mulvenna, M.D,. (1998) Discovering Internet Marketing Intelligence through Online Analytical Web Usage Mining, 4CM SIGMOD Record, 21(4):54-61.spa
dc.relation.referencesBüchner, A.G,, Mulvenna, M,D., Anand, S.S, & Hughes, J.G. An Internet-cnabled Knowledge Discovery Process, Proc. 9% rt’) Database Conf., forthcoming, 1999a.spa
dc.relation.referencesBüchner, A,G., Baumgarten, M., Mulvenna, M.D., Anand, S.S. & Hughes, J,G. Navigation Pattern Discovery from Internet Data, submitted to 4CM Workshop on Web Usage Analysis and User Profiling (WebKDD’99), 1999b.spa
dc.relation.referencesChen, M,S,, Park, J.8. & Yu, P,S, Data Mining for Traversal Patterns in a Web Environment, Proc. 16" Tntl’l Conf, on Distributed Computing Systems, pp. 385-392, 1996.spa
dc.relation.referencesCooley, R., Mobasher, R. & Srivastava, J. (1997) Web Mining: Information and Pattern Discovery on the World Wide Web, Proc, 9% IEEE Int’! Conf. on Tools with Artificial Intelligence.spa
dc.relation.referencesCooley, R., Mobasher, R. & Srivastava, J. (1999) Data Preparation for Mining World Wide Web Browsing Patterns, Knowledge and Information Systems, 1(1).spa
dc.relation.referencesEtzioni, O, The World-Wide Web: Quagmire or Gold Mine?, Comm. of the ACM, 39(11):65- 68, 1996.spa
dc.relation.referencesLing, C.X. & Li, C, (1998) Data Mining for Direct Marketing: Problems and Solutions, Proc. 4" rut] Conf. on Knowledge Discovery and Data Mining, pp. 73-79.spa
dc.relation.referencesMulvenna, M,D., Norwood, M.T. & Büchner, A,G. (1998) Data-driven Marketing, Electronic Markets: The Int’! Journal of Electronic Commerce and Business Media, 8(3):32-35.spa
dc.relation.referencesSpiliopoulou, M. The laborious way from data mining to web mining, Jnt’'! Journal of Computing Systems, Science de Engineering, March 1999.spa
dc.relation.referencesSpiliopoulou, M., Faulstich, L.C. & Winkler, K. A Data Miner analyzing the Navigational Behaviour of Web Users, Proc, 4C41'99 Workshop on Machine Learning in User Modelling, forthecoming, 1999.spa
dc.relation.referencesSrikant, R, & Agrawal, R, (1996) Mining Sequential Patterns: Generalizations and Performance Improvements, Proc. 5°’ Int'! Conf on Extending Database Technology, pp. 3-17.spa
dc.relation.referencesZaïane, O.R, Xin, M, & Han, J. (1998) Discovering Web Access Patterns and Trends by Applying OLAP and Data Mining Technology on Web Logs, Prac. Advances in Digital Libraries Conſ. pp. 19-29.spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.subject.keywordsApplication of techniquesspa
dc.subject.keywordsBehavior patternsspa
dc.subject.keywordsWeb usage miningspa
dc.subject.keywordsSearchspa
dc.subject.keywordsData miningspa
dc.subject.keywordsComputer programsspa
dc.subject.keywordsSoftware architecturespa
dc.subject.keywordsHTML (Document markup language)spa
dc.subject.lembIngeniería de sistemasspa
dc.subject.lembInnovaciones tecnológicasspa
dc.subject.lembBases de datosspa
dc.subject.lembProgramas para computadorspa
dc.subject.lembArquitectura de softwarespa
dc.subject.lembHTML (Lenguaje de marcado)spa
dc.subject.proposalAplicación de técnicasspa
dc.subject.proposalPatrones de comportamientospa
dc.subject.proposalBúsquedaspa
dc.titleAplicación de técnicas de web usage mining para la búsqueda de patrones de comportamientospa
dc.title.translatedApplication of web usage mining techniques to search for behavioral patternsspa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.type.localTrabajo de Gradospa
dc.type.redcolhttp://purl.org/redcol/resource_type/TP

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
2001_Fuentes_Mejia_Oscar.pdf
Tamaño:
49.94 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
829 B
Formato:
Item-specific license agreed upon to submission
Descripción: