Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento
| dc.contributor.advisor | García D., Juan Carlos | |
| dc.contributor.author | Fuentes Mejía, Oscar Fernando | |
| dc.coverage.campus | UNAB Campus Bucaramanga | spa |
| dc.coverage.spatial | Bucaramanga (Santander, Colombia) | spa |
| dc.date.accessioned | 2024-09-19T20:07:01Z | |
| dc.date.available | 2024-09-19T20:07:01Z | |
| dc.date.issued | 2001 | |
| dc.degree.name | Ingeniero de Sistemas | spa |
| dc.description.abstract | Web Usage Mining es la aplicación de técnicas de minería de datos para descubrir patrones de uso desde un sítio web, para entender y mejorar las necesidades de servicio en sus aplicaciones. La VWWUM esta constituida por tres fases, preprocesamiento, descubrimiento de modelos y análisis de modelos. En este documento se describirán en detalle cada una de estas fases. Dando una aplicación potencial, a la minería de datos dentro de la web, pues ha mostrado un rápido incremento e interés dentro de la comunidades investigativas la aplicación de esta practica. En este documento se encontrara una taxonomía detallada del trabajo en esta área, incluyendo esfuerzos de investigación para un uso comercial. | spa |
| dc.description.abstractenglish | Web Usage Mining is the application of data mining techniques to discover usage patterns from a website, to understand and improve the service needs in your applications. The VWWUM is made up of three phases, preprocessing, model discovery and model analysis. Each of these phases will be described in detail in this document. Giving a potential application to data mining within the web, since the application of this practice has shown a rapid increase and interest within the research communities. In this document you will find a detailed taxonomy of work in this area, including research efforts for commercial use. | spa |
| dc.description.degreelevel | Pregrado | spa |
| dc.description.learningmodality | Modalidad Presencial | spa |
| dc.description.tableofcontents | INTRODUCCIÓN 1. CARACTERISTICAS DEL WORLD WIDE WEB 2 1.1. CLASIFICACION DE FUENTES 2 1.2 EL CLIENTE 3 1.3 PROXY Y GATEWAYS 5 1.4 EL SERVIDOR 5 1.5 APLICACIÓN SOBRE WWW 6 2. REVISION Y PROYECTOS EXISTENTES 8 2.1 DIMENSIÓN DE LOS PROYECTOS DE WUM 8 2.2 DOCUMENTACIÓN SOBRE PROYECTOS EXISTENTES 9 2.3 CARACTERÍSTICAS DE USO 11 3. WEB USAGE MINING 13 3.1 WEB DATA 13 3.1.1 Contenido 13 3.1.2 Estructura 14 3.1.3 Uso 14 3,1.4 Perfil de Usuario 14 4. TÉCNICAS 15 4.1 EXTRACCIÓN DE DATOS 15 4.2 PREPROCESAMIENTO 16 4.2.1 Preprocesamiento de Uso 16 4.2.2 Preprocesamiento de Contenido 20 4.2.3 Preprocesamiento de Estructura 21 4.3 DESCUBRIMIENTO DE PATRONES 21 4.4 ANÁLISIS ESTADÍSTICO 22 5. ALGORITMOS 23 5.1 TECNICAS 23 5.2 REGLAS DE ASOCIACIÓN 23 5.3 CLUSTERING 24 5.4 PATRONES SECUENCIALES 25 5.5 DEPENDENCIA DE MODELAMIENTO 26 5.6 ANÁLISIS DE MODELOS 27 6. SOFTWARE EXISTENTE EN EL MERCADO 29 6.1 CLASIFICACION DEL SOFTWARE 29 6.2 WUM 29 6.3 WEBTRENDS 32 6.3.1 Resultados de WebTrends 34 7. VENTAJAS DE UNA APLICACION DE WUM 35 7.1 PERSONALIZACIÓN 35 7.2 MEJORAS DEL SISTEMA 35 7.3 INTELIGENCIA DE NEGOCIOS 36 7.4 CARACTERÍSTICAS DE USO 36 8. HERRAMIENTA PROTOTIPO DESARROLLADA 38 8.1 EL ALGORITMO 38 8.2 DESCUBRIR ITEMSETS GRANDES 41 8.3 ALGORITMO APRIORI 42 8.4 DESCRIPCIÓN DE LA HERRAMIENTA 44 8.4.1 Funcionamiento de la Herramienta 46 8.4.2 Resultados parciales de la herramienta 48 8.4.3 Corrida de una caso de prueba 51 8.4.4 Archivo de entrada 52 8.4.5 Parte del Resultado del Log de la UNAB sin depurar el archivo principal. 55 8.4.6 Resultado final de la herramienta 55 8.5 INTERPRETACIÓN DE LAS REGLAS 60 8.6 EL PROGRAMA APRIORI 62 8.6.1 Opciones de ejecución del programa Apriori 62 8.7 INTERFASE DEL. PROGRAMA APRIORI UNAB 64 9. CONCLUSIONES 65 10. RECOMENDACIONES 67 BIBLIOGRAFÍA 68 ANEXOS 71 | spa |
| dc.format.mimetype | application/pdf | spa |
| dc.identifier.instname | instname:Universidad Autónoma de Bucaramanga - UNAB | spa |
| dc.identifier.reponame | reponame:Repositorio Institucional UNAB | spa |
| dc.identifier.repourl | repourl:https://repository.unab.edu.co | spa |
| dc.identifier.uri | http://hdl.handle.net/20.500.12749/26645 | |
| dc.language.iso | spa | spa |
| dc.publisher.faculty | Facultad Ingeniería | spa |
| dc.publisher.grantor | Universidad Autónoma de Bucaramanga UNAB | spa |
| dc.publisher.program | Pregrado Ingeniería de Sistemas | spa |
| dc.relation.references | Agrawal, R. & Srikant, R, (1995) Mining Sequential Patterns, Proc. Int’! Conf. on Data Engineering, pp. 3-14. | spa |
| dc.relation.references | Anand, 8.5., Scotney, B,W,, Tan, M,G., McClean, S.1, Bell, D.A., Hughes, J.,G, & Magill, I1.C. (1997) Designing a Kernel for Data Mining, /EEE Expert, 12(2):65-74. | spa |
| dc.relation.references | Anand, S. S., A, R. Patrick, J. G. Hughes and D,. A, Bell. 1998. A Data Mining Methodology for Cross-Sales, Knowledge-based Systems Journal 10; 449-461. | spa |
| dc.relation.references | Büchner, A.G. & Mulvenna, M.D,. (1998) Discovering Internet Marketing Intelligence through Online Analytical Web Usage Mining, 4CM SIGMOD Record, 21(4):54-61. | spa |
| dc.relation.references | Büchner, A.G,, Mulvenna, M,D., Anand, S.S, & Hughes, J.G. An Internet-cnabled Knowledge Discovery Process, Proc. 9% rt’) Database Conf., forthcoming, 1999a. | spa |
| dc.relation.references | Büchner, A,G., Baumgarten, M., Mulvenna, M.D., Anand, S.S. & Hughes, J,G. Navigation Pattern Discovery from Internet Data, submitted to 4CM Workshop on Web Usage Analysis and User Profiling (WebKDD’99), 1999b. | spa |
| dc.relation.references | Chen, M,S,, Park, J.8. & Yu, P,S, Data Mining for Traversal Patterns in a Web Environment, Proc. 16" Tntl’l Conf, on Distributed Computing Systems, pp. 385-392, 1996. | spa |
| dc.relation.references | Cooley, R., Mobasher, R. & Srivastava, J. (1997) Web Mining: Information and Pattern Discovery on the World Wide Web, Proc, 9% IEEE Int’! Conf. on Tools with Artificial Intelligence. | spa |
| dc.relation.references | Cooley, R., Mobasher, R. & Srivastava, J. (1999) Data Preparation for Mining World Wide Web Browsing Patterns, Knowledge and Information Systems, 1(1). | spa |
| dc.relation.references | Etzioni, O, The World-Wide Web: Quagmire or Gold Mine?, Comm. of the ACM, 39(11):65- 68, 1996. | spa |
| dc.relation.references | Ling, C.X. & Li, C, (1998) Data Mining for Direct Marketing: Problems and Solutions, Proc. 4" rut] Conf. on Knowledge Discovery and Data Mining, pp. 73-79. | spa |
| dc.relation.references | Mulvenna, M,D., Norwood, M.T. & Büchner, A,G. (1998) Data-driven Marketing, Electronic Markets: The Int’! Journal of Electronic Commerce and Business Media, 8(3):32-35. | spa |
| dc.relation.references | Spiliopoulou, M. The laborious way from data mining to web mining, Jnt’'! Journal of Computing Systems, Science de Engineering, March 1999. | spa |
| dc.relation.references | Spiliopoulou, M., Faulstich, L.C. & Winkler, K. A Data Miner analyzing the Navigational Behaviour of Web Users, Proc, 4C41'99 Workshop on Machine Learning in User Modelling, forthecoming, 1999. | spa |
| dc.relation.references | Srikant, R, & Agrawal, R, (1996) Mining Sequential Patterns: Generalizations and Performance Improvements, Proc. 5°’ Int'! Conf on Extending Database Technology, pp. 3-17. | spa |
| dc.relation.references | Zaïane, O.R, Xin, M, & Han, J. (1998) Discovering Web Access Patterns and Trends by Applying OLAP and Data Mining Technology on Web Logs, Prac. Advances in Digital Libraries Conſ. pp. 19-29. | spa |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 2.5 Colombia | * |
| dc.rights.local | Abierto (Texto Completo) | spa |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/co/ | * |
| dc.subject.keywords | Application of techniques | spa |
| dc.subject.keywords | Behavior patterns | spa |
| dc.subject.keywords | Web usage mining | spa |
| dc.subject.keywords | Search | spa |
| dc.subject.keywords | Data mining | spa |
| dc.subject.keywords | Computer programs | spa |
| dc.subject.keywords | Software architecture | spa |
| dc.subject.keywords | HTML (Document markup language) | spa |
| dc.subject.lemb | Ingeniería de sistemas | spa |
| dc.subject.lemb | Innovaciones tecnológicas | spa |
| dc.subject.lemb | Bases de datos | spa |
| dc.subject.lemb | Programas para computador | spa |
| dc.subject.lemb | Arquitectura de software | spa |
| dc.subject.lemb | HTML (Lenguaje de marcado) | spa |
| dc.subject.proposal | Aplicación de técnicas | spa |
| dc.subject.proposal | Patrones de comportamiento | spa |
| dc.subject.proposal | Búsqueda | spa |
| dc.title | Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento | spa |
| dc.title.translated | Application of web usage mining techniques to search for behavioral patterns | spa |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | spa |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis | |
| dc.type.hasversion | info:eu-repo/semantics/acceptedVersion | |
| dc.type.local | Trabajo de Grado | spa |
| dc.type.redcol | http://purl.org/redcol/resource_type/TP |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- 2001_Fuentes_Mejia_Oscar.pdf
- Tamaño:
- 49.94 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Tesis
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 829 B
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
