Establecimiento de preferencias de los usuarios de la Intra-Unab utilizando técnicas de Web Mining

dc.contributor.advisorCalderón Benavides, Maritza Lilianaspa
dc.contributor.apolounabCalderón Benavides, Maritza Liliana [maritza-liliana-calderón-benavides]
dc.contributor.authorSilva Ordoñez, Nicolásspa
dc.contributor.authorGaleano Herreño, Lady Johannaspa
dc.contributor.cvlacCalderón Benavides, Maritza Liliana [0000068900]*
dc.contributor.googlescholarCalderón Benavides, Maritza Liliana [XihGBWoAAAAJ&hl=es]*
dc.contributor.linkedinCalderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84]
dc.contributor.linkedinCalderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84]
dc.contributor.researchgroupGrupo de Investigación Tecnologías de Información - GTIspa
dc.contributor.researchgroupGrupo de Investigaciones Clínicasspa
dc.contributor.scopusCalderón Benavides, Maritza Liliana [15043558200]*
dc.contributor.scopusCalderón Benavides, Maritza Liliana [15043558200]
dc.coverageBucaramanga (Colombia)spa
dc.coverage.campusUNAB Campus Bucaramangaspa
dc.date.accessioned2020-06-26T17:56:28Z
dc.date.available2020-06-26T17:56:28Z
dc.date.issued2005
dc.degree.nameIngeniero de Sistemasspa
dc.description.abstractEl incremento de información que existe en la Web, ha hecho que esta reciba un debido tratamiento con el fin de descubrir conocimiento potencialmente útil y previamente desconocido a partir de los datos Web. Una de las maneras en que este tratamiento pudo ser hecho es por medio de la minería Web, con el fin de descubrir elementos interesantes que aportan conocimientos valiosos. La motivación principal en esta investigación, fue realizar un análisis de las preferencias de los usuarios del portal de la Intra-UNAB utilizando la técnica de Minería de Uso de la Web, desarrollando e implementando una herramienta que ayudara a determinar las preferencias de estos usuarios. Los resultados encontrados permitieron observar las preferencias de los usuarios en el portal universitario, estos resultados aportaron información desconocida por los administradores del sitio, como las páginas más visitadas , horarios en las que son accedidas estas páginas, esta herramienta ayudo a establecer la utilidad de la Intra-UNAB, generando como resultado diferentes reportes que permitieron analizar las preferencias de los usuarios.spa
dc.description.abstractenglishThe increase in information that exists on the Web has caused it to receive due treatment in order to discover potentially useful and previously unknown knowledge from Web data. One of the ways in which this treatment could be done is through Web mining, in order to discover interesting elements that provide valuable knowledge. The main motivation in this research was to perform an analysis of the preferences of the users of the Intra-UNAB portal using the Web Use Mining technique, developing and implementing a tool that would help determine the preferences of these users. The results found allowed observing the preferences of the users in the university portal, these results contributed information unknown by the administrators of the site, such as the most visited pages, times in which these pages are accessed, this tool helped to establish the usefulness of the Intra-UNAB, generating as a result different reports that allowed the analysis of user preferences.eng
dc.description.degreelevelPregradospa
dc.description.learningmodalityModalidad Presencialspa
dc.description.tableofcontentsINTRODUCCIÓN 20 1. MARCO TEÓRICO 23 1.1 DESCUBRIMIENTO DE CONOCIMIENTO EN BASES DE DATOS (KDD) 23 1.1.1 Proceso de KDD. 24 1.2 MINERÍA DE DATOS 26 1.2.1 Proceso de Minería de Datos. 27 1.2.2 Aplicaciones de Minería de Datos. 29 1.2.3 Técnicas de Minería de Datos. 31 1.3 MINERÍA DE DATOS EN LA WEB 37 1.3.1 Arquitectura de Minería Web. 39 1.3.2 Técnicas de Minería Web. 41 2. MINERÍA DEL USO DE LA WEB 46 2.1 PROCESO DE MINERÍA DEL USO DE LA WEB 46 2.1.1 Datos de Entrada. 47 2.1.2 Procesamiento de Datos. 51 2.1.3 Datos de Salida. 59 3. PREPARACIÓN DE LOS DATOS Y DISEÑO DE LA HERRAMIENTA 61 3.1 CAPTURA DE REQUERIMIENTOS 61 3.1.1 Casos de Uso de la Aplicación. 61 3.2 PROCESOS BÁSICOS DE LA HERRAMIENTA 63 3.2.1 Selección De los Datos. 65 3.2.2 Limpieza del Log. 66 3.2.3 Sesiones de Usuario. 66 3.2.4 Algoritmo AprioriPredectivo 67 3.2.5 Reglas. 67 3.2.6 Informe de Resultados. 67 3.3 DISEÑO 68 3.3.1 Algoritmo Seleccionado. 68 3.3.2 Lenguaje de Programación Seleccionado JAVA. 70 3.3.3 Diagrama de Clases Aplicación. 70 3.3.4 Diagrama de Secuencia “Algoritmo AprioriPredectivo” 71 3.3.5 Diagrama de Actividades “Algoritmo AprioriPredectivo” 72 4. CONSTRUCCIÓN DE LA HERRAMIENTA 74 4.1 SELECCIÓN DE LOS DATOS 74 4.2 LOG 74 4.3 ESTRUCTURA DE LA APLICACIÓN 76 4.3.1 Log del Servidor. 77 4.3.2 Log Limpio. 77 4.3.3 Log ReaderApp.class. 78 4.3.4 Conectio2.class. 78 4.3.5 Salida Arff.class. 78 4.3.6 Archivo.arff. 78 4.3.7 PredectiveAprioriWebMining.class. 79 4.3.8 Barchart2.class. 78 4.4 BASES DE DATOS 79 5. PRUEBAS Y ANÁLISIS DE RESULTADOS 81 5.1 DESCRIPCIÓN DE PRUEBAS 81 5.2 RELACIÓN DE RESULTADOS 97 6. RECOMENDACIONES 100 CONCLUSIONES Y TRABAJOS FUTUROS 101 BIBLIOGRAFÍA 104 ANEXOS 111
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.identifier.urihttp://hdl.handle.net/20.500.12749/1342
dc.language.isospaspa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.publisher.programPregrado Ingeniería de Sistemasspa
dc.relation.referencesSilva Ordoñez, Nicolás, Galeano Herreño, Lady Johanna, Calderón Benavides, Maritza Liliana (2005). Establecimiento de preferencias de los usuarios de la Intra-Unab utilizando técnicas de web mining. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNABspa
dc.relation.referencesAggarwal, C. C., Sun, Z. & Yu, P. S. Online algorithms for finding profile association rules. Proceedings of the 1998 ACM CIKM 7th International Conference on Information and Knowledge Management. Bethesda, Maryland, USA, November 3-7, 1998, pp. 86-95(1998).
dc.relation.referencesAgrawal et al., 1993] Agrawal, R., T. Imielinski, and A. Swami, Mining Association rules between sets of items in large databases. ACM SIGMOD International Conference, Washington DC, USA, pp. 207-216, May 1993.
dc.relation.referencesAgrawal Rakesh, SHAFER John C. “Parallel Mining of Association Rules” IEEE Transactions on Knowledge and Data Engineering, December 1996.
dc.relation.referencesB. Mobasher, N. Jain, S. han, J. Srivastava. Webmining: Pattern Discovery from World Wide Web Transactions. Department of Computer Science, University of Minnesota, 1996.
dc.relation.referencesBooch, Grady. Jacobson, Ivar y Rumbaugh, james. The Unified Modelling Languaje. Addison Wesley Longman Inc. rational Software Corporation.1999.
dc.relation.referencesCabral de Moura Borges José Luís. A Data Mining Model to Capture User Web Navigation Patterns. Department Of Computer Science, University College London (2000).
dc.relation.referencesCernuzzi Luca Molas María Liz Integrando diferentes técnicas de Data Mining en procesos de Web Usage Mining. Universidad Católica "Nuestra Señora de la Asunción" Departamento de Ingeniería Electrónica e Informática Asunción - Paraguay, pp. 16-83, 2003.
dc.relation.referencesConallen, Jim. Building Web Aplications with Uml. Addison Wesley Longman Inc. 1999.
dc.relation.referencesCooley R., Mobasher B., “Web Mining: Information and Pattern Discovery on the World Wide Web” (1998).
dc.relation.referencesCooley Robert, Mobasher Bamshad, and Srivastava Jaideep. Data preparation for mining world wide web browsing patterns. Knowledge and Information Systems, 1(1), 1999.
dc.relation.referencesCooley Robert, Mobasher Bamshad, and Srivastava Jaideep. Web Usage Mining: Discovery and Applications of UsagePatterns from Web Data Knowledge and Information Systems, 1(1), 1999.
dc.relation.referencesCooley Robert, Mobasher Bamshad, and Srivastava Jaideep. Web Usage Mining: Discovery and Applications of UsagePatterns from Web Data Knowledge and Information Systems, Volume 1, Issue 2 - page 16.1999.
dc.relation.referencesDate J. An Introduction to Database Systems, vol 1. 4ª edición, Addison-Wesley, Reading, Mass, 1986.
dc.relation.referencesE. Forgy. Cluster analysis of multivariate data: Efficiency vs. interpretability of classifications, Biometrics 21, 768 (1965).
dc.relation.referencesEstrada Pedroza, Nelson “Descubrimiento de conocimiento en los datos de una empresa de telefonía”, Cuernavaca, Morelos. Mayo de 2002.
dc.relation.referencesFayyad Usama, Piatersky-Shapiro Gegory, Padhraic Smyth. From Data Mining To Knowledge Discovery. Jet Propulsion Laboratory California Institute Of Technology. AAAI Press / The MIT
dc.relation.referencesFayyad, U.M., Piatetsky-Shapiro and P. Smith. From Data Mining to Knowledge Discovery: An Overview. En Advances in Knowledge Discovery and Data Mining. AAAI Press. MIT Press. 1996.
dc.relation.referencesFranco, Jean Michael. Data Warehause The Data Mining, Editorial Gestion. Paginas 6-223. 2002.
dc.relation.referencesGaliano, Fernando. Un método alternativo para la construcción de árboles de decisión. tesis doctoral. universidad de granada ets. ingeniería informatica. Granada, junio de 2002.
dc.relation.referencesGuerrero Fuentes, Alexandra carolina, PACHECO JAIMES, diana carolina. Intranet para la universidad autónoma de Bucaramanga, versión 2.0, 2003.
dc.relation.referencesH. Blockeel, R. Kosala.Web-mining research: A survey. SIGKDD Explorations, pp 1-35. Julio de 2000.
dc.relation.referencesHan, J; Kamber M, Kaufmann Morgan. Data Mining Concepts and Techniques. pp 11-22, 2001.
dc.relation.referencesHan, J; Kamber M, Kaufmann Morgan. Data Mining Concepts and Techniques. pp 28-40-, 2002.
dc.relation.referencesHenry F. Korth, Abraham Silberschtz. Fundamentos Bases de Datos, Vol.2. 1993
dc.relation.referencesHerrero, Javier. Clustering para datos de DNA-arrays. Centro Nacional de Investigaciones Oncológicas Carlos III, Madrid. Abril de 2001.
dc.relation.referencesHias Gery, Hatem Haddad. Evaluation of Web Usage Mining Approaches for User’s Next Request Prediction. Information Technology Department .VTT Technical Research Centre of Finland, España. 2002.
dc.relation.referencesInformación sobre Web Mining: http://www.webminer.com/
dc.relation.referencesJ.B. McQueen Some methods for classification and analysis of multivariate observations, Proceeding of the Fifth Berkeley Symposium on Mathematical Statistics and Probability 1, 281-297(1967).
dc.relation.referencesJoshi, K.P. 1997. Analysis of Data Mining Algorithms (FUV Abril/15/2004) http://userpages.umbc.edu/~kjoshi1/data-mine/proj_rpt.htm lcernuzz@uca.edu.py
dc.relation.referencesM. Baglioni1, U. Ferrara2, A. Romei1, S. Ruggieri1, and F. Turini1. Preprocessing and Mining Web Log Data for Web Personalization, pp (11) italia 1999. http://ferrara@ksolutions.it
dc.relation.referencesMantilla Grande, Lina Maria. red interna de información (Intranet) para la UNAB, 1998.
dc.relation.referencesMaurice Houtsma & Arum Swami: "Set-oriented mining of association rules" Research Report RJ 9567 IBM Almaden Research Center, San Jose, California, Octubre 1993.
dc.relation.referencesMena, J. Data mining your website. Digital Press. 1999.
dc.relation.referencesMichalski, R.S., Bratko, I., Kubat M. Machine Learning and Data Mining. Methods and Applications. Wiley & Sons Ltd., EE.UU. 1998.
dc.relation.referencesMorales, E. Descubrimiento de Conocimiento en Bases de Datos. ® http://www.mor.itesm.mx/~emorales/Cursos/KDD/node168.html (FUV Noviembre/25/2004), 1999.
dc.relation.referencesMoreno García, Luis A. Miguel Quintales, Francisco J. García Peñalvo José Polo Martín. Trabajo de investigación “Aplicación de Técnicas de Minería de Datos en la construcción y validación de modelos predictivos y asociativos a partir deespecificaciones de requisitos de software”; Universidad deSalamanca, Departamento de Informática y Automática.
dc.relation.referencesNúmero Especial sobre Recommender Systems, Communications of the ACM, Vol. 40, no. 3, 1997Oppermann R. Introduction. Adaptive User Support (Ed. Oppermann R.), Lawrence Erlbaum. Associates, Hillsdale, New Jersey, pp1-13. 1994.
dc.relation.referencesP. R. Limb y g. J. Meggs. "Data mining, tools and techniques". En BT echnology Journal, vol. 12(4), Octubre 1994. Págs. 32-41.
dc.relation.referencesPedro Larrañaga e Iñaki Inza. Clustering Particional y Jerárquico Departamento de Ciencias de la Computación e Inteligencia Artificial. Universidad del Paris Vasco–Euskal Herriko Unibertsitatea, pp 22-42
dc.relation.referencesPoblette Labra, Barbara Jeannette. Herramienta de Minería de Consultas para el diseño y el contenido de un sitio Web. Escuela de postgrado escuela de ingeniería y ciencias. Tesis para optar al grado de magíster en ciencias. Paginas 1-101. Noviembre 2004
dc.relation.referencesR. Agrawal and R. Srikant. Mining sequential patterns. In Proceedings of the Eleventh International Conference on Data Engineering (ICDE’95), pp (3-14), Taipei, Taiwán, 1995
dc.relation.referencesR. Kimball and R. Merz. The Data Webhouse Toolkit. John Wiley and Sons, Inc., 2000.
dc.relation.referencesRakesh Agrawal & Ramakrishnan Skirant: "Fast Algorithms for Mining Association Rules" IBM Research Reporte RJ9839 ibm Almaden Research Center, San Jose, California (USA), June 1994.
dc.relation.referencesRakesh Agrawal y skirant ramakrishnan. Fast algorithms for mining association rules. IEE transaction on knowledge and data engineering. Pp (22) 1998.
dc.relation.referencesRakesh Agrawal, Tomaz Imielinski & Arun Swami "Mining association rules between sets of items in large database " Proceeding of the ACM SIGMOD Conference on Management of Data Washington DC, USA, Mayo 1993.
dc.relation.referencesServente ,Magdalena. Algoritmo TDIDT aplicado a la minería de datos inteligente. Tesis de grado En ing informal, facultad de ing. . Universidad de buenos aires. lab. de sistemas inteligentes, feb 2002, Pág. 33-40.
dc.relation.referencesSrikant Ramakrishnan, Yang_Yinghui. Mining Web Logs to Improve Website Organization. IBM Almaden Research Center 650 Harry Road .San Jose, CA of Operations & Information Management Wharton Business School University of Pennsylvania 3620 Locust Walk, Philadelphia, 1999.
dc.relation.referencesSrivastava, Cooley R., Deshpande M.. P-T. Tan. Web Usage Mining: Discovery and Applications of Usage Patterns from Web Data. SIGKDD Explorations, 1(1):12-23, January 2000.
dc.relation.referencesWeb Mining and Data Web, June 2000, Vol. 2, nº1 de la revista ACM SIGKDD Explorations, Newsletter of the ACM Special Interest Group on Knowledge Discovery and Data Mining
dc.relation.referencesWeb mining pattern discovery from world wide web transactions http://maya.cs.depaul.edu/~mobasher/classes/ds575/papers/Webmining.pdf
dc.relation.referencesWEB MINING: Pattern discovery from word wide web transactions, preprocessing and mining web log data for web personalization, italy, 1997 http://www.inf.udec.cl/~andrea/cursos/retrieval/mining.pdf.
dc.relation.referencesWEKA - Machine Learning Sotware in Java. Universidad de Waikato. NuevaZelanda. Mayo 2004. http://www.cs.waikato.ac.nz/~ml/weka/.
dc.relation.referencesWitten Ian H. Kaufmann Morgan, and Eibe Frank. Data Mining: practical machine learning tools and techniques with Java implementations. 1999.
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.subject.keywordsWeb portalseng
dc.subject.keywordsSystems Engineereng
dc.subject.keywordsInvestigationseng
dc.subject.keywordsData miningeng
dc.subject.keywordsWeb mining techniques
dc.subject.keywordsInstitutional portal
dc.subject.keywordsKDD process
dc.subject.keywordsData mining
dc.subject.lembPortales webspa
dc.subject.lembIngeniera de sistemasspa
dc.subject.lembInvestigacionesspa
dc.subject.lembMinería de datosspa
dc.subject.proposalTécnicas de web mining
dc.subject.proposalPortal institucional
dc.subject.proposalProceso de KDD
dc.subject.proposalMinería de datos
dc.titleEstablecimiento de preferencias de los usuarios de la Intra-Unab utilizando técnicas de Web Miningspa
dc.title.translatedSetting preferences for Intra-Unab users using Web Mining techniqueseng
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.type.localTrabajo de Gradospa
dc.type.redcolhttp://purl.org/redcol/resource_type/TP

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
2005_Tesis_Nicolás_Silva_Ordóñez.pdf
Tamaño:
2.89 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis