Prototipo para la detección automática de perfiles de usuarios

dc.contributor.advisorPérez Alcázar, José de Jesús
dc.contributor.authorFlórez García, Erika Yohana
dc.contributor.authorValero Durán, Daniel Andrés
dc.coverage.campusUNAB Campus Bucaramangaspa
dc.coverage.spatialBucaramanga (Santander, Colombia)spa
dc.date.accessioned2024-08-29T12:50:13Z
dc.date.available2024-08-29T12:50:13Z
dc.date.issued2003-01-27
dc.degree.nameIngeniero de Sistemasspa
dc.description.abstractLa información disponible actualmente de los sistemas de filtrado requieren de un modelo de preferencias de usuario, que están representadas como perfiles de usuarios, normalmente en forma de listas de valores / atributos y/o reglas. Desde el punto de vista del sistema, es recomendable disponer de la mayor cantidad de información posible sobre el usuario, para obtener resultados más útiles. Sin embargo, el usuario dispone de poco tiempo para crear la especificación de su perfil de usuario. Además, estos perfiles pueden cambiar a través del tiempo dificultando el mantenimiento de los perfiles. Una de las alternativas para adquirir conocimiento acerca del usuario es a través de técnicas de aprendizaje de máquinas. Muchos sistemas emplean aprendizaje de máquinas para deducir el perfil de usuario. Esto no solo elimina que el usuario proporcione sus palabras claves, sino definirlas. Sin embargo, para que un sistema sea inteligente y adaptivo, debería aprender de acuerdo al comportamiento del usuario. En muchos sistemas el comportamiento del usuario se ve reflejado a través de los documentos seleccionados y el feedback para estos documentos. El presente documento muestra la investigación realizada y el desarrollo de un Prototipo para la Detección Automática de Perfiles de Usuarios, creado con el objetivo de facilitar el trabajo al usuario de crear y actualizar su perfil para sistemas de filtrado de información o recuperación de información.spa
dc.description.abstractenglishThe information currently available from filtering systems requires a model of user preferences, which are represented as user profiles, usually in the form of lists of values ​​/ attributes and/or rules. From the system's point of view, it is advisable to have as much information as possible about the user, in order to obtain more useful results. However, the user has little time to create the specification of his user profile. In addition, these profiles can change over time, making it difficult to maintain the profiles. One of the alternatives to acquire knowledge about the user is through machine learning techniques. Many systems employ machine learning to deduce the user profile. This not only eliminates the user from providing his keywords, but also from defining them. However, for a system to be intelligent and adaptive, it should learn according to the user's behavior. In many systems, the user's behavior is reflected through the documents selected and the feedback for these documents. This document shows the research carried out and the development of a Prototype for the Automatic Detection of User Profiles, created with the objective of facilitating the work of the user in creating and updating their profile for information filtering or information retrieval systems.spa
dc.description.degreelevelPregradospa
dc.description.learningmodalityModalidad Presencialspa
dc.description.tableofcontentsIntroducción.......................................................................................................................................................................................... 16 1. Generalidades............................................................................................................................................................................ 18 1.1 procesos de búsqueda de información................................................................................................................................. 18 1.1.1 recuperación de información.............................................................................................................................................. 18 1.1.2 diseminación selectiva de información.............................................................................................................................. 18 1.1.3 filtrado de información............................................................................................................................................................ 18 1.2 tipos de sistemas de apoyo a la recuperación de Información ......................................................................................18 1.2.1 motores de búsqueda.............................................................................................................................................................. 18 1.2.2 sistemas de filtrado de información personalizado.............................................................................................................. 18 1.2.2.1 técnicas de filtrado de información................................................................................................................................. 18 1.3 detección automática de perfiles .................................................................................................................................19 2. Modelo de recuperación de información utilizado para La detección automática de perfiles........................................... 20 2.1 modelo del vector espacial .......................................................................................................................................................20 3. Representación de un documento............................................................................................................................................... 23 3.1 indexación automática.................................................................................................................................................................... 23 3.1.1 identificación de términos................................................................................................................................. 24 3.1.2 identificación de términos compuestos................................................................................................................................. 24 3.1.3 remoción de “stopwords” ....................................................................................................................................................25 3.1.4 normalización morfológica........................................................................................................................................................ 26 3.1.5 cálculo de relevancia................................................................................................................................................................... 27 3.1.5.1 frecuencia absoluta................................................................................................................................................................. 27 3.1.5.2 frecuencia relativa............................................................................................................................................................... 28 3.1.5.3 frecuencia inversa de documentos................................................................................................................................. 28 3.1.6 selección de términos............................................................................................................................................................ 29 3.1.6.1 detección de perfiles basado en el “peso” del término........................................................................................................ 30 3.1.6.2 selección basada en el “peso” del término............................................................................................................................ 30 4. Técnicas de generación de perfiles................................................................................................................................. 31 4.1 métodos de minería de datos................................................................................................................................. 31 4.1.1 minería de datos............................................................................................................................................................................ 31 4.1.1.1 descubrimiento de conocimiento en bases de datos.......................................................................................................... 31 4.1.1.2 reglas de asociación.......................................................................................................................................................... 32 4.1.2 procedimiento de generación de perfiles con minería de datos...................................................................................... 34 4.1.2.1 identificación de reglas................................................................................................................................. 35 4.1.2.2 validación de reglas................................................................................................................................................................... 35 4.2 sistemas de generación automática de perfiles Existentes en la literatura........................................................................ 35 4.3 aprendizaje a través de ejemplos............................................................................................................................................. 36 4.4 cauterización de perfil de usuario................................................................................................................................. 36 4.5 aprendizaje por observación .................................................................................................................................36 4.6 técnica utilizada en el prototipo para la detección Automática de perfiles......................................................................... 36 5. Actualización de perfiles de usuario................................................................................................................................. 38 5.1 algoritmos de aprendizaje de clasificación................................................................................................................................. 38 5.1.1 feedback del usuario.................................................................................................................................................................... 38 5.1.2 algoritmo de rocchio .............................................................................................................................................................39 5.1.3 algoritmo de widrow-hoff.......................................................................................................................................................... 40 5.1.4 algoritmo de eg de kivinen y warmuth................................................................................................................................. 40 6. Prototipo para la detección automática de perfiles...................................................................................................................... 41 6.1 captura de requerimientos.......................................................................................................................................................... 41 6.1.1 casos de uso ............................................................................................................................................................................41 6.1.1.1 actor.......................................................................................................................................................................................... 41 6.1.1.2 relaciones............................................................................................................................................................................ 41 6.1.2 casos de uso para la detección automática de perfiles .............................................................................................................42 6.2 análisis............................................................................................................................................................................ 42 6.2.1 diagrama de clases........................................................................................................................................................................ 42 6.2.2 diagrama de clases para el prototipo de detección automática de Perfiles de usuario ...................................................42 6.2.2.1 diccionario de datos para el prototipo de detección automática de Perfiles ...........................................42 6.2.3 diagramas de interacción ....................................................................................................................................................42 6.2.3.1 diagramas de secuencia.................................................................................................................................................... 42 6.2.3.2 diagrama de colaboración................................................................................................................................. 45 6.2.4 diagramas de secuencia y de colaboración para el prototipo de Detección automática de perfiles de usuario 45 6.2.5 diagramas de actividades................................................................................................................................. 46 6.2.6 diagrama de actividades y sus descripciones para el prototipo de Detección automática de perfiles 46 6.2.7 diagrama de estado................................................................................................................................................................... 46 6.2.8 diagramas de estado para el prototipo de detección automática de Perfiles ...............................................................46 6.2.9 clases - responsabilidades - colaboraciones ...................................................................................................................47 6.2.9.1 clase ............................................................................................................................................................................47 6.2.9.2 responsabilidad ............................................................................................................................................................................47 6.2.9.3 colaboración............................................................................................................................................................................ 48 6.2.9.4 tarjetas crc............................................................................................................................................................................ 48 6.2.10 tarjetas crc para el prototipo de detección automática de perfiles..................................................................................... 48 6.3 diseño ............................................................................................................................................................................50 6.3.1 análisis de clases............................................................................................................................................................................ 50 6.3.1.1 clase frontera............................................................................................................................................................................ 50 6.3.1.2 clase entidad............................................................................................................................................................................ 50 6.3.1.3 clase control............................................................................................................................................................................ 51 6.3.2 ingeniería de casos de uso .......................................................................................................................................................51 6.3.2.1 diagramas correspondientes a la ingeniería de casos de uso........................................................................................ 51 6.3.3 descripción procedimental de objetos................................................................................................................................. 52 6.4 desarrollo del sistema ............................................................................................................................................................52 6.4.1 usando minería de datos para la creación de perfiles............................................................................................................. 52 6.4.2 creación de perfiles de usuario .................................................................................................................................53 6.4.3 actualización de perfiles de usuario................................................................................................................................. 55 6.4.4 adición de palabras claves al perfil del usuario .................................................................................................................57 6.4.5 implementación del prototipo a un sistema de filtrado de información............................................................................... 58 7. Conclusiones ............................................................................................................................................................................61 8. Sugerencias para trabajos futuros ...................................................................................................................................................63 Bibliografía................................................................................................................................................................................................ 64 Anexos....................................................................................................................................................................................................... 67spa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.identifier.repourlrepourl:https://repository.unab.edu.cospa
dc.identifier.urihttp://hdl.handle.net/20.500.12749/26295
dc.language.isospaspa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.publisher.programPregrado Ingeniería de Sistemasspa
dc.relation.referencesAAS, Kjersti. A Survey on Personalised Information Filtering Systems for the World Wide Web. Norwegian Computing Center. December 1997.spa
dc.relation.referencesADOMAVICIUS, Gediminas y TUZHILIN, Alexander. Using Data Mining Methods to Build Costumer Profiles. IEEE Magazine, February 2001spa
dc.relation.referencesAGRAWAL, Rakesh; IMIELINSKI, Tomasz and SWAMI, Arun. Mining Association Rules between Sets of Items in Large Databases. IBM Almadén Research Center.spa
dc.relation.referencesBAEZA YATES, R. and RIBEIRO-NETO, Berthier A. Modern Information Retrieval. Maryland: Addison-Wesley-Longman Publishing co, 1999.spa
dc.relation.referencesBAEZA YATES, Ricardo A. String Searching Algorithms. En FRAKES, William B. y BAEZA YATES, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p.219-240.spa
dc.relation.referencesBOOCH, Grady, JACOBSON, Ivar Y RUMBAUGH, James. The Unified Modeling Languaje. Addison Wesley Longman Inc. Rational Software Corporation. 1999.spa
dc.relation.referencesBOOCH, Grady, JACOBSON, Ivar Y RUMBAUGH, James. The Unified Software Development Process. Addison Wesley Longman Inc. Rational Software Corporation. 1999.spa
dc.relation.referencesBORGELT, Christian and KRUSE, Rudolf. Induction of Association Rules: Apriori Implementation. University of Magdeburg.spa
dc.relation.referencesBUCKLEY, Chris; SALTON, Gerard and ALLAN, James. Automatic Routing and ad-hoc retrieval using SMART: TREC 2. In D.K. Harman, editor, Proceedings of the Second Text Retrieval Conference (TREC-2).spa
dc.relation.referencesCLAYPOOL, Mark, BROWN, David, LE, Phong y WASEDA, Makoto. Inferring User Interest. Worcester Polytechnic Institute, 2001.spa
dc.relation.referencesCONALLEN, Jim. Building Web Aplications with UML. Addison Wesley Longman Inc. 1999.spa
dc.relation.referencesDELGADO, Juaquin. Agent-Based Information Filtering and Recommender Systems On the Internet. PhD. Thesis, Nagoya Institute of Technology, March 2000.spa
dc.relation.referencesDELGADO, Juaquin y ISHII, Naohiro. Formal Models for Learning of User Preferences, a Preliminary Report. Nagoya Institute of Technology, 1999.spa
dc.relation.referencesFOX, Christopher. Lexical analysis and stoplists. En: FRAKES, William B. y BAEZA, Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p. 102-130.spa
dc.relation.referencesFRAKES, William B. Stemming Algorithms. En FRAKES, William B. BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p. 131-160.spa
dc.relation.referencesHAN, Jiawei and KAMBER, Micheline. Data Mining. Concepts and Techniques. Morgan Kaufmann Publisher. 2001.spa
dc.relation.referencesKORFHAGE, Robert R. Information Retrieval and Storage. New York: John Wiley&Sons, 1997. 349p.spa
dc.relation.referencesKOWALSKI, Gerald. Information Retrieval Systems: Theory and Implementation. Boston: Kluwer Academic Publishers, 1997. p. 71.spa
dc.relation.referencesKRAAIJ, Wessel y POHLMANN, Renée. Viewing stemming as recall enhancement. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'96), 1996, Zurich, Switzerland. Proceedings. New York: ACM Press, 1996. p.40-48.spa
dc.relation.referencesKUFLIK, Tsvi y SHOVAL, Peretz. User Profile Generate for Intelligent Information Agents - Research in Progress. University of the Negey, 2000.spa
dc.relation.referencesLEWIS, David D. et al. Training Algorithms for Linear Text Classifiers. AT&T Laboratories and University of Massachusetts.1996.spa
dc.relation.referencesMLADENIC, Dunja y GROBELNIK, Marko. Feature Selection for Classification Based on Text Hierarchy. En: Conference on Automated Learning and Discovery (CONALD-98), 2000, Proceedings. Pittsburg: Carnegie Mellón University, 2000.spa
dc.relation.referencesMORALES, Eduardo. Descubrimiento de Conocimiento en Bases de Datos. http://dns1 .mor.itesm.mx/~emorales/Cursos/KDD01/principal.html, Junio. 2002.spa
dc.relation.referencesROBERTSON, S. E.; WALKER, S. On relevance weights with little relevance information. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'97), 1997, Philadelphia, USA. Proceedings. New York ACM Press, 1997. p. 16-24.spa
dc.relation.referencesRUMBAUGH, James, BLAHA, Michael, PREMERLANI, William, EDDY, Frederick y LORENSEN, William. Modelado y diseño Orientado a Objetos. Metodología OMT. Prentice Hall. 1995.spa
dc.relation.referencesSALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. P. 63.spa
dc.relation.referencesSALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. Pagina 66.spa
dc.relation.referencesSALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. 448p.spa
dc.relation.referencesSALTON, Gerard; BUCKLEY, Chris. Term weighting approaches in automatic text retrieval. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).spa
dc.relation.referencesSCHÜTZE, Hinrich y SILVERSTEIN. Craig. Projections for efficient document clustering. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'97) 1997. Philadelphia, USA. Proceedings. New York ACM Press, 1997. p.60-66.spa
dc.relation.referencesUDEN, Mark van. Rocchio: Relevance Feedback in Learning Classification Algorithms. University of Nijmegen.spa
dc.relation.referencesWeka 3: Machine Learning Software in Java. http://www.cs.waikato.ac.nz/~ml/weka/index.html, Junio. 2002.spa
dc.relation.referencesWHITEHALL, T. Personal currents awareness service. A Handbook of Techniques for Manual SDI. Londres, British Library, Research and Development Reports, 1979.spa
dc.relation.referencesWIENER, Erik D. et al. A Neural Network Approach to Topic Spotting. En Fourth Annual Symposium on Document Analysis and Information Retrieval (SDAIR'95). 1995, Las Vegas. 1995. p.317-332.spa
dc.relation.referencesWITTEN, lan H. and FRANK, Eibe. WEKA Machine Learning Algorithms in Java. University of Waikato. 2000.spa
dc.relation.referencesYANG, Yiming y PEDERSEN, Jan O. A comparative study on features selection in text categorization. School of Computer Science, Carnegie Mellón University, 1997.spa
dc.relation.referencesYOCHUM, Julián A.. Research in Automatic Profile Generation and Passage- Level Routing with LMDS. Logicon, Inc.. 1996.spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.subject.keywordsSystems engineerspa
dc.subject.keywordsTechnological innovationsspa
dc.subject.keywordsUser profilespa
dc.subject.keywordsAlgorithmsspa
dc.subject.keywordsSpace vectorspa
dc.subject.keywordsLiteraturespa
dc.subject.keywordsPrototype developmentspa
dc.subject.keywordsSoftware engineeringspa
dc.subject.keywordsMathematical modelsspa
dc.subject.lembIngeniería de sistemasspa
dc.subject.lembInnovaciones tecnológicasspa
dc.subject.lembDesarrollo de prototiposspa
dc.subject.lembIngeniería de softwarespa
dc.subject.lembModelos matemáticosspa
dc.subject.proposalPerfil de usuariospa
dc.subject.proposalAlgoritmosspa
dc.subject.proposalVector espacialspa
dc.subject.proposalLiteraturaspa
dc.titlePrototipo para la detección automática de perfiles de usuariosspa
dc.title.translatedPrototype for automatic detection of user profilesspa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.type.localTrabajo de Gradospa
dc.type.redcolhttp://purl.org/redcol/resource_type/TP

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
2002_Tesis_Erika_Florez.pdf
Tamaño:
17.34 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
829 B
Formato:
Item-specific license agreed upon to submission
Descripción: