Análisis de la combinación de modelos de filtrado de información

dc.contributor.advisorPérez Alcázar, José de Jesússpa
dc.contributor.authorMonroy Vecino, Olga Lucíaspa
dc.contributor.corporatenameInstituto Tecnológico de Estudios Superiores de Monterrey (ITESM)spa
dc.contributor.cvlachttps://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000274038*
dc.contributor.researchgroupGrupo de Investigación Tecnologías de Información - GTIspa
dc.contributor.researchgroupGrupo de Investigaciones Clínicasspa
dc.coverageBucaramanga (Colombia)spa
dc.coverage.campusUNAB Campus Bucaramangaspa
dc.date.accessioned2020-06-26T21:32:20Z
dc.date.available2020-06-26T21:32:20Z
dc.date.issued2003-06-03
dc.degree.nameMagíster en Ciencias Computacionalesspa
dc.description.abstractEl tema de la sobrecarga de información se ha discutido ampliamente en la literatura referente a la administración y recuperación de información, pero aun sigue siendo un problema sin resolver. La información para cada usuario llega de muy diversas fuentes y representa más datos de los que una persona normal puede manejar. Aplicaciones más recientes emplean tecnologías como el filtrado colaborativo automático o la representación y evaluación de documentos, mediante diversos métodos automatizados, para ayudarle a los usuarios en sus tareas de recepción y análisis de información. Se parte de conceptos básicos de Recuperación de Información como antesala a la tarea de Filtrado de Información y de sistemas que permiten, además de responder a una consulta de un usuario, recomendarle un conjunto de ítems que también pueden ser de su interés, que es lo que se conoce como Sistemas de Recomendación. Los modelos utilizados para el filtrado de información: Filtrado de Basado en Contenido (Cognitivo) y el Filtrado Colaborativo (Social), se estudian en forma separada y posteriormente se integran en las propuestas que buscan minimizar las debilidades de cada modelo. Un sistema de recomendación basado en filtrado por contenido puro, recomienda ítems similares a aquellos que el usuario ha dado una alta calificación en el pasado, en cambio, un sistema de recomendación con filtrado colaborativo puro identifica los usuarios con gustos similares, para recomendarle al usuario los ítems que a ellos les han gustado. Un sistema híbrido puede incorporar las ventajas de ambos sistemas y minimizar las desventajas que presenta cada modelo en su forma pura. Como preámbulo a las propuestas de integración, se describen brevemente algunos ejemplos de aplicación, de sistemas de recomendación conocidos, como Metiorew, FAB, Letizia, PTV, MovieLens, WebWatcher entre otros, que son sistemas basados en filtrado por contenido, colaborativo o híbridos. Para la prueba de cada uno de los modelos estudiados, se utilizó la Base de datos de EachMovie, que es una recopilación de información de películas, realizada por el Centro de Investigación de Compaq, que ejecutó el servicio de recomendación por espacio de 18 meses, para experimentar con el sistema de filtrado colaborativo. Durante este tiempo, 72.916 usuarios dieron 2’811.983 calificaciones (ratings numéricos) para 1.628 películas diferentes (filmes y videos). Este conjunto de datos está disponible para que pueda ser usado por investigadores en el área de filtrado colaborativo, para probar sus algoritmos.spa
dc.description.abstractenglishThe topic of information overload has been widely discussed in the information management and retrieval literature, but it still remains an unsolved problem. The information for each user comes from many different sources and represents more data than a normal person can handle. Newer applications employ technologies such as automatic collaborative filtering or document rendering and evaluation, using various automated methods, to assist users in their information reception and analysis tasks. It starts from the basic concepts of Information Retrieval as a prelude to the task of Filtering Information and systems that allow, in addition to responding to a query from a user, recommending a set of items that may also be of interest to you, which is what known as Recommendation Systems. The models used for information filtering: Content-Based Filtering (Cognitive) and Collaborative Filtering (Social), are studied separately and later integrated into the proposals that seek to minimize the weaknesses of each model. A recommendation system based on filtering by pure content, recommends items similar to those that the user has given a high rating in the past, on the other hand, a recommendation system with pure collaborative filtering identifies users with similar tastes, to recommend to the user the items they liked. A hybrid system can incorporate the advantages of both systems and minimize the disadvantages that each model presents in its pure form. As a preamble to the integration proposals, some application examples of known recommender systems are briefly described, such as Metiorew, FAB, Letizia, PTV, MovieLens, WebWatcher among others, which are systems based on content filtering, collaborative or hybrid. For the test of each of the studied models, the EachMovie Database was used, which is a compilation of movie information, made by the Compaq Research Center, which ran the recommendation service for 18 months, to experiment with the collaborative filtering system. During this time, 72,916 users gave 2,811,983 ratings (numerical ratings) for 1,628 different films (films and videos). This data set is available so that it can be used by researchers in the collaborative filtering area to test their algorithms.eng
dc.description.degreelevelMaestríaspa
dc.description.learningmodalityModalidad Presencialspa
dc.description.sponsorshipInstituto Tecnológico de Estudios Superiores de Monterrey ITESMspa
dc.description.tableofcontentsINTRODUCCIÓN 10 1. CONCEPTOS GENERALES 14 1.1 RECUPERACIÓN DE INFORMACIÓN 14 1.1.1 Efectividad y Eficiencia. 15 1.1.2 Relevancia. 16 1.1.3 Modelos de recuperación de Información. 17 1.1.3.1 Vista lógica o representación de los documentos. 17 1.1.3.2 Evolución de los sistemas de recuperación de información. 18 1.1.3.3 Taxonomía. 19 1.1.3.4 Descripción de un modelo de Recuperación de Información. 22 1.1.3.5 Modelos Teóricos alternativos. 24 1.1.3.6 Modelos Algebraicos alternativos. 25 1.1.3.7 Modelos Probabilísticos alternativos. 27 1.2 FILTRADO DE INFORMACIÓN 29 1.3 SISTEMAS DE RECOMENDACIÓN 31 1.4 DSI. DISEMINACIÓN SELECTIVA DE INFORMACIÓN 33 2. MODELOS DE FILTRADO 35 2.1 FILTRADO BASADO EN CONTENIDO 35 2.2 FILTRADO COLABORATIVO 40 2.2.1 Algoritmos de Filtrado Colaborativo basados en Memoria. 43 pág. 2.2.2 Algoritmos de Filtrado Colaborativo basados en Modelo. 45 2.2.2.1 Redes Bayesianas. 45 2.2.2.2 Agrupamiento o Clustering. 45 2.2.2.3 Aproximación basada en reglas. 46 3. INTEGRACIÓN DE FILTRADO COLABORATIVO Y POR CONTENIDO 47 3.1 VISIÓN GENERAL DE LA INTEGRACIÓN DE FILTRADO 47 COLABORATIVO Y POR CONTENIDO 3.2 UNA ALTERNATIVA DE INTEGRACIÓN. 50 3.2.1 Integración modelo colaborativo y basado en contenido 51 orientado por objetivos. 3.2.1.1 Arquitectura del Modelo. 52 3.2.1.2 Funcionalidad. 53 3.2.2 Uso de información social y basada en contenido para hacer 54 recomendaciones. Recomendación como un problema de clasificación. 3.2.3 Filtrado de información Colaborativo Basado en Contenido, 56 con el uso de agentes cooperativos. 3.3 EJEMPLOS DE SISTEMAS BASADOS EN CONTENIDO, 57 COLABORATIVOS O HÍBRIDOS 4. IMPLEMENTACION DE MODELOS DE INTEGRACION 59 4.1 HERRAMIENTAS UTILIZADAS 59 4.1.1 Base de datos de EachMovie. 59 4.1.2 Java y Oracle. 59 4.2 MÉTRICAS 60 4.3 PROPUESTAS DE INTEGRACIÓN DE MODELOS DE FILTRADO 63 4.3.1 Algoritmo de Filtrado Colaborativo. 63 4.3.2 Algoritmo de Filtrado por Contenido. 63 4.3.3 Modelo híbrido de Recomendación de Información: Filtrado 66 Colaborativo Mejorado por Contenido. 4.3.3.1 Descripción del Sistema. 67 4.3.3.2 Resultados obtenidos. 70 4.3.4 Modelo Combinado para Recomendación de información, usando 72 Filtrado basado en Contenido y Colaborativo. 4.3.4.1 Descripción del sistema. 72 4.3.4.2 Resultados obtenidos. 74 4.3.5 Combinación de Filtrado Basado en Contenido y Colaborativo 76 manteniendo los dos modelos separados. 5. ANÁLISIS DE RESULTADOS 78 6. CONCLUSIONES 85 7. TRABAJO FUTURO 87 8. REFERENCIAS BIBLIOGRÁFICAS 89 BIBLIOGRAFÍA 93 ANEXO A. ALGORITMOSspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.identifier.urihttp://hdl.handle.net/20.500.12749/3331
dc.language.isospaspa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.publisher.programMaestría en Ciencias Computacionalesspa
dc.relation.referencesMonroy Vecino, Olga Lucía (2003). Análisis de la combinación de modelos de filtrado de información. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Instituto Tecnológico y de Estudios Superiores de Monterrey ITESMspa
dc.relation.referencesArmtrong, R., Freitag, D., Joachims, T., and Mitchell, T. WebWatcher: A learning apprentice for the world wide web”. http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-6/web-agent/www/project-home.html 1995.spa
dc.relation.referencesBaeza-Yates, R. and Ribeiro-Neto, B. Modern Information Retrieval. Capítulos 1 al 5. Hatlow, England. Addison Wesley. 1999.spa
dc.relation.referencesBalabanovic, M. and Shoham Y. Fab: Content-Based, Collaborative Recommendation. Communicatios of the ACM, 40(3):66-72. March 1997.spa
dc.relation.referencesBasu, C., Hirsh, H., and Cohen, W. Recommendation as Classification: Using Social and Content-Based Information in Recommendation. http://citeseer.nj.nec.com/basu98recommendation.html 1988.spa
dc.relation.referencesBaudisch, P. Joining Collaborative and Content-based filtering. German National Research Center for Information Technolgy GMD. Darmstadt, Germany. http://www.darmstadt.gmd.de/~baudisch/Publications 1999.spa
dc.relation.referencesBelkin, N.J. and Croft, W. B. Information Filtering and Information Retrieval: Two Sides of the Same Coin. Communicatios of the ACM, 35(12):29-38. December 1992.spa
dc.relation.referencesBradley, K., Rafter, R., and Smyth, B. Case-Based User Profiling for Content Personalisation. http://kermit.ucm.ie/casper/ah2000bradley.ps 2000spa
dc.relation.referencesBreese, J., Heckerman, D., and Kadie, C. Empirical Analysis of Predictive Alforithms for Collaborative Filtering. In Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence. Madison, 1998.spa
dc.relation.referencesBueno, D., Conejo, R., and David, A. METIOREW: An Objective Oriented Content Based and Collaborative Recommending System. http://wwwis.win.tue.nl/ah2001/papers/METIOREW.pdf 2001.spa
dc.relation.referencesClaypool, M., Gokhale, A., Miranda, T., Murnikov, P., Netes, D., and Sartin, M. Combinig Content-Based and Collaborative Filters in an Online Newspaper. http://citeseer.nj.nec.com/claypool99combining.html 1999.spa
dc.relation.referencesCompaq Systems Research Center. EachMovie Collaborative Filtering data set. http://www.research.compaq.com/SCR/eachmovie/ 1.997 – 2001spa
dc.relation.referencesCompendio Tesis y otros Trabajos de Grado. Instituto Colombiano de Normas Técnicas y Certificación (ICONTEC). Bogotá, Colombia. 2002spa
dc.relation.referencesCotter, P. y Smyth, B. PTV: Intelligent personalized tv guides. http://www.cs.ucd.ie/students/pcotter/default.htm In Twelfth Conference on Innovative Applications of Artificial Intelligence, 2000.spa
dc.relation.referencesCotter, P. y Smyth, B. PTV, Personalised Services for Digital TV http://www.ptvplus.com/ptv/home.jsp 2000.spa
dc.relation.referencesDelgado, J., Ishii, N., and Ura, T. Content-based Collaborative Information Filtering: Actively Learning to Classify and Recommend Documents. http://citeseer.nj.nec.com/delgado98intelligent.html 1988.spa
dc.relation.referencesDelgado, J. e Ishii, N. Multi-Agent Learning in Recommender Systems for Informaction Filtering on the Internet. http://www.informatik.uni-trier.de/~ley/db/indices/a-tree/i/Ishii:Naohiro.html 2001.spa
dc.relation.referencesFisher, D., Hildrum, K., Hong, J., Newman, M., Thomas, M. and Vuduc, R. SWAMI: a framework for collaborative filtering algorithm development and evaluation. http://guir.cs.berkeley.edu/projects/swami/swami-paper/paper.htmlspa
dc.relation.referencesGokhale, Anuja. Improvements to Collaborative Filtering Algorithms. Worcester Polytechnic Institute. http://www.cs.wpi.edu/~claypool/ms/cf-improve/cf-improve.ps 1999.spa
dc.relation.referencesGoldberg, D., Nichols, D., Oki, B. M., and Terry, D. Using Collaborative Filtering to weave an Information Tapestry. Communicatios of the ACM, 35(12):61-70. December 1992.spa
dc.relation.referencesGood, N., Schafer, J., Konstan, J., Borchers, A., Sarwar, B., Herlocker, J. And Riedl, J. Movielens: Helping you find the right movies. http://www.movielens.umn.edu/ 1999spa
dc.relation.referencesHerlocker, J., Konstan, J., Borchers, A. and Riedl, J. An algorithmic framework for performing collaborative filtering. In SIGIR’99: Proceedings of the 22nd Anual International ACM SIGIR Conference on Research and Development in Information Retrieval. 1999spa
dc.relation.references-------- Explaining Collaborative Filtering Recommendations. http://cs.oregonstate.edu/~herlock/papers/explanations_cscw2000.pdf 2000.spa
dc.relation.referencesJirón, M. y Olivares, L. DSI Escolar: Un timón para no naufragar en internet. http://www.bibliotecarios.cl/conferencia/documentos/jiron.pdfspa
dc.relation.referencesLieberman, H. Letizia: An Agent that Assists Web Browsing. http://lieber.www.media.mit.edu/people/lieber/Lieberary/Letizia/Letizia-AAAI/Letizia.ps 1995spa
dc.relation.referencesMaes, P.Agents that Reduce Work and Information Overload. Communication of the ACM, 37 (7):30-40. July 1994.spa
dc.relation.referencesMelville, P., Mooney, R., Nagarajan, R. Content-Boosted Collaborative Filtering. In Proceedings of the SIGIR-2001 Workshop on Recommender Systems, New Orleans, LA, 2001.spa
dc.relation.referencesPapadimitriou, C., Ragharan, P., Tamaki, H. and Vempala, S. Latente Semantic Indexing: A probabilistic Analysis. http://citeseer.nj.nec.com/papadimitriou98latent.html 1.997.spa
dc.relation.referencesPazzani, M., Muramatzu, J., and Billsus, D. Syskill & Webert: Identifying interesting web sites. http://www.ics.uci.edu/~pazzani/Publications/aaai-webert.pdf 1996.spa
dc.relation.referencesPolcicová, G. and Návrat, P. Combining Content-based and Collaborative Filtering. Slovak University of Technology, Department of Computer Science and Engineering, Bratislava, Slovakia. http://www.dcs.elf.stuba.sk 2000.spa
dc.relation.referencesPorter, M. The Porter Stemming Algorithm. http://www.tartarus.org/~martin/PorterStemmer/spa
dc.relation.referencesResnick, P., Varian, H.R., and Guest Editors. Recommender Systems. Communicatios of the ACM, 40(3):56-58. March 1997.spa
dc.relation.referencesSánchez Pereira, A. La Diseminación Selectiva de Información a través de Internet. Dirección General de Bibliotecas de la Universidad Nacional Autónoma de México. http://dgbiblio.unam.mxspa
dc.relation.referencesSarwar, B., Karypis, G., Konstant, J., and Riedl, J. Analysis of Recommendation Algorithms for E-Commerce. In Proceedings of the ACM EC’00 Conference. Minneapolis, MN. 2000spa
dc.relation.references-------- Item-based Collaborative Filtering Recommendation Algorithms. In WWW10 Conference. May, 2001spa
dc.relation.referencesSarwar, B., Konstan, J., Borchers, A., Herlocker, J., Miller, B. y Riedl, J.. Using Filtering Agents to Improve Prediction Quality in the GroupLens Research Collaborative Filtering System. http://www.cs.umn.edu/Research/GroupLens/papers/pdf/filterbot-CSCW98.pdf Copyrigth ACM 1998.spa
dc.relation.referencesSoboroff, I. y Nicholas, C. Combining content and collaboration in text filtering. http://citeseer.nj.nec.com/soboroff99combining.html 1.999.spa
dc.relation.referencesVan Metern, R. and Van Someren, M. Using Content-Based Filtering for Recommendation. http://www.ics.forth.gr/~potamias/mlnia/paper_6.pdfspa
dc.relation.referencesVan Rijsbergen, C. J. Information Retrieval. Computing Science. Computing Science University of Glasgow. http://www.dcs.gla.ac.uk/Keith/Chapter.1/ch.1.html 1979.spa
dc.relation.referencesVel, O., and Nesbitt, S. A Collaborative filtering Agent System for Dynamic Virtual Communities on the web. http://citeseer.nj.nec.com/de-collaborative.html 1997spa
dc.relation.referencesWang, P. Java. Con programación orientada a objetos y aplicaciones en la WWW. International Thomson Editores. 2000. Pág. 2-9spa
dc.relation.referencesWise, J., Thomas, J., Pennock, K., Lantip, D., Pottier, M., Schur, A., and Crow, V. Visualizing the non-visual: spatial analysis and interaccion with information from text documents. Pacific Northwest Lab, Richland, WA. 1.995spa
dc.relation.referencesZazo Rodríguez, A, Figuerola, P., Alonso, J., y Gómez, R. Recuperación de información utilizando el modelo vectorial. Participación en el taller CLEF-2001. Informe Técnico. http://tejo.usal.es/inftec/2002/DPTOIA-IT-2002-006.pdf 2002spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.subject.keywordsInformation retrievaleng
dc.subject.keywordsSelective dissemination of informationeng
dc.subject.keywordsInformation storage systemseng
dc.subject.keywordsInformation retrieval systemseng
dc.subject.keywordsSearch strategieseng
dc.subject.keywordsSystems engineeringeng
dc.subject.keywordsComputer scienceeng
dc.subject.keywordsInvestigationseng
dc.subject.keywordsAnalysiseng
dc.subject.keywordsInformation overloadeng
dc.subject.keywordsContent-based filtering (Cognitive)eng
dc.subject.keywordsCollaborative filtering (Social)eng
dc.subject.lembRecuperación de informaciónspa
dc.subject.lembDiseminación selectiva de la informaciónspa
dc.subject.lembSistemas de almacenamiento de informaciónspa
dc.subject.lembSistemas de recuperación de informaciónspa
dc.subject.lembEstrategias de búsquedaspa
dc.subject.lembIngeniería de sistemasspa
dc.subject.lembCiencias computacionalesspa
dc.subject.lembInvestigacionesspa
dc.subject.lembAnálisisspa
dc.subject.proposalSobrecarga de información
dc.subject.proposalFiltrado de basado en contenido (Cognitivo)
dc.subject.proposalFiltrado colaborativo (Social)
dc.subject.proposalEachMovie
dc.titleAnálisis de la combinación de modelos de filtrado de informaciónspa
dc.title.translatedAnalysis of the combination of information filtering modelseng
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.type.localTesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TM

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf
Tamaño:
747.05 KB
Formato:
Adobe Portable Document Format
Descripción:
Tesis