Análisis de la combinación de modelos de filtrado de información
| dc.contributor.advisor | Pérez Alcázar, José de Jesús | spa |
| dc.contributor.author | Monroy Vecino, Olga Lucía | spa |
| dc.contributor.corporatename | Instituto Tecnológico de Estudios Superiores de Monterrey (ITESM) | spa |
| dc.contributor.cvlac | https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000274038 | * |
| dc.contributor.researchgroup | Grupo de Investigación Tecnologías de Información - GTI | spa |
| dc.contributor.researchgroup | Grupo de Investigaciones Clínicas | spa |
| dc.coverage | Bucaramanga (Colombia) | spa |
| dc.coverage.campus | UNAB Campus Bucaramanga | spa |
| dc.date.accessioned | 2020-06-26T21:32:20Z | |
| dc.date.available | 2020-06-26T21:32:20Z | |
| dc.date.issued | 2003-06-03 | |
| dc.degree.name | Magíster en Ciencias Computacionales | spa |
| dc.description.abstract | El tema de la sobrecarga de información se ha discutido ampliamente en la literatura referente a la administración y recuperación de información, pero aun sigue siendo un problema sin resolver. La información para cada usuario llega de muy diversas fuentes y representa más datos de los que una persona normal puede manejar. Aplicaciones más recientes emplean tecnologías como el filtrado colaborativo automático o la representación y evaluación de documentos, mediante diversos métodos automatizados, para ayudarle a los usuarios en sus tareas de recepción y análisis de información. Se parte de conceptos básicos de Recuperación de Información como antesala a la tarea de Filtrado de Información y de sistemas que permiten, además de responder a una consulta de un usuario, recomendarle un conjunto de ítems que también pueden ser de su interés, que es lo que se conoce como Sistemas de Recomendación. Los modelos utilizados para el filtrado de información: Filtrado de Basado en Contenido (Cognitivo) y el Filtrado Colaborativo (Social), se estudian en forma separada y posteriormente se integran en las propuestas que buscan minimizar las debilidades de cada modelo. Un sistema de recomendación basado en filtrado por contenido puro, recomienda ítems similares a aquellos que el usuario ha dado una alta calificación en el pasado, en cambio, un sistema de recomendación con filtrado colaborativo puro identifica los usuarios con gustos similares, para recomendarle al usuario los ítems que a ellos les han gustado. Un sistema híbrido puede incorporar las ventajas de ambos sistemas y minimizar las desventajas que presenta cada modelo en su forma pura. Como preámbulo a las propuestas de integración, se describen brevemente algunos ejemplos de aplicación, de sistemas de recomendación conocidos, como Metiorew, FAB, Letizia, PTV, MovieLens, WebWatcher entre otros, que son sistemas basados en filtrado por contenido, colaborativo o híbridos. Para la prueba de cada uno de los modelos estudiados, se utilizó la Base de datos de EachMovie, que es una recopilación de información de películas, realizada por el Centro de Investigación de Compaq, que ejecutó el servicio de recomendación por espacio de 18 meses, para experimentar con el sistema de filtrado colaborativo. Durante este tiempo, 72.916 usuarios dieron 2’811.983 calificaciones (ratings numéricos) para 1.628 películas diferentes (filmes y videos). Este conjunto de datos está disponible para que pueda ser usado por investigadores en el área de filtrado colaborativo, para probar sus algoritmos. | spa |
| dc.description.abstractenglish | The topic of information overload has been widely discussed in the information management and retrieval literature, but it still remains an unsolved problem. The information for each user comes from many different sources and represents more data than a normal person can handle. Newer applications employ technologies such as automatic collaborative filtering or document rendering and evaluation, using various automated methods, to assist users in their information reception and analysis tasks. It starts from the basic concepts of Information Retrieval as a prelude to the task of Filtering Information and systems that allow, in addition to responding to a query from a user, recommending a set of items that may also be of interest to you, which is what known as Recommendation Systems. The models used for information filtering: Content-Based Filtering (Cognitive) and Collaborative Filtering (Social), are studied separately and later integrated into the proposals that seek to minimize the weaknesses of each model. A recommendation system based on filtering by pure content, recommends items similar to those that the user has given a high rating in the past, on the other hand, a recommendation system with pure collaborative filtering identifies users with similar tastes, to recommend to the user the items they liked. A hybrid system can incorporate the advantages of both systems and minimize the disadvantages that each model presents in its pure form. As a preamble to the integration proposals, some application examples of known recommender systems are briefly described, such as Metiorew, FAB, Letizia, PTV, MovieLens, WebWatcher among others, which are systems based on content filtering, collaborative or hybrid. For the test of each of the studied models, the EachMovie Database was used, which is a compilation of movie information, made by the Compaq Research Center, which ran the recommendation service for 18 months, to experiment with the collaborative filtering system. During this time, 72,916 users gave 2,811,983 ratings (numerical ratings) for 1,628 different films (films and videos). This data set is available so that it can be used by researchers in the collaborative filtering area to test their algorithms. | eng |
| dc.description.degreelevel | Maestría | spa |
| dc.description.learningmodality | Modalidad Presencial | spa |
| dc.description.sponsorship | Instituto Tecnológico de Estudios Superiores de Monterrey ITESM | spa |
| dc.description.tableofcontents | INTRODUCCIÓN 10 1. CONCEPTOS GENERALES 14 1.1 RECUPERACIÓN DE INFORMACIÓN 14 1.1.1 Efectividad y Eficiencia. 15 1.1.2 Relevancia. 16 1.1.3 Modelos de recuperación de Información. 17 1.1.3.1 Vista lógica o representación de los documentos. 17 1.1.3.2 Evolución de los sistemas de recuperación de información. 18 1.1.3.3 Taxonomía. 19 1.1.3.4 Descripción de un modelo de Recuperación de Información. 22 1.1.3.5 Modelos Teóricos alternativos. 24 1.1.3.6 Modelos Algebraicos alternativos. 25 1.1.3.7 Modelos Probabilísticos alternativos. 27 1.2 FILTRADO DE INFORMACIÓN 29 1.3 SISTEMAS DE RECOMENDACIÓN 31 1.4 DSI. DISEMINACIÓN SELECTIVA DE INFORMACIÓN 33 2. MODELOS DE FILTRADO 35 2.1 FILTRADO BASADO EN CONTENIDO 35 2.2 FILTRADO COLABORATIVO 40 2.2.1 Algoritmos de Filtrado Colaborativo basados en Memoria. 43 pág. 2.2.2 Algoritmos de Filtrado Colaborativo basados en Modelo. 45 2.2.2.1 Redes Bayesianas. 45 2.2.2.2 Agrupamiento o Clustering. 45 2.2.2.3 Aproximación basada en reglas. 46 3. INTEGRACIÓN DE FILTRADO COLABORATIVO Y POR CONTENIDO 47 3.1 VISIÓN GENERAL DE LA INTEGRACIÓN DE FILTRADO 47 COLABORATIVO Y POR CONTENIDO 3.2 UNA ALTERNATIVA DE INTEGRACIÓN. 50 3.2.1 Integración modelo colaborativo y basado en contenido 51 orientado por objetivos. 3.2.1.1 Arquitectura del Modelo. 52 3.2.1.2 Funcionalidad. 53 3.2.2 Uso de información social y basada en contenido para hacer 54 recomendaciones. Recomendación como un problema de clasificación. 3.2.3 Filtrado de información Colaborativo Basado en Contenido, 56 con el uso de agentes cooperativos. 3.3 EJEMPLOS DE SISTEMAS BASADOS EN CONTENIDO, 57 COLABORATIVOS O HÍBRIDOS 4. IMPLEMENTACION DE MODELOS DE INTEGRACION 59 4.1 HERRAMIENTAS UTILIZADAS 59 4.1.1 Base de datos de EachMovie. 59 4.1.2 Java y Oracle. 59 4.2 MÉTRICAS 60 4.3 PROPUESTAS DE INTEGRACIÓN DE MODELOS DE FILTRADO 63 4.3.1 Algoritmo de Filtrado Colaborativo. 63 4.3.2 Algoritmo de Filtrado por Contenido. 63 4.3.3 Modelo híbrido de Recomendación de Información: Filtrado 66 Colaborativo Mejorado por Contenido. 4.3.3.1 Descripción del Sistema. 67 4.3.3.2 Resultados obtenidos. 70 4.3.4 Modelo Combinado para Recomendación de información, usando 72 Filtrado basado en Contenido y Colaborativo. 4.3.4.1 Descripción del sistema. 72 4.3.4.2 Resultados obtenidos. 74 4.3.5 Combinación de Filtrado Basado en Contenido y Colaborativo 76 manteniendo los dos modelos separados. 5. ANÁLISIS DE RESULTADOS 78 6. CONCLUSIONES 85 7. TRABAJO FUTURO 87 8. REFERENCIAS BIBLIOGRÁFICAS 89 BIBLIOGRAFÍA 93 ANEXO A. ALGORITMOS | spa |
| dc.format.mimetype | application/pdf | spa |
| dc.identifier.instname | instname:Universidad Autónoma de Bucaramanga - UNAB | spa |
| dc.identifier.reponame | reponame:Repositorio Institucional UNAB | spa |
| dc.identifier.uri | http://hdl.handle.net/20.500.12749/3331 | |
| dc.language.iso | spa | spa |
| dc.publisher.faculty | Facultad Ingeniería | spa |
| dc.publisher.grantor | Universidad Autónoma de Bucaramanga UNAB | spa |
| dc.publisher.program | Maestría en Ciencias Computacionales | spa |
| dc.relation.references | Monroy Vecino, Olga Lucía (2003). Análisis de la combinación de modelos de filtrado de información. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Instituto Tecnológico y de Estudios Superiores de Monterrey ITESM | spa |
| dc.relation.references | Armtrong, R., Freitag, D., Joachims, T., and Mitchell, T. WebWatcher: A learning apprentice for the world wide web”. http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-6/web-agent/www/project-home.html 1995. | spa |
| dc.relation.references | Baeza-Yates, R. and Ribeiro-Neto, B. Modern Information Retrieval. Capítulos 1 al 5. Hatlow, England. Addison Wesley. 1999. | spa |
| dc.relation.references | Balabanovic, M. and Shoham Y. Fab: Content-Based, Collaborative Recommendation. Communicatios of the ACM, 40(3):66-72. March 1997. | spa |
| dc.relation.references | Basu, C., Hirsh, H., and Cohen, W. Recommendation as Classification: Using Social and Content-Based Information in Recommendation. http://citeseer.nj.nec.com/basu98recommendation.html 1988. | spa |
| dc.relation.references | Baudisch, P. Joining Collaborative and Content-based filtering. German National Research Center for Information Technolgy GMD. Darmstadt, Germany. http://www.darmstadt.gmd.de/~baudisch/Publications 1999. | spa |
| dc.relation.references | Belkin, N.J. and Croft, W. B. Information Filtering and Information Retrieval: Two Sides of the Same Coin. Communicatios of the ACM, 35(12):29-38. December 1992. | spa |
| dc.relation.references | Bradley, K., Rafter, R., and Smyth, B. Case-Based User Profiling for Content Personalisation. http://kermit.ucm.ie/casper/ah2000bradley.ps 2000 | spa |
| dc.relation.references | Breese, J., Heckerman, D., and Kadie, C. Empirical Analysis of Predictive Alforithms for Collaborative Filtering. In Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence. Madison, 1998. | spa |
| dc.relation.references | Bueno, D., Conejo, R., and David, A. METIOREW: An Objective Oriented Content Based and Collaborative Recommending System. http://wwwis.win.tue.nl/ah2001/papers/METIOREW.pdf 2001. | spa |
| dc.relation.references | Claypool, M., Gokhale, A., Miranda, T., Murnikov, P., Netes, D., and Sartin, M. Combinig Content-Based and Collaborative Filters in an Online Newspaper. http://citeseer.nj.nec.com/claypool99combining.html 1999. | spa |
| dc.relation.references | Compaq Systems Research Center. EachMovie Collaborative Filtering data set. http://www.research.compaq.com/SCR/eachmovie/ 1.997 – 2001 | spa |
| dc.relation.references | Compendio Tesis y otros Trabajos de Grado. Instituto Colombiano de Normas Técnicas y Certificación (ICONTEC). Bogotá, Colombia. 2002 | spa |
| dc.relation.references | Cotter, P. y Smyth, B. PTV: Intelligent personalized tv guides. http://www.cs.ucd.ie/students/pcotter/default.htm In Twelfth Conference on Innovative Applications of Artificial Intelligence, 2000. | spa |
| dc.relation.references | Cotter, P. y Smyth, B. PTV, Personalised Services for Digital TV http://www.ptvplus.com/ptv/home.jsp 2000. | spa |
| dc.relation.references | Delgado, J., Ishii, N., and Ura, T. Content-based Collaborative Information Filtering: Actively Learning to Classify and Recommend Documents. http://citeseer.nj.nec.com/delgado98intelligent.html 1988. | spa |
| dc.relation.references | Delgado, J. e Ishii, N. Multi-Agent Learning in Recommender Systems for Informaction Filtering on the Internet. http://www.informatik.uni-trier.de/~ley/db/indices/a-tree/i/Ishii:Naohiro.html 2001. | spa |
| dc.relation.references | Fisher, D., Hildrum, K., Hong, J., Newman, M., Thomas, M. and Vuduc, R. SWAMI: a framework for collaborative filtering algorithm development and evaluation. http://guir.cs.berkeley.edu/projects/swami/swami-paper/paper.html | spa |
| dc.relation.references | Gokhale, Anuja. Improvements to Collaborative Filtering Algorithms. Worcester Polytechnic Institute. http://www.cs.wpi.edu/~claypool/ms/cf-improve/cf-improve.ps 1999. | spa |
| dc.relation.references | Goldberg, D., Nichols, D., Oki, B. M., and Terry, D. Using Collaborative Filtering to weave an Information Tapestry. Communicatios of the ACM, 35(12):61-70. December 1992. | spa |
| dc.relation.references | Good, N., Schafer, J., Konstan, J., Borchers, A., Sarwar, B., Herlocker, J. And Riedl, J. Movielens: Helping you find the right movies. http://www.movielens.umn.edu/ 1999 | spa |
| dc.relation.references | Herlocker, J., Konstan, J., Borchers, A. and Riedl, J. An algorithmic framework for performing collaborative filtering. In SIGIR’99: Proceedings of the 22nd Anual International ACM SIGIR Conference on Research and Development in Information Retrieval. 1999 | spa |
| dc.relation.references | -------- Explaining Collaborative Filtering Recommendations. http://cs.oregonstate.edu/~herlock/papers/explanations_cscw2000.pdf 2000. | spa |
| dc.relation.references | Jirón, M. y Olivares, L. DSI Escolar: Un timón para no naufragar en internet. http://www.bibliotecarios.cl/conferencia/documentos/jiron.pdf | spa |
| dc.relation.references | Lieberman, H. Letizia: An Agent that Assists Web Browsing. http://lieber.www.media.mit.edu/people/lieber/Lieberary/Letizia/Letizia-AAAI/Letizia.ps 1995 | spa |
| dc.relation.references | Maes, P.Agents that Reduce Work and Information Overload. Communication of the ACM, 37 (7):30-40. July 1994. | spa |
| dc.relation.references | Melville, P., Mooney, R., Nagarajan, R. Content-Boosted Collaborative Filtering. In Proceedings of the SIGIR-2001 Workshop on Recommender Systems, New Orleans, LA, 2001. | spa |
| dc.relation.references | Papadimitriou, C., Ragharan, P., Tamaki, H. and Vempala, S. Latente Semantic Indexing: A probabilistic Analysis. http://citeseer.nj.nec.com/papadimitriou98latent.html 1.997. | spa |
| dc.relation.references | Pazzani, M., Muramatzu, J., and Billsus, D. Syskill & Webert: Identifying interesting web sites. http://www.ics.uci.edu/~pazzani/Publications/aaai-webert.pdf 1996. | spa |
| dc.relation.references | Polcicová, G. and Návrat, P. Combining Content-based and Collaborative Filtering. Slovak University of Technology, Department of Computer Science and Engineering, Bratislava, Slovakia. http://www.dcs.elf.stuba.sk 2000. | spa |
| dc.relation.references | Porter, M. The Porter Stemming Algorithm. http://www.tartarus.org/~martin/PorterStemmer/ | spa |
| dc.relation.references | Resnick, P., Varian, H.R., and Guest Editors. Recommender Systems. Communicatios of the ACM, 40(3):56-58. March 1997. | spa |
| dc.relation.references | Sánchez Pereira, A. La Diseminación Selectiva de Información a través de Internet. Dirección General de Bibliotecas de la Universidad Nacional Autónoma de México. http://dgbiblio.unam.mx | spa |
| dc.relation.references | Sarwar, B., Karypis, G., Konstant, J., and Riedl, J. Analysis of Recommendation Algorithms for E-Commerce. In Proceedings of the ACM EC’00 Conference. Minneapolis, MN. 2000 | spa |
| dc.relation.references | -------- Item-based Collaborative Filtering Recommendation Algorithms. In WWW10 Conference. May, 2001 | spa |
| dc.relation.references | Sarwar, B., Konstan, J., Borchers, A., Herlocker, J., Miller, B. y Riedl, J.. Using Filtering Agents to Improve Prediction Quality in the GroupLens Research Collaborative Filtering System. http://www.cs.umn.edu/Research/GroupLens/papers/pdf/filterbot-CSCW98.pdf Copyrigth ACM 1998. | spa |
| dc.relation.references | Soboroff, I. y Nicholas, C. Combining content and collaboration in text filtering. http://citeseer.nj.nec.com/soboroff99combining.html 1.999. | spa |
| dc.relation.references | Van Metern, R. and Van Someren, M. Using Content-Based Filtering for Recommendation. http://www.ics.forth.gr/~potamias/mlnia/paper_6.pdf | spa |
| dc.relation.references | Van Rijsbergen, C. J. Information Retrieval. Computing Science. Computing Science University of Glasgow. http://www.dcs.gla.ac.uk/Keith/Chapter.1/ch.1.html 1979. | spa |
| dc.relation.references | Vel, O., and Nesbitt, S. A Collaborative filtering Agent System for Dynamic Virtual Communities on the web. http://citeseer.nj.nec.com/de-collaborative.html 1997 | spa |
| dc.relation.references | Wang, P. Java. Con programación orientada a objetos y aplicaciones en la WWW. International Thomson Editores. 2000. Pág. 2-9 | spa |
| dc.relation.references | Wise, J., Thomas, J., Pennock, K., Lantip, D., Pottier, M., Schur, A., and Crow, V. Visualizing the non-visual: spatial analysis and interaccion with information from text documents. Pacific Northwest Lab, Richland, WA. 1.995 | spa |
| dc.relation.references | Zazo Rodríguez, A, Figuerola, P., Alonso, J., y Gómez, R. Recuperación de información utilizando el modelo vectorial. Participación en el taller CLEF-2001. Informe Técnico. http://tejo.usal.es/inftec/2002/DPTOIA-IT-2002-006.pdf 2002 | spa |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
| dc.rights.accessrights | http://purl.org/coar/access_right/c_abf2 | spa |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 2.5 Colombia | * |
| dc.rights.local | Abierto (Texto Completo) | spa |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/co/ | * |
| dc.subject.keywords | Information retrieval | eng |
| dc.subject.keywords | Selective dissemination of information | eng |
| dc.subject.keywords | Information storage systems | eng |
| dc.subject.keywords | Information retrieval systems | eng |
| dc.subject.keywords | Search strategies | eng |
| dc.subject.keywords | Systems engineering | eng |
| dc.subject.keywords | Computer science | eng |
| dc.subject.keywords | Investigations | eng |
| dc.subject.keywords | Analysis | eng |
| dc.subject.keywords | Information overload | eng |
| dc.subject.keywords | Content-based filtering (Cognitive) | eng |
| dc.subject.keywords | Collaborative filtering (Social) | eng |
| dc.subject.lemb | Recuperación de información | spa |
| dc.subject.lemb | Diseminación selectiva de la información | spa |
| dc.subject.lemb | Sistemas de almacenamiento de información | spa |
| dc.subject.lemb | Sistemas de recuperación de información | spa |
| dc.subject.lemb | Estrategias de búsqueda | spa |
| dc.subject.lemb | Ingeniería de sistemas | spa |
| dc.subject.lemb | Ciencias computacionales | spa |
| dc.subject.lemb | Investigaciones | spa |
| dc.subject.lemb | Análisis | spa |
| dc.subject.proposal | Sobrecarga de información | |
| dc.subject.proposal | Filtrado de basado en contenido (Cognitivo) | |
| dc.subject.proposal | Filtrado colaborativo (Social) | |
| dc.subject.proposal | EachMovie | |
| dc.title | Análisis de la combinación de modelos de filtrado de información | spa |
| dc.title.translated | Analysis of the combination of information filtering models | eng |
| dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
| dc.type.driver | info:eu-repo/semantics/masterThesis | |
| dc.type.hasversion | info:eu-repo/semantics/acceptedVersion | |
| dc.type.local | Tesis | spa |
| dc.type.redcol | http://purl.org/redcol/resource_type/TM |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- 2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf
- Tamaño:
- 747.05 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Tesis
