Estudio e implementación del modelo semántico latente para la recuperación de información

dc.contributor.advisorPérez Alcázar, José de Jesús
dc.contributor.authorBetancur Estevéz, Freddy Alonso
dc.coverage.campusUNAB Campus Bucaramangaspa
dc.coverage.spatialBucaramanga (Santander, Colombia)spa
dc.date.accessioned2024-08-21T16:50:14Z
dc.date.available2024-08-21T16:50:14Z
dc.date.issued2003-05-29
dc.degree.nameIngeniero de Sistemasspa
dc.description.abstractLas personas disponen de una gran cantidad de información, pero de pocos medios que le faciliten clasificarla y encontrar exactamente lo que necesitan, debido a la gran cantidad de información anexada diariamente en diferentes medios informáticos, generando una sobrecarga de información. El término Recuperación de Información surge con la introducción de la Ciencia de información como ciencia integradora de la teoría, proceso y práctica documental, con otras ciencias complementarias como la cibernética, la informática, la teoría de la información y la comunicación, etc. Se ha usado diversa terminología para referirse al área de estudio que envuelve el concepto de recuperación de información: informática documental, tecnologías de la información, documentación automática/ documática.spa
dc.description.abstractenglishPeople have a large amount of information, but few means to help them classify it and find exactly what they need, due to the large amount of information added daily to different computer media, generating an information overload. The term Information Retrieval arose with the introduction of Information Science as an integrative science of documentary theory, process and practice, with other complementary sciences such as cybernetics, computer science, information and communication theory, etc. Various terminology has been used to refer to the area of ​​study that involves the concept of information retrieval: documentary computing, information technologies, automatic documentation/documentation.spa
dc.description.degreelevelPregradospa
dc.description.learningmodalityModalidad Presencialspa
dc.description.tableofcontentsIntroducción........................................................................................................................................................................................ 1 generalidades........................................................................................................................................................................................ 17 1.1 definiciones........................................................................................................................................................................................ 17 1.1.1 documento estructurado............................................................................................................................................................... 17 1.1.2 documento de texto completo.......................................................................................................................................... 17 1.1.3 palabra clave................................................................................................................................................................................... 17 1.2 recuperación de información........................................................................................................................................................... 17 1.3 vista lógica del documento............................................................................................................................................................ 19 2 representación acción del documento .......................................................................................................................................... 21 2.1 selección de términos ........................................................................................................................................................................21 2.2 estructura de almacenamiento de datos...................................................................................................................................... 21 2.1.1 listas o archivos invertidos.......................................................................................................................................................... 22 3 modelos de recuperación de información....................................................................................................................................... 23 3.1 modelo vectorial ...............................................................................................................................................................................24 3.2 modelo booleano.............................................................................................................................................................................. 26 3.3 modelo de redes neuronales......................................................................................................................................................... 26 4 modelo de indexación semántico latente.......................................................................................................................................... 28 Para la recuperación de información...................................................................................................................................................... 4.1 la transformada svd..................................................................................................................................................................... 28 4.2. La definición de la terminología básica es...........................................................................................................................29 4.3 método de evaluación de los modelos implementados.............................................................................................................. 31 4.3.1 diagramas recall & precisión no interpolada.......................................................................................................................... 33 4.3.2 diagrama recall & precisión interpolada..................................................................................................................................... 34 5 estudio e implementación del modelo semántico .......................................................................................................................37 Iatente para i a recuperación de información....................................................................................................................................... 5.1 captura de requerimientos........................................................................................................................................................... 37 5.1.1 casos de uso................................................................................................................................................................................ 37 5.1.1.1 actor........................................................................................................................................................................................ 37 5.1.1.2 flujo de eventos ......................................................................................................................................................................37 5.1.1.3 comunica................................................................................................................................................................................. 37 5.1.1.4 usa........................................................................................................................................................................................ 37 5.1.1.5 extiende ...................................................................................................................................................................................37 5.1.2 casos de uso para la recuperación de información ...........................................................................................................37 5.2 análisis........................................................................................................................................................................................ 38 5.2.1 diagrama de clases................................................................................................................................................................. 38 5.2.2 diagrama de clases para el prototipo de recuperación de Información.........................................................................38 5.2.2.1 diccionario de datos para el prototipo de recuperación de Información..................................................................38 5.2.3 diagramas de interacción ........................................................................................................................................................38 5.2.3.1 diagramas de secuencia .......................................................................................................................................................38 5.2.3.2 diagramas de colaboración ..................................................................................................................................................41 5.2.4 diagramas de secuencia y colaboración para el prototipo de Recuperación de información..............................................42 5.2.5 diagramas de actividades............................................................................................................................................................ 43 5.2.6 diagramas de actividades y sus descripciones para el prototipo de Recuperación de información.............................. 43 5.2.7 diagrama de estados................................................................................................................................................................... 44 5.2.8 diagramas de estados para el prototipo de recuperación de Información............................................................................44 5.2.9 clases-responsabilidades-colaboraciones............................................................................................................................ 45 5.2.9.1 clase ........................................................................................................................................................................................45 5.2.9.2 responsabilidad..................................................................................................................................................................... 45 5.2.9 3 colaboración.......................................................................................................................................................................... 45 5.2.9.4 tarjetas crc................................................................................................................................................................................ 45 5.2.10 tarjetas crc para el prototipo de recuperación de información............................................................................................ 45 5 3 diseño ..........................................................................................................................................................................................47 5.3.1.1 clase frontera ..........................................................................................................................................................................47 5.3.1.2 clase entidad .............................................................................................................................................................................47 5.3.1.3 clase control ..........................................................................................................................................................................48 5.3.2 descripción procedimental de objetos...................................................................................................................................... 48 5.4 desarrollo del modelo .................................................................................................................................................................48 5.4.1 utilización de la base de datos trec ..........................................................................................................................................49 5.4.2 realización del modelo semántico latente.............................................................................................................................. 50 5.4.3 uso de la técnica svd................................................................................................................................................................... 50 5.4.4 recuperación de información utilizando el modelo de vector espacial ..............................................................................51 5.5 resultados de la comparación de los modelos ya Implementados ............................................................................................52 6 conclusiones........................................................................................................................................................................................ 57 7 sugerencias para trabajos futuros..................................................................................................................................................... 59 Bibliografía................................................................................................................................................................................................. 60 Anexos...................................................................................................................................................................................................... 63spa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.identifier.repourlrepourl:https://repository.unab.edu.cospa
dc.identifier.urihttp://hdl.handle.net/20.500.12749/26128
dc.language.isospaspa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.publisher.programPregrado Ingeniería de Sistemasspa
dc.relation.referenceshttp://www.informaticamilenium.com.mx/paginas/espanol/posicionainiento.htm.spa
dc.relation.referencesBAEZA YATES, R. and RIBEIRO NETO, Berthier A Modern Information Retrieval. Maryland: Addison Wesley Longman Publishing co, 1999.spa
dc.relation.referencesINTRODUCCIÓN A LOS SISTFMAS DE RECUPERACIÓN DE INFORMACIÓN. <Http://www. um.es/gtiweb/fjmm/sarisite/tema1.html>.spa
dc.relation.referencesBAEZA YATES, Ricardo Y RIBEIRO NETO, Rerthier. Modern Information Retrieval. Addison Wesley ACM Press. 1992.spa
dc.relation.referencesMUI ORES DE BUSQUEDA. ABRIL, 2002.spa
dc.relation.referencesOARD W, Douglas. A conceptual Framework for Text Filtering. University of Maryland, College Park, Mayo, 1996. http.7/www.enee.umd.edu/medlab/filter/filter.htmlspa
dc.relation.referencesBAEZA YATES, Ricardo Y RIBEIRO NETO, Rerthier. Modern Information Retrieval. Addisson Wesley ACM Press. 1992.spa
dc.relation.referencesMEADOW, Charles T. Text Information Retrieval Systems. Academic Press, 1992spa
dc.relation.referencesVAN RIJSBERGEN, C. J. Information retrieval. Butterworths, 1979. 45pspa
dc.relation.referencesVAN RIJSBERGEN, C. J. Information retrieval. Butterworths, 1979. 122pspa
dc.relation.referencesYANG, Yiming y PEDERSEN, Jan O. A comparative study on features selection ¡n text categorization. School of Computer Science, Carnegie Mellón University, 1997.spa
dc.relation.referenceshttp://www.dia.fi.upm.es/' agarcia/lenguajenatural/131201-1.pdfspa
dc.relation.referencesWIENER, Erik D. et al. A Neural Network Approach to Topic Spotting. En Fourth Annual Symposium on Document Analysis and Information Retrieval (SDAIR'95). 1995, Las Vegas. 1995. p.317-332. http://www.stern.nyu.edu/~aweigend/Research/Papers/TextCategorizationspa
dc.relation.referencesBAEZA YATES, Ricardo Y RIBEIRO NETO, Rerthier Modor Information Retrieval. Pág 44 - 45spa
dc.relation.referencesSANTO ORCERO, DAVID. The fundamental matrix and the essential matrix: concepts and applications. 2002spa
dc.relation.referencesSCOTT DEERWESTER, SUSAN T. DOMAIS, GEORGE W. FIJRNAS, THOMAS K. LAUNDAUER, RICHARD HARSHMAN. Indexing by Latent Semantic Analysis. Pág 11.spa
dc.relation.referencesBAEZA YATES, Ricardo Y RIBEIRO NETO, Moder Information Retrieval. Pág 27- 30spa
dc.relation.referenceshttp://trec.nist.gov/overview.htmlgspa
dc.relation.referencesBAEZA YATES, Ricardo Y RIBEIRO NETO, Moder Information Retrieval Pág 76 y ssspa
dc.relation.referencesBOOCH, Grady, JACOBSON, Ivar RUMBAUGH, James. The Unified Modeling Languaje. Addison Wesley Longman Inc. Rational Software Corporation. 1999.spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.subject.keywordsSystems engineerspa
dc.subject.keywordsTechnological innovationsspa
dc.subject.keywordsVector modelspa
dc.subject.keywordsNeural networksspa
dc.subject.keywordsTerminologyspa
dc.subject.keywordsSemantic modelspa
dc.subject.keywordsInformation retrievalspa
dc.subject.keywordsInformation sciencespa
dc.subject.keywordsInformation technologyspa
dc.subject.lembIngeniería de sistemasspa
dc.subject.lembInnovaciones tecnológicasspa
dc.subject.lembRecuperación de informaciónspa
dc.subject.lembCiencia de la informaciónspa
dc.subject.lembTecnología de la informaciónspa
dc.subject.proposalModelo vectorialspa
dc.subject.proposalRedes neuronalesspa
dc.subject.proposalTerminologíaspa
dc.subject.proposalModelo semánticospa
dc.titleEstudio e implementación del modelo semántico latente para la recuperación de informaciónspa
dc.title.translatedStudy and implementation of the latent semantic model for information retrievalspa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.type.localTrabajo de Gradospa
dc.type.redcolhttp://purl.org/redcol/resource_type/TP

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
2003_Betancur_Estevez_Freddy.pdf
Tamaño:
15.11 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
829 B
Formato:
Item-specific license agreed upon to submission
Descripción: