Estudio e implementación del modelo semántico latente para la recuperación de información
| dc.contributor.advisor | Pérez Alcázar, José de Jesús | |
| dc.contributor.author | Betancur Estevéz, Freddy Alonso | |
| dc.coverage.campus | UNAB Campus Bucaramanga | spa |
| dc.coverage.spatial | Bucaramanga (Santander, Colombia) | spa |
| dc.date.accessioned | 2024-08-21T16:50:14Z | |
| dc.date.available | 2024-08-21T16:50:14Z | |
| dc.date.issued | 2003-05-29 | |
| dc.degree.name | Ingeniero de Sistemas | spa |
| dc.description.abstract | Las personas disponen de una gran cantidad de información, pero de pocos medios que le faciliten clasificarla y encontrar exactamente lo que necesitan, debido a la gran cantidad de información anexada diariamente en diferentes medios informáticos, generando una sobrecarga de información. El término Recuperación de Información surge con la introducción de la Ciencia de información como ciencia integradora de la teoría, proceso y práctica documental, con otras ciencias complementarias como la cibernética, la informática, la teoría de la información y la comunicación, etc. Se ha usado diversa terminología para referirse al área de estudio que envuelve el concepto de recuperación de información: informática documental, tecnologías de la información, documentación automática/ documática. | spa |
| dc.description.abstractenglish | People have a large amount of information, but few means to help them classify it and find exactly what they need, due to the large amount of information added daily to different computer media, generating an information overload. The term Information Retrieval arose with the introduction of Information Science as an integrative science of documentary theory, process and practice, with other complementary sciences such as cybernetics, computer science, information and communication theory, etc. Various terminology has been used to refer to the area of study that involves the concept of information retrieval: documentary computing, information technologies, automatic documentation/documentation. | spa |
| dc.description.degreelevel | Pregrado | spa |
| dc.description.learningmodality | Modalidad Presencial | spa |
| dc.description.tableofcontents | Introducción........................................................................................................................................................................................ 1 generalidades........................................................................................................................................................................................ 17 1.1 definiciones........................................................................................................................................................................................ 17 1.1.1 documento estructurado............................................................................................................................................................... 17 1.1.2 documento de texto completo.......................................................................................................................................... 17 1.1.3 palabra clave................................................................................................................................................................................... 17 1.2 recuperación de información........................................................................................................................................................... 17 1.3 vista lógica del documento............................................................................................................................................................ 19 2 representación acción del documento .......................................................................................................................................... 21 2.1 selección de términos ........................................................................................................................................................................21 2.2 estructura de almacenamiento de datos...................................................................................................................................... 21 2.1.1 listas o archivos invertidos.......................................................................................................................................................... 22 3 modelos de recuperación de información....................................................................................................................................... 23 3.1 modelo vectorial ...............................................................................................................................................................................24 3.2 modelo booleano.............................................................................................................................................................................. 26 3.3 modelo de redes neuronales......................................................................................................................................................... 26 4 modelo de indexación semántico latente.......................................................................................................................................... 28 Para la recuperación de información...................................................................................................................................................... 4.1 la transformada svd..................................................................................................................................................................... 28 4.2. La definición de la terminología básica es...........................................................................................................................29 4.3 método de evaluación de los modelos implementados.............................................................................................................. 31 4.3.1 diagramas recall & precisión no interpolada.......................................................................................................................... 33 4.3.2 diagrama recall & precisión interpolada..................................................................................................................................... 34 5 estudio e implementación del modelo semántico .......................................................................................................................37 Iatente para i a recuperación de información....................................................................................................................................... 5.1 captura de requerimientos........................................................................................................................................................... 37 5.1.1 casos de uso................................................................................................................................................................................ 37 5.1.1.1 actor........................................................................................................................................................................................ 37 5.1.1.2 flujo de eventos ......................................................................................................................................................................37 5.1.1.3 comunica................................................................................................................................................................................. 37 5.1.1.4 usa........................................................................................................................................................................................ 37 5.1.1.5 extiende ...................................................................................................................................................................................37 5.1.2 casos de uso para la recuperación de información ...........................................................................................................37 5.2 análisis........................................................................................................................................................................................ 38 5.2.1 diagrama de clases................................................................................................................................................................. 38 5.2.2 diagrama de clases para el prototipo de recuperación de Información.........................................................................38 5.2.2.1 diccionario de datos para el prototipo de recuperación de Información..................................................................38 5.2.3 diagramas de interacción ........................................................................................................................................................38 5.2.3.1 diagramas de secuencia .......................................................................................................................................................38 5.2.3.2 diagramas de colaboración ..................................................................................................................................................41 5.2.4 diagramas de secuencia y colaboración para el prototipo de Recuperación de información..............................................42 5.2.5 diagramas de actividades............................................................................................................................................................ 43 5.2.6 diagramas de actividades y sus descripciones para el prototipo de Recuperación de información.............................. 43 5.2.7 diagrama de estados................................................................................................................................................................... 44 5.2.8 diagramas de estados para el prototipo de recuperación de Información............................................................................44 5.2.9 clases-responsabilidades-colaboraciones............................................................................................................................ 45 5.2.9.1 clase ........................................................................................................................................................................................45 5.2.9.2 responsabilidad..................................................................................................................................................................... 45 5.2.9 3 colaboración.......................................................................................................................................................................... 45 5.2.9.4 tarjetas crc................................................................................................................................................................................ 45 5.2.10 tarjetas crc para el prototipo de recuperación de información............................................................................................ 45 5 3 diseño ..........................................................................................................................................................................................47 5.3.1.1 clase frontera ..........................................................................................................................................................................47 5.3.1.2 clase entidad .............................................................................................................................................................................47 5.3.1.3 clase control ..........................................................................................................................................................................48 5.3.2 descripción procedimental de objetos...................................................................................................................................... 48 5.4 desarrollo del modelo .................................................................................................................................................................48 5.4.1 utilización de la base de datos trec ..........................................................................................................................................49 5.4.2 realización del modelo semántico latente.............................................................................................................................. 50 5.4.3 uso de la técnica svd................................................................................................................................................................... 50 5.4.4 recuperación de información utilizando el modelo de vector espacial ..............................................................................51 5.5 resultados de la comparación de los modelos ya Implementados ............................................................................................52 6 conclusiones........................................................................................................................................................................................ 57 7 sugerencias para trabajos futuros..................................................................................................................................................... 59 Bibliografía................................................................................................................................................................................................. 60 Anexos...................................................................................................................................................................................................... 63 | spa |
| dc.format.mimetype | application/pdf | spa |
| dc.identifier.instname | instname:Universidad Autónoma de Bucaramanga - UNAB | spa |
| dc.identifier.reponame | reponame:Repositorio Institucional UNAB | spa |
| dc.identifier.repourl | repourl:https://repository.unab.edu.co | spa |
| dc.identifier.uri | http://hdl.handle.net/20.500.12749/26128 | |
| dc.language.iso | spa | spa |
| dc.publisher.faculty | Facultad Ingeniería | spa |
| dc.publisher.grantor | Universidad Autónoma de Bucaramanga UNAB | spa |
| dc.publisher.program | Pregrado Ingeniería de Sistemas | spa |
| dc.relation.references | http://www.informaticamilenium.com.mx/paginas/espanol/posicionainiento.htm. | spa |
| dc.relation.references | BAEZA YATES, R. and RIBEIRO NETO, Berthier A Modern Information Retrieval. Maryland: Addison Wesley Longman Publishing co, 1999. | spa |
| dc.relation.references | INTRODUCCIÓN A LOS SISTFMAS DE RECUPERACIÓN DE INFORMACIÓN. <Http://www. um.es/gtiweb/fjmm/sarisite/tema1.html>. | spa |
| dc.relation.references | BAEZA YATES, Ricardo Y RIBEIRO NETO, Rerthier. Modern Information Retrieval. Addison Wesley ACM Press. 1992. | spa |
| dc.relation.references | MUI ORES DE BUSQUEDA. ABRIL, 2002. | spa |
| dc.relation.references | OARD W, Douglas. A conceptual Framework for Text Filtering. University of Maryland, College Park, Mayo, 1996. http.7/www.enee.umd.edu/medlab/filter/filter.html | spa |
| dc.relation.references | BAEZA YATES, Ricardo Y RIBEIRO NETO, Rerthier. Modern Information Retrieval. Addisson Wesley ACM Press. 1992. | spa |
| dc.relation.references | MEADOW, Charles T. Text Information Retrieval Systems. Academic Press, 1992 | spa |
| dc.relation.references | VAN RIJSBERGEN, C. J. Information retrieval. Butterworths, 1979. 45p | spa |
| dc.relation.references | VAN RIJSBERGEN, C. J. Information retrieval. Butterworths, 1979. 122p | spa |
| dc.relation.references | YANG, Yiming y PEDERSEN, Jan O. A comparative study on features selection ¡n text categorization. School of Computer Science, Carnegie Mellón University, 1997. | spa |
| dc.relation.references | http://www.dia.fi.upm.es/' agarcia/lenguajenatural/131201-1.pdf | spa |
| dc.relation.references | WIENER, Erik D. et al. A Neural Network Approach to Topic Spotting. En Fourth Annual Symposium on Document Analysis and Information Retrieval (SDAIR'95). 1995, Las Vegas. 1995. p.317-332. http://www.stern.nyu.edu/~aweigend/Research/Papers/TextCategorization | spa |
| dc.relation.references | BAEZA YATES, Ricardo Y RIBEIRO NETO, Rerthier Modor Information Retrieval. Pág 44 - 45 | spa |
| dc.relation.references | SANTO ORCERO, DAVID. The fundamental matrix and the essential matrix: concepts and applications. 2002 | spa |
| dc.relation.references | SCOTT DEERWESTER, SUSAN T. DOMAIS, GEORGE W. FIJRNAS, THOMAS K. LAUNDAUER, RICHARD HARSHMAN. Indexing by Latent Semantic Analysis. Pág 11. | spa |
| dc.relation.references | BAEZA YATES, Ricardo Y RIBEIRO NETO, Moder Information Retrieval. Pág 27- 30 | spa |
| dc.relation.references | http://trec.nist.gov/overview.htmlg | spa |
| dc.relation.references | BAEZA YATES, Ricardo Y RIBEIRO NETO, Moder Information Retrieval Pág 76 y ss | spa |
| dc.relation.references | BOOCH, Grady, JACOBSON, Ivar RUMBAUGH, James. The Unified Modeling Languaje. Addison Wesley Longman Inc. Rational Software Corporation. 1999. | spa |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 2.5 Colombia | * |
| dc.rights.local | Abierto (Texto Completo) | spa |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/co/ | * |
| dc.subject.keywords | Systems engineer | spa |
| dc.subject.keywords | Technological innovations | spa |
| dc.subject.keywords | Vector model | spa |
| dc.subject.keywords | Neural networks | spa |
| dc.subject.keywords | Terminology | spa |
| dc.subject.keywords | Semantic model | spa |
| dc.subject.keywords | Information retrieval | spa |
| dc.subject.keywords | Information science | spa |
| dc.subject.keywords | Information technology | spa |
| dc.subject.lemb | Ingeniería de sistemas | spa |
| dc.subject.lemb | Innovaciones tecnológicas | spa |
| dc.subject.lemb | Recuperación de información | spa |
| dc.subject.lemb | Ciencia de la información | spa |
| dc.subject.lemb | Tecnología de la información | spa |
| dc.subject.proposal | Modelo vectorial | spa |
| dc.subject.proposal | Redes neuronales | spa |
| dc.subject.proposal | Terminología | spa |
| dc.subject.proposal | Modelo semántico | spa |
| dc.title | Estudio e implementación del modelo semántico latente para la recuperación de información | spa |
| dc.title.translated | Study and implementation of the latent semantic model for information retrieval | spa |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | spa |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis | |
| dc.type.hasversion | info:eu-repo/semantics/acceptedVersion | |
| dc.type.local | Trabajo de Grado | spa |
| dc.type.redcol | http://purl.org/redcol/resource_type/TP |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- 2003_Betancur_Estevez_Freddy.pdf
- Tamaño:
- 15.11 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Tesis
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 829 B
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
