Propuesta de un prototipo de sistema para almacenamiento de información de secuencias biológicas en estructuras de árboles de posiciones

dc.contributor.advisorParra, Carlos Arturo
dc.contributor.authorQuiroga Rivas, Julie Alexandra
dc.contributor.cvlacParra, Carlos Arturo [0000746274]spa
dc.contributor.orcidParra, Carlos Arturo [0000-0003-3593-9504]spa
dc.coverage.campusUNAB Campus Bucaramangaspa
dc.coverage.spatialBucaramanga, Santander (Colombia)spa
dc.date.accessioned2024-10-08T20:22:53Z
dc.date.available2024-10-08T20:22:53Z
dc.date.issued1998
dc.degree.nameIngeniero de Sistemasspa
dc.description.abstractMuchos investigadores han estado estudiando proyectos de secuenciamiento, generando cantidades de información y grandes volúmenes de secuencias imposibles de analizar sin el uso de herramientas computacionales. Motivados por esta necesidad se ha desarrollado un prototipo de sistema de software que consta de un conjunto de operaciones en árboles de posiciones que permiten la construcción de los mismos y la localización rápida de subsecuencias en archivos de secuencias biológicas para un máximo de cien secuencias. La información de secuencias es comúnmente almacenada en locaciones contiguas de memoria de acuerdo a las secuencias biológicas en las moléculas. Este método de almacenamiento no es eficiente para el procesamiento de aplicaciones de grandes grupos de secuencias de datos. El problema clave está en el hecho de que los datos almacenados secuencialmente tienen que ser procesados secuencialmente. La información dentro de una secuencia frecuentemente codificada a través de la presencia de una cierta subsecuencia de moléculas, por ejemplo, una secuencia de DNA codifica una cierta proteína. Para detectar la presencia de cualquier subsecuencia dada, se tiene que accesar la secuencia completa y para detectar una subsecuencia en un conjunto de secuencias, cada secuencia debe ser accesada secuencialmente. En la medida en que aumenta el volumen de información y el tiempo de acceso a la secuencia de datos, se convierte en un factor limítrofe de recuperación de la información de la secuencia independientemente de la velocidad de comparación de secuencias.spa
dc.description.abstractenglishMany researchers have been studying sequencing projects, generating large amounts of information and volumes of sequences impossible to analyze without the use of computational tools. Motivated by this need, a prototype software system has been developed that consists of a set of operations on position trees that allow the construction of trees and the rapid location of subsequences in biological sequence files for up to one hundred sequences. Sequence information is commonly stored in contiguous memory locations according to the biological sequences in the molecules. This storage method is not efficient for processing applications of large sets of sequence data. The key problem lies in the fact that data stored sequentially has to be processed sequentially. The information within a sequence is often encoded through the presence of a certain subsequence of molecules, for example, a DNA sequence encodes a certain protein. To detect the presence of any given subsequence, the entire sequence has to be accessed and to detect a subsequence in a set of sequences, each sequence must be accessed sequentially. As the volume of information and the access time to the data sequence increases, it becomes a limiting factor for retrieving sequence information regardless of the speed of sequence comparison.spa
dc.description.degreelevelPregradospa
dc.description.learningmodalityModalidad Presencialspa
dc.description.tableofcontentsINTRODUCCIÓN PRESENTACIÓN DEL PROYECTO SECUENCIAS BIOLÓGICAS PLANTEAMIENTO DEL PROBLEMA SOLUCIONES AL PROBLEMA OPERACIONES BÁSICAS CON ÁRBOLES DE POSICIONES DISEÑO DE UN PROTOTIPO DE SISTEMA PARA EL ALMACENAMIENTO DE INFORMACIÓN DE SECUENCIAS BIOLÓGICAS APLICACIONES DE LAS OPERACIONES DE ÁRBOLES DE POSICIONES Y ÁRBOLES DE POSICIONES GENERALIZADO CONCLUSIONES RECOMENDACIONES REFERENCIAS BIBLIOGRÁFICAS ANEXOSspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.identifier.repourlrepourl:https://repository.unab.edu.cospa
dc.identifier.urihttp://hdl.handle.net/20.500.12749/26874
dc.language.isospaspa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.publisher.programPregrado Ingeniería de Sistemasspa
dc.relation.referencesAHO, HOPCROFT, ULLMAN, Estructura de Datos y Algoritmos, Ed. Addison-Weley, 1988spa
dc.relation.referencesALTSCHUL, $. F., Gish, W., Miller, W., Myers, E. and Lipmann (1990). Basic Local Alignment Search Tool J. Mol. Biol. 215:403 pspa
dc.relation.referencesAHO, HOPCROFT, ULLMAN, The Design and Analysis of Computer Algorithms, 1974. 346-357 p.spa
dc.relation.referencesBYRON $. Gottfried, Programación en C. Ed. Mc Graw-Hill, 1992spa
dc.relation.referencesBODMER W. (1995), Where Will Genome Analysis Lead Us Forty Years On Ann. NY. Acad.spa
dc.relation.referencesEWE, Thorwald. Conceptos Actuales Ingeniería Genética, 1987spa
dc.relation.referencesFISHER, M.J. and M.S. Paterson[1974]. "String-Matching and other products". Project MAG Thecnical Memorandum 41, MIT, Cambridge, Mass.spa
dc.relation.referencesFU LiMin; Neural Networks in Computer Intelligence; Mc Graw-Hill, 1994spa
dc.relation.referencesGOLDBERG David E.; Genetic Algorithms in search, Optimization, and Machine Learning; Addison-Wesley Pub. Co. 1989,spa
dc.relation.referencesHIRSCHBERG, D.S.[1973]. "A linear space algorithm for computing maximal common subsequences", TR-138, Computer Science Laboratory, Dept. of Electrical Enginnering, Princeton University , Princeton N.J,spa
dc.relation.referencesKARP, R.M., REE. Miller, and A. L Rosenberg[1972]. "Rapid Identification of Repeated Patterns in Strings, trees and arrays", Proc 4'" Annual ACM Symposium on Theory of Computing, 125-136 p.spa
dc.relation.referencesKNUTH, D.E. [1973b] "Notes on Pattern Matching". University of Frondheim, Norway.spa
dc.relation.referencesLIPMANN, D. J and Pearson, W. R. (1985). Rapid and Sensitive Protein Similarity Searches. Science 227:1435 p.spa
dc.relation.referencesPERRY, Greg. Aprendiendo Programación Orientada a Objetos con Turbo C++ en 21 d ías. 1995spa
dc.relation.referencesSCHILDT Herbert, Turbo C/C++ Manual de Referencia. 1992spa
dc.relation.referencesSCHILDT Herbert, Programación en Turbo C, ed. Mc Graw-Hillspa
dc.relation.referencesSOUCEK Branco, The iris Group; Dynamic, Genetic, and Chaotic Programming the sixth generation; Wiley Inter-science 1993,spa
dc.relation.referencesRICH Elaine, Artificial Intelligence, McGraw-Hill Book Company, 1983.spa
dc.relation.referencesSOUCEK Branco, The lris Group; Dynamic, Genetic, and Chaotic Programming the sixth generation; Wiley Inter-science 1993.spa
dc.relation.referencesWAGNER, R.A. and M.J. Fischer[1974]. "The string-to-string correction problem", d.ACM, 21:1, 168-173 p.spa
dc.relation.referencesWEINER P.[1973] "Linear Pattern Matching Algorithms"”, conference record, |EEE, 14% Annual Symposium on Switching and Automata Theory 1-11spa
dc.relation.referencesWinston Patrick, inteligencia Artificial. 3ra edición. 1994. Pag. 70-85spa
dc.relation.referencesTécnicas de Programación. Universidad Autónoma de Bucaramanga TEC de Monterrey. Abril 1997,spa
dc.relation.referencesAccessing Databases. http://arep.med, harvard.edu/seganal/db. htmlspa
dc.relation.referencesDatabase Artifacts. http:/wod.med.harvard.edu/seganal/contam.htmlspa
dc.relation.referencesEDELKAMP Estefan, Multi Suffix Trees. Institut Fúr Informatik, Universiát Freiburg. edelkampHinformatik. uni-freiburg.despa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.subject.keywordsSystems engineerspa
dc.subject.keywordsTechnological innovationsspa
dc.subject.keywordsBioinformaticsspa
dc.subject.keywordsBiocomputingspa
dc.subject.keywordsComputational techniquesspa
dc.subject.keywordsInformation retrievalspa
dc.subject.keywordsPrototype developmentspa
dc.subject.keywordsInformation storage and retrieval systemsspa
dc.subject.lembIngeniería de sistemasspa
dc.subject.lembInnovaciones tecnológicasspa
dc.subject.lembRecuperación de informaciónspa
dc.subject.lembDesarrollo de prototiposspa
dc.subject.lembSistemas de almacenamiento y recuperación de informaciónspa
dc.subject.proposalBioinformáticaspa
dc.subject.proposalBiocomputaciónspa
dc.subject.proposalTécnicas computacionalesspa
dc.titlePropuesta de un prototipo de sistema para almacenamiento de información de secuencias biológicas en estructuras de árboles de posicionesspa
dc.title.translatedProposal for a prototype system for storing biological sequence information in position tree structuresspa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.type.localTrabajo de Gradospa
dc.type.redcolhttp://purl.org/redcol/resource_type/TP

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1998_Quiroga_Rivas_Julie.pdf
Tamaño:
16.59 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
829 B
Formato:
Item-specific license agreed upon to submission
Descripción: