Implementación de una serie de pasos para la aplicación de técnicas de minería de datos en el análisis de información generada por la planta DEMEX de Ecopetrol

dc.contributor.advisorHernández Cáceres, Javierspa
dc.contributor.authorPérez Uribe, Tatianaspa
dc.contributor.authorTarazona Román, Oswaldo Javierspa
dc.contributor.cvlacHernández Cáceres, Javier [0000817864]*
dc.contributor.researchgroupGrupo de Investigación Preservación e Intercambio Digital de Información y Conocimiento - Prismaspa
dc.contributor.researchgroupGrupo de Investigaciones Clínicasspa
dc.coverageBucaramanga (Colombia)spa
dc.coverage.campusUNAB Campus Bucaramangaspa
dc.date.accessioned2020-06-26T17:56:33Z
dc.date.available2020-06-26T17:56:33Z
dc.date.issued2006
dc.degree.nameIngeniero de Sistemasspa
dc.description.abstractLa información y los almacenes de datos como se conocen hoy en día, son probablemente uno de los recursos más valiosos para las empresas, ya que en ellos, reposa dormida información de carácter vital y altamente lucrativa, que además puede significar para las empresas reducciones de costos, y aumentos sustanciales en sus utilidades. La gran inquietud que mantiene a los expertos a la expectativa, es cómo sacar a la luz tales conocimientos y hacerlos efectivos para poner en marcha los planes futuros de las empresas. De aquí nació el concepto de KDD (Knowledge Discovery and Data Mining), o descubrimiento de conocimiento a partir de bases de datos, reconociendo patrones y asociaciones que se mantienen ocultas en los datos, esperando a ser extraídas para darles un uso adecuado. Una de las compañías más interesadas en poder explotar sus datos recopilados a través de los años es el Instituto Colombiano de Petróleo ICP, el cual posee grandes almacenes de datos archivados en medios computacionales, esperando a ser explotados mediante las técnicas de Minería de Datos y técnicas estadísticas, las cuales generarán los conocimientos adecuados para las disminución de costos, y la maximización de la productividad. En este proyecto se hace el máximo esfuerzo por mejorar un prototipo computacional ya existente, desarrollado en Java, y basado en el paquete computacional de Minería de Datos WEKA, con el cual se pretenden explorar los datos generados por la planta DEMEX de ECOPETROL, y que reposan en la base de datos SILAB. Se aplican los términos de Minería de Datos, y de ingeniería de software de la forma más fiel para obtener un producto de excelente calidad, y con resultados muy certeros, pero además para dar al usuario un soporte metodológico para aplicar correctamente las técnicas y así darle el mejor uso al prototipo que se presenta a continuación.spa
dc.description.abstractenglishInformation and data warehouses, as they are known today, are probably one of the most valuable resources for companies, since vital and highly lucrative information lies dormant in them, which can also mean reductions in costs for companies. costs, and substantial increases in profits. The great concern that keeps experts on the lookout is how to bring such knowledge to light and make it effective to implement the future plans of companies. From here was born the concept of KDD (Knowledge Discovery and Data Mining), or discovery of knowledge from databases, recognizing patterns and associations that remain hidden in the data, waiting to be extracted to give them an appropriate use. One of the companies most interested in being able to exploit their data collected over the years is the Colombian Petroleum Institute ICP, which has large data warehouses archived on computer media, waiting to be exploited through Data Mining techniques and techniques statistics, which will generate the appropriate knowledge for cost reduction and productivity maximization. In this project, the maximum effort is made to improve an existing computational prototype, developed in Java, and based on the WEKA Data Mining computational package, with which it is intended to explore the data generated by the ECOPETROL DEMEX plant, and that They rest in the SILAB database. The terms of Data Mining and software engineering are applied in the most faithful way to obtain a product of excellent quality, and with very accurate results, but also to give the user methodological support to correctly apply the techniques and thus give best use of the prototype presented below.eng
dc.description.degreelevelPregradospa
dc.description.learningmodalityModalidad Presencialspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.identifier.urihttp://hdl.handle.net/20.500.12749/1363
dc.language.isospaspa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.publisher.programPregrado Ingeniería de Sistemasspa
dc.relation.referencesPérez Uribe, Tatiana, Tarazona Román, Oswaldo Javier, Hernández Cáceres, Javier (2006). Implementación de una serie de pasos para la aplicación de técnicas de minería de datos en el análisis de información generada por la planta DEMEX de Ecopetrol. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNABspa
dc.relation.referencesAERTIA SOFTWARE, se puede ver la descripción, precios, demos y descargar Monarch [online, Articulo], 2005. [Citado 12 septiembre 2006]. Disponible en Internet: <http://www.aertia.com/productos.asp?pid=231>
dc.relation.referencesHERNANDEZ GUERRA, Alejandro. Aprendizaje Automático: Árboles de Decisión. Universidad Veracruzana, México. 2004. [online, Articulo]. [Citado el 24 de febrero 2006]. Disponible en Internet: <http://www.uv.mx/aguerra/teaching/ MIA/MachineLearning/clase07.pdf> p. 6-8
dc.relation.referencesANSWERMATH, tutoriales de Minería de Datos [online, Tutorial] 2005. [Citado el 8 de Febrero]. Disponible en Internet: <http://www.answermath.com/ mineria_de_datos.htm
dc.relation.referencesBERZAL GALIANO, Fernando y TALAVERA CUBERO. Departamento de ciencias de la computación e inteligencia artificial, ETS-Ingeniería informática, Universidad de Granada [online, Articulo]. [Citado el 20 de febrero 2006]. Disponible en Internet: <http://elvex.ugr.es/etexts/spanish/proyecto/cap5.pdf
dc.relation.referencesBRESSÁN, Griselda. Trabajo monográfico de adscripción. Lic. En Sistemas de Información Almacenes de Datos y Minería de Datos. [Online, Articulo], 2003. [Citado el 5 de febrero de 2006] Disponible en Internet: <http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatos Bressan.htm
dc.relation.referencesCHEN and WANG. Discovery of Operational Spaces from Process Data for Production of Multiple Grades of Products Ind. Eng. Chem. Res. 2000, 39, p. 2378-2383
dc.relation.referencesDAEDALUS - DATA, Decisions and Language, S. A. Minería de Datos [online, Articulo] 2006. [Citado el 24 de febrero 2066]. Disponible en Internet: <http://www.daedalus.es/AreasMD-E.php> y <http://www.daedalus.es/AreasMD Fases-E.php
dc.relation.referencesDepartamento de Sistemas Informáticos y Computación. Valencia España. Aprendizaje de árboles de decisión [online, Articulo]. [Citado el 22 de febrero 2006]. Disponible en Internet: <http://www.dsic.upv.es/asignaturas/facultad/apr/ decision.pdf> P. 5
dc.relation.referencesEstadístico, es el sitio Web especialistas en consultoría y formación estadística, integrado por expertos en los programas SPSS, SAS, CLEMENTINE entre otros, en la Web de data Mining Institute encontrará todo lo referente a la estadística: cursos, artículos, software, enlaces, consultoría, libros, diccionario estadístico y tests. [Online, Artículo estadístico] 2004. [Citado el 07 de Febrero 2006] Disponible en <http://www.estadistico.com/arts.html?20001023> y <http://www.estadistico.com /arts.htm?20001106> [Citado el 25 de agosto de 2006] <http://www.estadistico.com/dic.html?p=4135&PHPSESSID= 83d26dfa82 897dc24a9ec5c8225dd61a
dc.relation.referencesGams.com es el sitio Web oficial The General Algebraic Modeling System (GAMS). http://www.gams.com/docs/intro.htm
dc.relation.referencesHAIR, ANDERSON; TATHAM y BLACK. Análisis Multivariante, quinta edición, Prentice Hall, 2001, p. 143-148, 347-349, 767, 779
dc.relation.referencesHERNÁNDEZ ORALLO, José; RAMÍREZ QUINTANA; Maria José y FERRI RAMÍREZ, Cesar. Introducción a la Minería de Datos. 2005. Editorial Pearson, p. 266-269
dc.relation.referencesHILLER y LIBERMAN Investigación de operaciones, séptima edición Junio de 2003, editorial McGraw Hill, p. 654, 664 - 669
dc.relation.referencesI-MINER 3.0 - ADDLINK Software Científico. I-Miner 3.0 Software de alto nivel para usuarios no iniciados, Minería de Datos al alcance de todos [online, Información software], 2006. [Citado 12 septiembre 2006]. Disponible en Internet: <http://www.addlink.es/ productos.asp?pid=277
dc.relation.referencesRESAMPLING STATS, INC. es el sitio Web oficial de Resampling Stats donde se encuentra toda la información pertinente a Xlminer [online, Software], 2006. [Citado el 12 de septiembre 2006]. Disponible en Internet: <http://www.resample.com/xlminer
dc.relation.referencesRUMBAUGHT, James; JACOBSON, Ivar y BOOCH, Grady. El Lenguaje Unificado de Modelado. Manual de Referencia. Edición año 2000. Editorial Addison Wesdey
dc.relation.referencesSANTEN. KOOT. ZULLO. Statistical data analysis of a chemical plant. 1997. Computers chem. engng. Vol 21. suppl., pp. s1123-s1129
dc.relation.referencesSERVENTE, Magdalena. Algoritmos TDIDT aplicados a la Minería de Datos inteligente. 2002 [online, Articulo]. [Citado el 21 de octubre 2006]. Disponible en Internet: <http://www.fi.uba.ar/laboratorios/lsi/servente-tesisingenieria informatica.pdf > p. 77-89
dc.relation.referencesSPIEGEL, Murry y STEPHENS, Larry. Estadística. Editorial Mc Graw Hill, tercera edición
dc.relation.referencesSPSS Inc, Acerca de SPSS [online, Software], 2005. [Citado el 12 de septiembre 2006]. Disponible en Internet: <http://www.spss.com/la
dc.relation.referencesVALLE, Sergio. WEIHUA. And QIN, Joe. Selection of the Number of Principal Components: The Variance of the Reconstruction Error Criterion with a Comparison to Other Methods Ind. Eng. Chem. Res. 1999, 38, 4389-4401
dc.relation.referencesWANG and LI Combining Conceptual Clustering and Principal Component Analysis for State Space Based Process Monitoring Ind. Eng. Chem. Res. 1999, 38, 4345-4358
dc.relation.referencesWANG and MCGREAVY. Automatic Classification for Mining Process Operational Data, Ind. Eng. Chem. Res. 1998, 37, 2215-2222
dc.relation.referencesWeka 3 - Data Mining with Open Source Machine Learning Software in Java. Se pude descargar software y documentación [online, Software]. [Citado el 03 de marzo de 2006] Disponible en Internet: <http://www.cs.waikato.ac.nz/ml/weka
dc.relation.referencesWITTEN Ian and EIBE Frank. Data Mining Practical Machine Learning Tools and Techniques. Editorial Morgan Kaufmann, second edition, 2005, p. 119-121
dc.relation.referencesWOLFF Carmen Gloria. La Tecnología Datawarehousing. 1999 [online, Articulo]. [Citado el 27 de agosto 2006]. Disponible en Internet: <http://www.inf.udec.cl/revista/ediciones/edicion3/cwolff.PDF> p. 2
dc.relation.referencesYale. Yet Another Learning Environment? [Online, Software], 2006. [Citado el 12 de septiembre 2006]. Disponible en Internet: <http://rapid-i.com
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.subject.keywordsData miningeng
dc.subject.keywordsSearch in databaseseng
dc.subject.keywordsSilab Property Prediction Systemeng
dc.subject.keywordsSPP (Computer Program)eng
dc.subject.keywordsDatabaseseng
dc.subject.keywordsSystems Engineeringeng
dc.subject.keywordsInvestigationseng
dc.subject.keywordsAnalysiseng
dc.subject.lembMinería de datosspa
dc.subject.lembBúsqueda en bases de datosspa
dc.subject.lembSilab Sistema de predicción de propiedadesspa
dc.subject.lembSPP (Programa para computador)spa
dc.subject.lembBases de datosspa
dc.subject.lembIngeniería de sistemasspa
dc.subject.lembInvestigacionesspa
dc.subject.lembAnálisisspa
dc.titleImplementación de una serie de pasos para la aplicación de técnicas de minería de datos en el análisis de información generada por la planta DEMEX de Ecopetrolspa
dc.title.translatedImplementation of a series of steps for the application of data mining techniques in the analysis of information generated by the Ecopetrol DEMEX planteng
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.type.localTrabajo de Gradospa
dc.type.redcolhttp://purl.org/redcol/resource_type/TP

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
2006_Tesis_Tatiana_Pérez_Uribe.pdf
Tamaño:
8.94 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis