Implementación de una serie de pasos para la aplicación de técnicas de minería de datos en el análisis de información generada por la planta DEMEX de Ecopetrol
| dc.contributor.advisor | Hernández Cáceres, Javier | spa |
| dc.contributor.author | Pérez Uribe, Tatiana | spa |
| dc.contributor.author | Tarazona Román, Oswaldo Javier | spa |
| dc.contributor.cvlac | Hernández Cáceres, Javier [0000817864] | * |
| dc.contributor.researchgroup | Grupo de Investigación Preservación e Intercambio Digital de Información y Conocimiento - Prisma | spa |
| dc.contributor.researchgroup | Grupo de Investigaciones Clínicas | spa |
| dc.coverage | Bucaramanga (Colombia) | spa |
| dc.coverage.campus | UNAB Campus Bucaramanga | spa |
| dc.date.accessioned | 2020-06-26T17:56:33Z | |
| dc.date.available | 2020-06-26T17:56:33Z | |
| dc.date.issued | 2006 | |
| dc.degree.name | Ingeniero de Sistemas | spa |
| dc.description.abstract | La información y los almacenes de datos como se conocen hoy en día, son probablemente uno de los recursos más valiosos para las empresas, ya que en ellos, reposa dormida información de carácter vital y altamente lucrativa, que además puede significar para las empresas reducciones de costos, y aumentos sustanciales en sus utilidades. La gran inquietud que mantiene a los expertos a la expectativa, es cómo sacar a la luz tales conocimientos y hacerlos efectivos para poner en marcha los planes futuros de las empresas. De aquí nació el concepto de KDD (Knowledge Discovery and Data Mining), o descubrimiento de conocimiento a partir de bases de datos, reconociendo patrones y asociaciones que se mantienen ocultas en los datos, esperando a ser extraídas para darles un uso adecuado. Una de las compañías más interesadas en poder explotar sus datos recopilados a través de los años es el Instituto Colombiano de Petróleo ICP, el cual posee grandes almacenes de datos archivados en medios computacionales, esperando a ser explotados mediante las técnicas de Minería de Datos y técnicas estadísticas, las cuales generarán los conocimientos adecuados para las disminución de costos, y la maximización de la productividad. En este proyecto se hace el máximo esfuerzo por mejorar un prototipo computacional ya existente, desarrollado en Java, y basado en el paquete computacional de Minería de Datos WEKA, con el cual se pretenden explorar los datos generados por la planta DEMEX de ECOPETROL, y que reposan en la base de datos SILAB. Se aplican los términos de Minería de Datos, y de ingeniería de software de la forma más fiel para obtener un producto de excelente calidad, y con resultados muy certeros, pero además para dar al usuario un soporte metodológico para aplicar correctamente las técnicas y así darle el mejor uso al prototipo que se presenta a continuación. | spa |
| dc.description.abstractenglish | Information and data warehouses, as they are known today, are probably one of the most valuable resources for companies, since vital and highly lucrative information lies dormant in them, which can also mean reductions in costs for companies. costs, and substantial increases in profits. The great concern that keeps experts on the lookout is how to bring such knowledge to light and make it effective to implement the future plans of companies. From here was born the concept of KDD (Knowledge Discovery and Data Mining), or discovery of knowledge from databases, recognizing patterns and associations that remain hidden in the data, waiting to be extracted to give them an appropriate use. One of the companies most interested in being able to exploit their data collected over the years is the Colombian Petroleum Institute ICP, which has large data warehouses archived on computer media, waiting to be exploited through Data Mining techniques and techniques statistics, which will generate the appropriate knowledge for cost reduction and productivity maximization. In this project, the maximum effort is made to improve an existing computational prototype, developed in Java, and based on the WEKA Data Mining computational package, with which it is intended to explore the data generated by the ECOPETROL DEMEX plant, and that They rest in the SILAB database. The terms of Data Mining and software engineering are applied in the most faithful way to obtain a product of excellent quality, and with very accurate results, but also to give the user methodological support to correctly apply the techniques and thus give best use of the prototype presented below. | eng |
| dc.description.degreelevel | Pregrado | spa |
| dc.description.learningmodality | Modalidad Presencial | spa |
| dc.format.mimetype | application/pdf | spa |
| dc.identifier.instname | instname:Universidad Autónoma de Bucaramanga - UNAB | spa |
| dc.identifier.reponame | reponame:Repositorio Institucional UNAB | spa |
| dc.identifier.uri | http://hdl.handle.net/20.500.12749/1363 | |
| dc.language.iso | spa | spa |
| dc.publisher.faculty | Facultad Ingeniería | spa |
| dc.publisher.grantor | Universidad Autónoma de Bucaramanga UNAB | spa |
| dc.publisher.program | Pregrado Ingeniería de Sistemas | spa |
| dc.relation.references | Pérez Uribe, Tatiana, Tarazona Román, Oswaldo Javier, Hernández Cáceres, Javier (2006). Implementación de una serie de pasos para la aplicación de técnicas de minería de datos en el análisis de información generada por la planta DEMEX de Ecopetrol. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB | spa |
| dc.relation.references | AERTIA SOFTWARE, se puede ver la descripción, precios, demos y descargar Monarch [online, Articulo], 2005. [Citado 12 septiembre 2006]. Disponible en Internet: <http://www.aertia.com/productos.asp?pid=231> | |
| dc.relation.references | HERNANDEZ GUERRA, Alejandro. Aprendizaje Automático: Árboles de Decisión. Universidad Veracruzana, México. 2004. [online, Articulo]. [Citado el 24 de febrero 2006]. Disponible en Internet: <http://www.uv.mx/aguerra/teaching/ MIA/MachineLearning/clase07.pdf> p. 6-8 | |
| dc.relation.references | ANSWERMATH, tutoriales de Minería de Datos [online, Tutorial] 2005. [Citado el 8 de Febrero]. Disponible en Internet: <http://www.answermath.com/ mineria_de_datos.htm | |
| dc.relation.references | BERZAL GALIANO, Fernando y TALAVERA CUBERO. Departamento de ciencias de la computación e inteligencia artificial, ETS-Ingeniería informática, Universidad de Granada [online, Articulo]. [Citado el 20 de febrero 2006]. Disponible en Internet: <http://elvex.ugr.es/etexts/spanish/proyecto/cap5.pdf | |
| dc.relation.references | BRESSÁN, Griselda. Trabajo monográfico de adscripción. Lic. En Sistemas de Información Almacenes de Datos y Minería de Datos. [Online, Articulo], 2003. [Citado el 5 de febrero de 2006] Disponible en Internet: <http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatos Bressan.htm | |
| dc.relation.references | CHEN and WANG. Discovery of Operational Spaces from Process Data for Production of Multiple Grades of Products Ind. Eng. Chem. Res. 2000, 39, p. 2378-2383 | |
| dc.relation.references | DAEDALUS - DATA, Decisions and Language, S. A. Minería de Datos [online, Articulo] 2006. [Citado el 24 de febrero 2066]. Disponible en Internet: <http://www.daedalus.es/AreasMD-E.php> y <http://www.daedalus.es/AreasMD Fases-E.php | |
| dc.relation.references | Departamento de Sistemas Informáticos y Computación. Valencia España. Aprendizaje de árboles de decisión [online, Articulo]. [Citado el 22 de febrero 2006]. Disponible en Internet: <http://www.dsic.upv.es/asignaturas/facultad/apr/ decision.pdf> P. 5 | |
| dc.relation.references | Estadístico, es el sitio Web especialistas en consultoría y formación estadística, integrado por expertos en los programas SPSS, SAS, CLEMENTINE entre otros, en la Web de data Mining Institute encontrará todo lo referente a la estadística: cursos, artículos, software, enlaces, consultoría, libros, diccionario estadístico y tests. [Online, Artículo estadístico] 2004. [Citado el 07 de Febrero 2006] Disponible en <http://www.estadistico.com/arts.html?20001023> y <http://www.estadistico.com /arts.htm?20001106> [Citado el 25 de agosto de 2006] <http://www.estadistico.com/dic.html?p=4135&PHPSESSID= 83d26dfa82 897dc24a9ec5c8225dd61a | |
| dc.relation.references | Gams.com es el sitio Web oficial The General Algebraic Modeling System (GAMS). http://www.gams.com/docs/intro.htm | |
| dc.relation.references | HAIR, ANDERSON; TATHAM y BLACK. Análisis Multivariante, quinta edición, Prentice Hall, 2001, p. 143-148, 347-349, 767, 779 | |
| dc.relation.references | HERNÁNDEZ ORALLO, José; RAMÍREZ QUINTANA; Maria José y FERRI RAMÍREZ, Cesar. Introducción a la Minería de Datos. 2005. Editorial Pearson, p. 266-269 | |
| dc.relation.references | HILLER y LIBERMAN Investigación de operaciones, séptima edición Junio de 2003, editorial McGraw Hill, p. 654, 664 - 669 | |
| dc.relation.references | I-MINER 3.0 - ADDLINK Software Científico. I-Miner 3.0 Software de alto nivel para usuarios no iniciados, Minería de Datos al alcance de todos [online, Información software], 2006. [Citado 12 septiembre 2006]. Disponible en Internet: <http://www.addlink.es/ productos.asp?pid=277 | |
| dc.relation.references | RESAMPLING STATS, INC. es el sitio Web oficial de Resampling Stats donde se encuentra toda la información pertinente a Xlminer [online, Software], 2006. [Citado el 12 de septiembre 2006]. Disponible en Internet: <http://www.resample.com/xlminer | |
| dc.relation.references | RUMBAUGHT, James; JACOBSON, Ivar y BOOCH, Grady. El Lenguaje Unificado de Modelado. Manual de Referencia. Edición año 2000. Editorial Addison Wesdey | |
| dc.relation.references | SANTEN. KOOT. ZULLO. Statistical data analysis of a chemical plant. 1997. Computers chem. engng. Vol 21. suppl., pp. s1123-s1129 | |
| dc.relation.references | SERVENTE, Magdalena. Algoritmos TDIDT aplicados a la Minería de Datos inteligente. 2002 [online, Articulo]. [Citado el 21 de octubre 2006]. Disponible en Internet: <http://www.fi.uba.ar/laboratorios/lsi/servente-tesisingenieria informatica.pdf > p. 77-89 | |
| dc.relation.references | SPIEGEL, Murry y STEPHENS, Larry. Estadística. Editorial Mc Graw Hill, tercera edición | |
| dc.relation.references | SPSS Inc, Acerca de SPSS [online, Software], 2005. [Citado el 12 de septiembre 2006]. Disponible en Internet: <http://www.spss.com/la | |
| dc.relation.references | VALLE, Sergio. WEIHUA. And QIN, Joe. Selection of the Number of Principal Components: The Variance of the Reconstruction Error Criterion with a Comparison to Other Methods Ind. Eng. Chem. Res. 1999, 38, 4389-4401 | |
| dc.relation.references | WANG and LI Combining Conceptual Clustering and Principal Component Analysis for State Space Based Process Monitoring Ind. Eng. Chem. Res. 1999, 38, 4345-4358 | |
| dc.relation.references | WANG and MCGREAVY. Automatic Classification for Mining Process Operational Data, Ind. Eng. Chem. Res. 1998, 37, 2215-2222 | |
| dc.relation.references | Weka 3 - Data Mining with Open Source Machine Learning Software in Java. Se pude descargar software y documentación [online, Software]. [Citado el 03 de marzo de 2006] Disponible en Internet: <http://www.cs.waikato.ac.nz/ml/weka | |
| dc.relation.references | WITTEN Ian and EIBE Frank. Data Mining Practical Machine Learning Tools and Techniques. Editorial Morgan Kaufmann, second edition, 2005, p. 119-121 | |
| dc.relation.references | WOLFF Carmen Gloria. La Tecnología Datawarehousing. 1999 [online, Articulo]. [Citado el 27 de agosto 2006]. Disponible en Internet: <http://www.inf.udec.cl/revista/ediciones/edicion3/cwolff.PDF> p. 2 | |
| dc.relation.references | Yale. Yet Another Learning Environment? [Online, Software], 2006. [Citado el 12 de septiembre 2006]. Disponible en Internet: <http://rapid-i.com | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
| dc.rights.accessrights | http://purl.org/coar/access_right/c_abf2 | spa |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 2.5 Colombia | * |
| dc.rights.local | Abierto (Texto Completo) | spa |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/co/ | * |
| dc.subject.keywords | Data mining | eng |
| dc.subject.keywords | Search in databases | eng |
| dc.subject.keywords | Silab Property Prediction System | eng |
| dc.subject.keywords | SPP (Computer Program) | eng |
| dc.subject.keywords | Databases | eng |
| dc.subject.keywords | Systems Engineering | eng |
| dc.subject.keywords | Investigations | eng |
| dc.subject.keywords | Analysis | eng |
| dc.subject.lemb | Minería de datos | spa |
| dc.subject.lemb | Búsqueda en bases de datos | spa |
| dc.subject.lemb | Silab Sistema de predicción de propiedades | spa |
| dc.subject.lemb | SPP (Programa para computador) | spa |
| dc.subject.lemb | Bases de datos | spa |
| dc.subject.lemb | Ingeniería de sistemas | spa |
| dc.subject.lemb | Investigaciones | spa |
| dc.subject.lemb | Análisis | spa |
| dc.title | Implementación de una serie de pasos para la aplicación de técnicas de minería de datos en el análisis de información generada por la planta DEMEX de Ecopetrol | spa |
| dc.title.translated | Implementation of a series of steps for the application of data mining techniques in the analysis of information generated by the Ecopetrol DEMEX plant | eng |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis | |
| dc.type.hasversion | info:eu-repo/semantics/acceptedVersion | |
| dc.type.local | Trabajo de Grado | spa |
| dc.type.redcol | http://purl.org/redcol/resource_type/TP |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- 2006_Tesis_Tatiana_Pérez_Uribe.pdf
- Tamaño:
- 8.94 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Tesis
