Minería de datos utilizando el algoritmo de clasificación C4.5
| dc.contributor.advisor | García Díaz, Juan Carlos | |
| dc.contributor.author | Lamo Badillo, Bladimir | |
| dc.contributor.author | Escobar Ocampo, Giovanni | |
| dc.contributor.cvlac | García Diaz, Juan Carlos [0000201529] | spa |
| dc.coverage.campus | UNAB Campus Bucaramanga | spa |
| dc.coverage.spatial | Bucaramanga (Santander, Colombia) | spa |
| dc.date.accessioned | 2024-08-13T18:20:42Z | |
| dc.date.available | 2024-08-13T18:20:42Z | |
| dc.date.issued | 2000 | |
| dc.degree.name | Ingeniero de Sistemas | spa |
| dc.description.abstract | El objetivo do este trabajo es aplicar una metodología de extracción de conocimiento de la base de datos de docentes de la Facultad de Ingeniería de Sistemas de la UNAS, con el fin de brindar apoyo en la toma de decisiones sobre la administración del recurso humano de la FIS, mediante la aplicación de una técnica de inteligencia artificial como es la minería do datos aplicada a grandes bases de datos. La técnica de Inteligencia Artificial utilizada en la minería de datos (Data Mining) fue el algoritmo de clasificación C4.5 aplicada a la base de datos de la evaluación de docentes de la FIS para identificar patrones de comportamiento de los docentes que laboran en la facultad. La;, reglas de comportamiento donde labora el docente dependiendo de las variables tenidas en cuenta para el estudio. | spa |
| dc.description.abstractenglish | The objective of this work is to apply a knowledge extraction methodology from the database of teachers of the Faculty of Systems Engineering of UNAS, in order to provide support in decision making on the administration of human resources of the FIS, through the application of an artificial intelligence technique such as data mining applied to large databases. The Artificial Intelligence technique used in data mining was the C4.5 classification algorithm applied to the database of the evaluation of teachers of the FIS to identify behavioral patterns of teachers who work in the faculty. The behavioral rules where the teacher works depending on the variables taken into account for the study. | spa |
| dc.description.degreelevel | Pregrado | spa |
| dc.description.learningmodality | Modalidad Presencial | spa |
| dc.description.tableofcontents | introducción ........................................................................................................................................................................................14 1.antecedentes................................................................................................................................................................................ 16 2. planteamiento y justificación del problema.................................................................................................................................... 17 3. marco teórico................................................................................................................................................................................ 19 3.1 minería de datos................................................................................................................................................................................ 19 3.1.1 pasos para el proceso de minería de datos............................................................................................................................ 20 3.1.1.1 definir objetivos......................................................................................................................................................................... 20 3.1.1.2 selección do los datos.............................................................................................................................................................. 20 3.1.1.3 procesamiento de los datos..................................................................................................................................................... 20 3.1.1.4 minería de datos........................................................................................................................................................................ 20 3.1.1.5 análisis de resultados ...............................................................................................................................................................21 3.1.1.6 asimilación de conocimiento ...................................................................................................................................................21 3.1.2 algoritmos de minería de datos ..................................................................................................................................................21 3.1.3 algoritmo de clasificación c4.5.................................................................................................................................................... 24 3.1.3.1 conceptos básicos del algoritmo............................................................................................................................................... 26 3.1.3.2 ejemplo ..........................................................................................................................................................................................30 4. estado del arte.................................................................................................................................................................................... 35 4.2 data servidor ......................................................................................................................................................................................35 4.3 dataengine......................................................................................................................................................................................... 36 4.4 cupid .....................................................................................................................................................................................................36 4.5 dbminer................................................................................................................................................................................ 37 5. desarrollo del algoritmo de clasificación c4.5................................................................................................................................ 38 5.1 implementación ................................................................................................................................................................................38 5.2 definición de datos de entrada .......................................................................................................................................................39 5.3 algoritmo de clasificación c4.5........................................................................................................................................................ 40 5.3.1 funciones de la aplicación.............................................................................................................................................................. 40 5.3.1.1 función quienes.......................................................................................................................................................................... 41 5.3.1.2 función cuantos........................................................................................................................................................................... 41 5.3.1.3 función entropía............................................................................................................................................................................42 5.3.1.4 función impureza .........................................................................................................................................................................42 5.3.1.5 función menor impureza............................................................................................................................................................ 43 5.4 programa principal........................................................................................................................................................................... 44 5.4.1 conversión de variables cuantitativas a variables cualitativas................................................................................................ 44 5.4.2 proceso principal ............................................................................................................................................................................47 5.4.3 diccionario de datos ........................................................................................................................................................................50 6. funcionabilidad de la herramienta.................................................................................................................................................... 53 7. minería de datos aplicando el algoritmo c4.5 en la base de datos de docentes....................................................................... 60 7.1 determinación de los objetivos del negocio de la facultad de la ingeniería de sistemas........................................................ 60 7.2 objetivos del estudio de minería de datos.................................................................................................................................... 63 7.3 preparación de los datos................................................................................................................................................................ 63 7.3.1 selección de los datos................................................................................................................................................................. 64 7.3.2 estructura de la base de datos de evaluación de docentes ....................................................................................................65 7.3.2.1 variables sicológicas ..................................................................................................................................................................68 7.3.2.2 variables educativas .................................................................................................................................................................70 7.4 procesamiento de datos.................................................................................................................................................................. 71 7.5 reglas de comportamiento ...........................................................................................................................................................71 7.6 interpretaciones................................................................................................................................................................................ 74 7.7 estrategias........................................................................................................................................................................................... 76 8. conclusiones y recomendaciones...................................................................................................................................................... 78 8.1 conclusiones .................................................................................................................................................................................78 8.2 recomendaciones ............................................................................................................................................................................78 bibliografía ................................................................................................................................................................................81 anexos.......................................................................................................................................................................................................83 | spa |
| dc.format.mimetype | application/pdf | spa |
| dc.identifier.instname | instname:Universidad Autónoma de Bucaramanga - UNAB | spa |
| dc.identifier.reponame | reponame:Repositorio Institucional UNAB | spa |
| dc.identifier.repourl | repourl:https://repository.unab.edu.co | spa |
| dc.identifier.uri | http://hdl.handle.net/20.500.12749/26015 | |
| dc.language.iso | spa | spa |
| dc.publisher.faculty | Facultad Ingeniería | spa |
| dc.publisher.grantor | Universidad Autónoma de Bucaramanga UNAB | spa |
| dc.publisher.program | Pregrado Ingeniería de Sistemas | spa |
| dc.relation.references | ASOCIACION DE TECNICOS DE INFORMATICA. Edición No. 138. España. WWW.ati.es/PUBI ICACIONES/novatica/1999/138/enre138.html. 1.999 | spa |
| dc.relation.references | SALCEDO, l laider Martín. ‘Sistema de información de control efectivo del recurso humano para la Facultad de Ingeniería do Sistemas UNAB'. Tesis de grado, Facultad de Ingeniería de Sistemas. 1997. | spa |
| dc.relation.references | CABENA, Peter. HADJINIAN, Pablo, STADLER, Rolf, VERDEES, Jaap, ZANASI, Alessandro. Discovering Data Mining, From Concepto To Implementation. Ediioiial Preritice i lall. 1.998 | spa |
| dc.relation.references | CABEZA, Camilo García, CHAPARRO PELÁEZ, Julián. http://www.fcee.ulpgc.es/Acede98/acede/mesa11/11_03c.html. Universidad Politécnica de Madrid. 1999. | spa |
| dc.relation.references | QUINLAN, J. Ross. C4.5:Programs for machine learning. Editorial Morgan Kaufmann Publishers. University of Sidney. 1.993. | spa |
| dc.relation.references | AHO, Alfred V, HOPCROFT, John E, ULLMAN, Jeffrey D. Estructura de datos y algoritmos. Editorial Addison-Wesley Iberoamericana. | spa |
| dc.relation.references | UNIVERSIDAD DE HUELVA, España. Grupo de Inteligencia Artificial en Contabilidad y Administración de Empresas. Sistemas de inducción de árboles de decisión. http://ciberconta.unizar.es/Biblioteca/0007/arboles.html. 82 [8]. | spa |
| dc.relation.references | Mining Web Data for Personalization http://Kdnuggets.com/software/sitt/datasurveyor.html | spa |
| dc.relation.references | Managomont Intelligentes Technologies. http://www.mitgmbh.de/mit/t_de.html | spa |
| dc.relation.references | UNIVERSITY OF PORTSMOUTH. Facultad de tecnología. http://www.sis.port.ac.uk/conference/abstracts /94/ jmallen.html | spa |
| dc.relation.references | SIMON FRASFR UNIVERSITY. http://www.cs.sfu.ca/DBMiner Database System Laboratory. | spa |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 2.5 Colombia | * |
| dc.rights.local | Abierto (Texto Completo) | spa |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/co/ | * |
| dc.subject.keywords | Systems engineer | spa |
| dc.subject.keywords | Technological innovations | spa |
| dc.subject.keywords | Algorithms | spa |
| dc.subject.keywords | Data mining | spa |
| dc.subject.keywords | Educational variables | spa |
| dc.subject.keywords | Qualitative variables | spa |
| dc.subject.keywords | Computer programs | spa |
| dc.subject.keywords | Artificial intelligence | spa |
| dc.subject.keywords | Academic evaluation | spa |
| dc.subject.lemb | Ingeniería de sistemas | spa |
| dc.subject.lemb | Innovaciones tecnológicas | spa |
| dc.subject.lemb | Programas para computador | spa |
| dc.subject.lemb | Minería de datos | spa |
| dc.subject.lemb | Inteligencia artificial | spa |
| dc.subject.lemb | Evaluación académica | spa |
| dc.subject.proposal | Algoritmos | spa |
| dc.subject.proposal | Variables educativas | spa |
| dc.subject.proposal | Variables cualitativas | spa |
| dc.title | Minería de datos utilizando el algoritmo de clasificación C4.5 | spa |
| dc.title.translated | Data mining using the C4.5 classification algorithm | spa |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | spa |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis | |
| dc.type.hasversion | info:eu-repo/semantics/acceptedVersion | |
| dc.type.local | Trabajo de Grado | spa |
| dc.type.redcol | http://purl.org/redcol/resource_type/TP |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- 2000_Tesis_Bladimir_Badillo.pdf
- Tamaño:
- 15.54 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Tesis
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 829 B
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
