Minería de datos utilizando el algoritmo de clasificación C4.5

dc.contributor.advisorGarcía Díaz, Juan Carlos
dc.contributor.authorLamo Badillo, Bladimir
dc.contributor.authorEscobar Ocampo, Giovanni
dc.contributor.cvlacGarcía Diaz, Juan Carlos [0000201529]spa
dc.coverage.campusUNAB Campus Bucaramangaspa
dc.coverage.spatialBucaramanga (Santander, Colombia)spa
dc.date.accessioned2024-08-13T18:20:42Z
dc.date.available2024-08-13T18:20:42Z
dc.date.issued2000
dc.degree.nameIngeniero de Sistemasspa
dc.description.abstractEl objetivo do este trabajo es aplicar una metodología de extracción de conocimiento de la base de datos de docentes de la Facultad de Ingeniería de Sistemas de la UNAS, con el fin de brindar apoyo en la toma de decisiones sobre la administración del recurso humano de la FIS, mediante la aplicación de una técnica de inteligencia artificial como es la minería do datos aplicada a grandes bases de datos. La técnica de Inteligencia Artificial utilizada en la minería de datos (Data Mining) fue el algoritmo de clasificación C4.5 aplicada a la base de datos de la evaluación de docentes de la FIS para identificar patrones de comportamiento de los docentes que laboran en la facultad. La;, reglas de comportamiento donde labora el docente dependiendo de las variables tenidas en cuenta para el estudio.spa
dc.description.abstractenglishThe objective of this work is to apply a knowledge extraction methodology from the database of teachers of the Faculty of Systems Engineering of UNAS, in order to provide support in decision making on the administration of human resources of the FIS, through the application of an artificial intelligence technique such as data mining applied to large databases. The Artificial Intelligence technique used in data mining was the C4.5 classification algorithm applied to the database of the evaluation of teachers of the FIS to identify behavioral patterns of teachers who work in the faculty. The behavioral rules where the teacher works depending on the variables taken into account for the study.spa
dc.description.degreelevelPregradospa
dc.description.learningmodalityModalidad Presencialspa
dc.description.tableofcontentsintroducción ........................................................................................................................................................................................14 1.antecedentes................................................................................................................................................................................ 16 2. planteamiento y justificación del problema.................................................................................................................................... 17 3. marco teórico................................................................................................................................................................................ 19 3.1 minería de datos................................................................................................................................................................................ 19 3.1.1 pasos para el proceso de minería de datos............................................................................................................................ 20 3.1.1.1 definir objetivos......................................................................................................................................................................... 20 3.1.1.2 selección do los datos.............................................................................................................................................................. 20 3.1.1.3 procesamiento de los datos..................................................................................................................................................... 20 3.1.1.4 minería de datos........................................................................................................................................................................ 20 3.1.1.5 análisis de resultados ...............................................................................................................................................................21 3.1.1.6 asimilación de conocimiento ...................................................................................................................................................21 3.1.2 algoritmos de minería de datos ..................................................................................................................................................21 3.1.3 algoritmo de clasificación c4.5.................................................................................................................................................... 24 3.1.3.1 conceptos básicos del algoritmo............................................................................................................................................... 26 3.1.3.2 ejemplo ..........................................................................................................................................................................................30 4. estado del arte.................................................................................................................................................................................... 35 4.2 data servidor ......................................................................................................................................................................................35 4.3 dataengine......................................................................................................................................................................................... 36 4.4 cupid .....................................................................................................................................................................................................36 4.5 dbminer................................................................................................................................................................................ 37 5. desarrollo del algoritmo de clasificación c4.5................................................................................................................................ 38 5.1 implementación ................................................................................................................................................................................38 5.2 definición de datos de entrada .......................................................................................................................................................39 5.3 algoritmo de clasificación c4.5........................................................................................................................................................ 40 5.3.1 funciones de la aplicación.............................................................................................................................................................. 40 5.3.1.1 función quienes.......................................................................................................................................................................... 41 5.3.1.2 función cuantos........................................................................................................................................................................... 41 5.3.1.3 función entropía............................................................................................................................................................................42 5.3.1.4 función impureza .........................................................................................................................................................................42 5.3.1.5 función menor impureza............................................................................................................................................................ 43 5.4 programa principal........................................................................................................................................................................... 44 5.4.1 conversión de variables cuantitativas a variables cualitativas................................................................................................ 44 5.4.2 proceso principal ............................................................................................................................................................................47 5.4.3 diccionario de datos ........................................................................................................................................................................50 6. funcionabilidad de la herramienta.................................................................................................................................................... 53 7. minería de datos aplicando el algoritmo c4.5 en la base de datos de docentes....................................................................... 60 7.1 determinación de los objetivos del negocio de la facultad de la ingeniería de sistemas........................................................ 60 7.2 objetivos del estudio de minería de datos.................................................................................................................................... 63 7.3 preparación de los datos................................................................................................................................................................ 63 7.3.1 selección de los datos................................................................................................................................................................. 64 7.3.2 estructura de la base de datos de evaluación de docentes ....................................................................................................65 7.3.2.1 variables sicológicas ..................................................................................................................................................................68 7.3.2.2 variables educativas .................................................................................................................................................................70 7.4 procesamiento de datos.................................................................................................................................................................. 71 7.5 reglas de comportamiento ...........................................................................................................................................................71 7.6 interpretaciones................................................................................................................................................................................ 74 7.7 estrategias........................................................................................................................................................................................... 76 8. conclusiones y recomendaciones...................................................................................................................................................... 78 8.1 conclusiones .................................................................................................................................................................................78 8.2 recomendaciones ............................................................................................................................................................................78 bibliografía ................................................................................................................................................................................81 anexos.......................................................................................................................................................................................................83spa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.identifier.repourlrepourl:https://repository.unab.edu.cospa
dc.identifier.urihttp://hdl.handle.net/20.500.12749/26015
dc.language.isospaspa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.publisher.programPregrado Ingeniería de Sistemasspa
dc.relation.referencesASOCIACION DE TECNICOS DE INFORMATICA. Edición No. 138. España. WWW.ati.es/PUBI ICACIONES/novatica/1999/138/enre138.html. 1.999spa
dc.relation.referencesSALCEDO, l laider Martín. ‘Sistema de información de control efectivo del recurso humano para la Facultad de Ingeniería do Sistemas UNAB'. Tesis de grado, Facultad de Ingeniería de Sistemas. 1997.spa
dc.relation.referencesCABENA, Peter. HADJINIAN, Pablo, STADLER, Rolf, VERDEES, Jaap, ZANASI, Alessandro. Discovering Data Mining, From Concepto To Implementation. Ediioiial Preritice i lall. 1.998spa
dc.relation.referencesCABEZA, Camilo García, CHAPARRO PELÁEZ, Julián. http://www.fcee.ulpgc.es/Acede98/acede/mesa11/11_03c.html. Universidad Politécnica de Madrid. 1999.spa
dc.relation.referencesQUINLAN, J. Ross. C4.5:Programs for machine learning. Editorial Morgan Kaufmann Publishers. University of Sidney. 1.993.spa
dc.relation.referencesAHO, Alfred V, HOPCROFT, John E, ULLMAN, Jeffrey D. Estructura de datos y algoritmos. Editorial Addison-Wesley Iberoamericana.spa
dc.relation.referencesUNIVERSIDAD DE HUELVA, España. Grupo de Inteligencia Artificial en Contabilidad y Administración de Empresas. Sistemas de inducción de árboles de decisión. http://ciberconta.unizar.es/Biblioteca/0007/arboles.html. 82 [8].spa
dc.relation.referencesMining Web Data for Personalization http://Kdnuggets.com/software/sitt/datasurveyor.htmlspa
dc.relation.referencesManagomont Intelligentes Technologies. http://www.mitgmbh.de/mit/t_de.htmlspa
dc.relation.referencesUNIVERSITY OF PORTSMOUTH. Facultad de tecnología. http://www.sis.port.ac.uk/conference/abstracts /94/ jmallen.htmlspa
dc.relation.referencesSIMON FRASFR UNIVERSITY. http://www.cs.sfu.ca/DBMiner Database System Laboratory.spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.subject.keywordsSystems engineerspa
dc.subject.keywordsTechnological innovationsspa
dc.subject.keywordsAlgorithmsspa
dc.subject.keywordsData miningspa
dc.subject.keywordsEducational variablesspa
dc.subject.keywordsQualitative variablesspa
dc.subject.keywordsComputer programsspa
dc.subject.keywordsArtificial intelligencespa
dc.subject.keywordsAcademic evaluationspa
dc.subject.lembIngeniería de sistemasspa
dc.subject.lembInnovaciones tecnológicasspa
dc.subject.lembProgramas para computadorspa
dc.subject.lembMinería de datosspa
dc.subject.lembInteligencia artificialspa
dc.subject.lembEvaluación académicaspa
dc.subject.proposalAlgoritmosspa
dc.subject.proposalVariables educativasspa
dc.subject.proposalVariables cualitativasspa
dc.titleMinería de datos utilizando el algoritmo de clasificación C4.5spa
dc.title.translatedData mining using the C4.5 classification algorithmspa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.type.localTrabajo de Gradospa
dc.type.redcolhttp://purl.org/redcol/resource_type/TP

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
2000_Tesis_Bladimir_Badillo.pdf
Tamaño:
15.54 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
829 B
Formato:
Item-specific license agreed upon to submission
Descripción: