Minería de datos aplicada a base de datos estatales (Sisbén)

dc.contributor.advisorGarcía, Juan Carlos
dc.contributor.authorOspina Santana, Cristian
dc.contributor.authorJacome Contreras, Johnny
dc.coverage.campusUNAB Campus Bucaramangaspa
dc.coverage.spatialBucaramanga (Santander, Colombia)spa
dc.date.accessioned2024-09-16T15:11:32Z
dc.date.available2024-09-16T15:11:32Z
dc.date.issued1999
dc.degree.nameIngeniero de Sistemasspa
dc.description.abstractEl objetivo de la presente investigación fue mostrar una aplicación en el área social de la teoría de extracción de conocimiento a partir de grandes bases de datos denominada minería de datos o Data Mining. Se determinaron los principales patrones de comportamiento de una población, con base en las definiciones de pobreza, calidad de vida y necesidades básicas insatisfechas, alcanzando los objetivos trazados al inicio del estudio. Se entregan los principales patrones de comportamiento que se obtuvieron a partir de los métodos estadístico multivariados y herramientas de minería de datos, con los cuales se comprobaron las diferentes hipótesis. Se realizó un estudio detallado de cada conocimiento descubierto con ayuda del analista del negocio y se establecieron las estrategias correspondientes para su solución, constituyéndose éste en un documento técnico para la administración municipal con el objeto que sea eje para la focalización del gasto social del municipio de Pailitas César, además los resultados y metodología utilizada en la presente investigación puede ser aplicada a cualquier base de datos del SISBEN a nivel Nacional.spa
dc.description.abstractenglishThe objective of this research was to show an application in the social area of ​​the theory of knowledge extraction from large databases called data mining or Data Mining. The main behavioral patterns of a population were determined, based on the definitions of poverty, quality of life and unsatisfied basic needs, achieving the objectives set at the beginning of the study. The main behavioral patterns obtained from multivariate statistical methods and data mining tools are provided, with which the different hypotheses were tested. A detailed study of each discovered knowledge was carried out with the help of the business analyst and the corresponding strategies for its solution were established, becoming a technical document for the municipal administration with the aim of be the axis for the targeting of social spending in the municipality of Pailitas César, in addition, the results and methodology used in this research can be applied to any SISBEN database at the national level.spa
dc.description.degreelevelPregradospa
dc.description.learningmodalityModalidad Presencialspa
dc.description.tableofcontents1. INTRODUCCION 17 2. ANTECEDENTES 19 3. PLANTEAMIENTO DEL PROBLEMA 26 3.1. METODOLOGIA DE LAS NECESIDADES BASICAS INSATISFECHAS (NBI) 28 3.2. METODOLOGIA POR LAS LINEAS DE POBREZA (LP) 30 3.3. PROBLEMAS PRESENTADOS 30 4. JUSTIFICACIÓN 32 5. MARCO TEORICO 34 5.1. PROCESOS DE LA MINERIA DE DATOS 35 5.1.1. Determinar los objetivos del negocio 36 5.1.2. Preparación de los datos 37 5.1.2.1. Selección de los datos 37 5.1.2.2. Pre-procesamiento de los datos 37 5.1.2.3. Transformación de los datos 38 5.1.3. Minería de datos 38 5.1.4. Análisis de resultados 38 5.1.5. Asimilación del conocimiento 39 5,2. TECNICAS DE DATA MINING 39 5.2.1. Métodos Estadísticos 39 S,2,1.1. Análisis de regresión múltiple 40 5.2.1.2. Análisis de correspondencia simple 41 S.2.1,3. Análisis de discriminante 42 5.2.1.4. Análisis factorial o componentes principales 43 5.2.1.5. Análisis de conglomerados 45 S.2.2. Métodos de Minería de Datos 46 S.2,2.1. Métodos basados en árboles de decisión 46 5.2.2.2. Métodos basados en reglas de asociación 47 S,2,2.3. Algoritmos genéticos 48 2.2.2.4. Redes neuronales 48 5.2.2.5. Lógica difusa 48 5.2.2.6. Series temporales 49 5.2,3. Herramientas 49 5,2.3.1. DBMiner 49 5,2.3,2. WizWhy 50 5.2.3.3. WizRule 51 D.2.3,4. Intelligent Miner 52 5.2.3.5. Clementine 53 5,3. REVISION BIBLIOGRAFICA 54 6. DETERMINACION DE LOS OBJETIVOS DEL NEGOCIO 56 6.1 OBJETIVO GENERAL 56 6,2 OBJETIVOS ESPECIFICOS 56 7. PREPARACION DE LOS DATOS 58 7.1. SELECCION DE LOS DATOS 58 7.2. PRE-PROCESAMIENTO DE LOS DATOS 59 1.3. TRANSFORMACION DE LOS DATOS 60 8. MINERIA DE DATOS 61 8,1 HIPOTESIS 1 61 8.1.1. Procedimiento metodológico 61 8.1.2. Prueba de significancia estadística para el modelo 63 8.1.3. Resultados DBMiner 65 8.2. HIPOTESIS 2 67 8.2.1. Procedimiento metodológico 67 8.2.2, Prueba de significancia estadística 68 8.2.3. Prueba de hipótesis Ji Cuadrado - Variable Nival de Estudio vs Estado Civil 70 8.2.4. Prueba de hipótesis Ji Cuadrado - Variable Nivel de Estudio vs Parentesco 71 8.2.5. Prueba de hipótesis Ji Cuadrado - Variable Nivel de Estudio vs Actividad Habitual 72 8.2.6. Prueba de hipótesis Ji Cuadrado - Variable Nivel de Estudio vs Asiste 73 8.2,7 .Resultados DBMiner 73 8.3. PROBLEMA 76 8.3.1. Procedimiento metodológico 76 9. ANALISIS DE RESULTADOS Y ASIMILACION DEL CONOCIMIENTO 78 9.1, ANALISIS DE RESULTADO PARA LA HIPOTESIS 1 78 9.1.1. Discusión 80 9.1.2. De lo anterior se puede concluir 82 9.1.3. Recomendaciones 83 9.2. ANALISIS DE RESULTADOS PARA LA HIPOTESIS 2 84 9.2.1. Discusión 86 9.2.2. Estrategias 86 9.3, ANALISIS DE RESULTADOS PARA EL PROBLEMA DE LA ESCOGENCIA DE BENEFICIARIOS PARA EL SECTOR EDUCATIVO 89 9.3.1. Discusión 90 9.3.2. Estrategias 90 9.3.3. De lo anterior se puede concluir 91 9.3.4, Recomendaciones 91 10. CONCLUSIONES Y RECOMENDACIONES 92 10.1. CONCLUSIONES 92 10.2. RECOMENDACIONES 93 BIBLIOGRAFIA 94 ANEXOS 96spa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.identifier.repourlrepourl:https://repository.unab.edu.cospa
dc.identifier.urihttp://hdl.handle.net/20.500.12749/26552
dc.language.isospaspa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.publisher.programPregrado Ingeniería de Sistemasspa
dc.relation.referencesALVAREZ, Rosa María. Data mining. Departamento de Ingeniería Informática y Ciencias de la Computación. Universidad de Conconcepción. 1998. http://www.inf.udec.cl/+rmalvare/Tesis/publico/spa
dc.relation.referencesBARBARY. El análisis estadístico de datos biográficos en ciencias sociales: curso introductivo al uso de las nuevas metodología de análisis multivariado en el estudio de las trayectorias individuales. Simposio Nacional de estadística. Universidad Nacional de Colombia, Bogotá, 8-10 de junio de 1994.spa
dc.relation.referencesCHRISTIANSSON, Per. Using Knowledge Nodes for Knowledge Discovery and Data Mining. 1998. http://it.civil.auc.dk/ittreports/ascona_98/ascona98.htmlspa
dc.relation.referencesDBMINER TECHNOLOGY INC. 1998. http://www.dbminer.com/spa
dc.relation.referencesDE CAMPO IBAÑEZ, Luis Miguel. Grupo de investigación de tratamiento de la Incertidumbre en la inteligencia Artificial. 1997. http://decsai.ugr.es/gte/index_gte.spa
dc.relation.referencesDEPARTAMENTO ADMINISTRATIVO NACIONAL DE ESTADISTICAS. DANE, Seminario Internacional sobre Indicadores Sociales y de Gestión, Santa fa de Bogotá. 1995. 650 pags.spa
dc.relation.referencesDEPARTAMENTO NACIONAL DE PLANEACION. DNP. Cartilla manual técnico SISBEN, Gobernación del Cesar, 1999.spa
dc.relation.referencesDEPARTAMENTO NACIONAL DE PLANEACION. DNP. Documento CONPES 2722, UDS - Misión Social, Santa fe de Bogotá, agosto 10 de 1994.spa
dc.relation.referencesDHAR, Vasant; STEIN, Roger. Seven methods form transforming corporate data into business inteligence. Upper Saddle, NJ 097458. Prentice Hall. 1997.spa
dc.relation.referencesFAYYAD,Usama M. Advences in Knowlegne Discovery and Data Mining. Menlo Park, AAAI Press. The MIT press, 1996. 611 pags.spa
dc.relation.referencesGREENACRE, M. J. Theory and Aplications of Correspondence Analysis. Academic Press, Inc. Londres. 1994.spa
dc.relation.referencesINTERNATIONAL BUSINESS MACHINES CORPORATION. Business Intelligent IBM. 1998. http://www4.primaview.com/ibmcdi/data/extenders/imdatasp.htmspa
dc.relation.referencesMALHOTRA, Naresh K. Investigación de Mercados "Un enfoque Practico”, México, Editorial Prentice Hall. 1997. 890 pags.spa
dc.relation.referencesMORENO A., Germán. Vendedores Ambulantes y Migración. Análisis de la movilidad espacial, social y económica de los vendedores ambulantes y estacionarios del municipio de Bucaramanga. Tesis de grado. Dos tomos. Universidad Industrial de Santander. Bucaramanga. 1997.spa
dc.relation.referencesORGANIZACION DE LOS ESTADOS AMERICANOS. Análisis Multivariado: Método de los Componentes Principales, Washington, secretaria general. 1986.spa
dc.relation.referencesPATIÑO, Carlos Arturo; CAICEDO DE CARDOZO, Elizabeth: BOHORQUEZ, Mercedes. Pobreza y Desarrollo en Colombia " Su impacto sobre la infancia y la mujer”, Bogotá Colombia, Editorial Guadalupe Ltda, mayo de 1998. 411 pags.spa
dc.relation.referencesPILOT SOFTWARE. The new Dimension in Business Intelligence. Data Intelligence Group, Cambridge. 1999. http://www.pilotsw.com/spa
dc.relation.referencesSPSS. Clementine Data Mining System. 1998. http://www.isl.co.uk/clem.spa
dc.relation.referencesSTCLAIR, Caroline. Finding Useful Information Using Data Mining Algorithms, Department of Mathematical and Computer Sciences, USA. Loyola University Chicago. 1999. http://wmw.math.luc.edu/stclair/dataminel/interltindex. htmspa
dc.relation.referencesTUSETH AASHEIM, Oyvind; GRENAGER SOLHEIM, Helge. Data Mining ln Practice: Solutions And Requirements.Ostfold Research Foundation. Halden, Norway. 1996. http://www.pvv.ntnu.no/+hgs/project/report/spa
dc.relation.referencesUNIVERSITY OF ASKATCHEWAN. Department of Computer Science.Engineering Building, 1999. http://www.cs.usask.ca/spa
dc.relation.referencesWESTPHAL, Christopher; BLAXTON, Teresa. Data Mining Solution: Methods and Tools for Solving Real Worla Problems. Chicherter: Jhon Wiley & Sons. 1998. 617 pags.spa
dc.relation.referencesWIZSOFT. Software hased on mathematical algorithms. 1999. http://www.wizsoft.comspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.subject.keywordsData miningspa
dc.subject.keywordsDatabasespa
dc.subject.keywordsStatespa
dc.subject.keywordsSystems engineeringspa
dc.subject.keywordsTechnological innovationsspa
dc.subject.keywordsElectronic data processingspa
dc.subject.keywordsComputer filesspa
dc.subject.keywordsPublic documentsspa
dc.subject.keywordsBeneficiary identification system for subsidiesspa
dc.subject.lembIngeniería de sistemasspa
dc.subject.lembInnovaciones tecnológicasspa
dc.subject.lembProcesamiento electrónico de datosspa
dc.subject.lembArchivos de computadorspa
dc.subject.lembDocumentos públicosspa
dc.subject.lembSistema de identificación de beneficiarios de subsidiosspa
dc.subject.proposalMinería de datosspa
dc.subject.proposalBase de datosspa
dc.subject.proposalEstatalesspa
dc.titleMinería de datos aplicada a base de datos estatales (Sisbén)spa
dc.title.translatedData mining applied to state database (Sisbén)spa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.type.localTrabajo de Gradospa
dc.type.redcolhttp://purl.org/redcol/resource_type/TP

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1999_Tesis_Cristian_Ospina.pdf
Tamaño:
26.58 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
829 B
Formato:
Item-specific license agreed upon to submission
Descripción: