Minería de datos aplicada a base de datos estatales (Sisbén)
| dc.contributor.advisor | García, Juan Carlos | |
| dc.contributor.author | Ospina Santana, Cristian | |
| dc.contributor.author | Jacome Contreras, Johnny | |
| dc.coverage.campus | UNAB Campus Bucaramanga | spa |
| dc.coverage.spatial | Bucaramanga (Santander, Colombia) | spa |
| dc.date.accessioned | 2024-09-16T15:11:32Z | |
| dc.date.available | 2024-09-16T15:11:32Z | |
| dc.date.issued | 1999 | |
| dc.degree.name | Ingeniero de Sistemas | spa |
| dc.description.abstract | El objetivo de la presente investigación fue mostrar una aplicación en el área social de la teoría de extracción de conocimiento a partir de grandes bases de datos denominada minería de datos o Data Mining. Se determinaron los principales patrones de comportamiento de una población, con base en las definiciones de pobreza, calidad de vida y necesidades básicas insatisfechas, alcanzando los objetivos trazados al inicio del estudio. Se entregan los principales patrones de comportamiento que se obtuvieron a partir de los métodos estadístico multivariados y herramientas de minería de datos, con los cuales se comprobaron las diferentes hipótesis. Se realizó un estudio detallado de cada conocimiento descubierto con ayuda del analista del negocio y se establecieron las estrategias correspondientes para su solución, constituyéndose éste en un documento técnico para la administración municipal con el objeto que sea eje para la focalización del gasto social del municipio de Pailitas César, además los resultados y metodología utilizada en la presente investigación puede ser aplicada a cualquier base de datos del SISBEN a nivel Nacional. | spa |
| dc.description.abstractenglish | The objective of this research was to show an application in the social area of the theory of knowledge extraction from large databases called data mining or Data Mining. The main behavioral patterns of a population were determined, based on the definitions of poverty, quality of life and unsatisfied basic needs, achieving the objectives set at the beginning of the study. The main behavioral patterns obtained from multivariate statistical methods and data mining tools are provided, with which the different hypotheses were tested. A detailed study of each discovered knowledge was carried out with the help of the business analyst and the corresponding strategies for its solution were established, becoming a technical document for the municipal administration with the aim of be the axis for the targeting of social spending in the municipality of Pailitas César, in addition, the results and methodology used in this research can be applied to any SISBEN database at the national level. | spa |
| dc.description.degreelevel | Pregrado | spa |
| dc.description.learningmodality | Modalidad Presencial | spa |
| dc.description.tableofcontents | 1. INTRODUCCION 17 2. ANTECEDENTES 19 3. PLANTEAMIENTO DEL PROBLEMA 26 3.1. METODOLOGIA DE LAS NECESIDADES BASICAS INSATISFECHAS (NBI) 28 3.2. METODOLOGIA POR LAS LINEAS DE POBREZA (LP) 30 3.3. PROBLEMAS PRESENTADOS 30 4. JUSTIFICACIÓN 32 5. MARCO TEORICO 34 5.1. PROCESOS DE LA MINERIA DE DATOS 35 5.1.1. Determinar los objetivos del negocio 36 5.1.2. Preparación de los datos 37 5.1.2.1. Selección de los datos 37 5.1.2.2. Pre-procesamiento de los datos 37 5.1.2.3. Transformación de los datos 38 5.1.3. Minería de datos 38 5.1.4. Análisis de resultados 38 5.1.5. Asimilación del conocimiento 39 5,2. TECNICAS DE DATA MINING 39 5.2.1. Métodos Estadísticos 39 S,2,1.1. Análisis de regresión múltiple 40 5.2.1.2. Análisis de correspondencia simple 41 S.2.1,3. Análisis de discriminante 42 5.2.1.4. Análisis factorial o componentes principales 43 5.2.1.5. Análisis de conglomerados 45 S.2.2. Métodos de Minería de Datos 46 S.2,2.1. Métodos basados en árboles de decisión 46 5.2.2.2. Métodos basados en reglas de asociación 47 S,2,2.3. Algoritmos genéticos 48 2.2.2.4. Redes neuronales 48 5.2.2.5. Lógica difusa 48 5.2.2.6. Series temporales 49 5.2,3. Herramientas 49 5,2.3.1. DBMiner 49 5,2.3,2. WizWhy 50 5.2.3.3. WizRule 51 D.2.3,4. Intelligent Miner 52 5.2.3.5. Clementine 53 5,3. REVISION BIBLIOGRAFICA 54 6. DETERMINACION DE LOS OBJETIVOS DEL NEGOCIO 56 6.1 OBJETIVO GENERAL 56 6,2 OBJETIVOS ESPECIFICOS 56 7. PREPARACION DE LOS DATOS 58 7.1. SELECCION DE LOS DATOS 58 7.2. PRE-PROCESAMIENTO DE LOS DATOS 59 1.3. TRANSFORMACION DE LOS DATOS 60 8. MINERIA DE DATOS 61 8,1 HIPOTESIS 1 61 8.1.1. Procedimiento metodológico 61 8.1.2. Prueba de significancia estadística para el modelo 63 8.1.3. Resultados DBMiner 65 8.2. HIPOTESIS 2 67 8.2.1. Procedimiento metodológico 67 8.2.2, Prueba de significancia estadística 68 8.2.3. Prueba de hipótesis Ji Cuadrado - Variable Nival de Estudio vs Estado Civil 70 8.2.4. Prueba de hipótesis Ji Cuadrado - Variable Nivel de Estudio vs Parentesco 71 8.2.5. Prueba de hipótesis Ji Cuadrado - Variable Nivel de Estudio vs Actividad Habitual 72 8.2.6. Prueba de hipótesis Ji Cuadrado - Variable Nivel de Estudio vs Asiste 73 8.2,7 .Resultados DBMiner 73 8.3. PROBLEMA 76 8.3.1. Procedimiento metodológico 76 9. ANALISIS DE RESULTADOS Y ASIMILACION DEL CONOCIMIENTO 78 9.1, ANALISIS DE RESULTADO PARA LA HIPOTESIS 1 78 9.1.1. Discusión 80 9.1.2. De lo anterior se puede concluir 82 9.1.3. Recomendaciones 83 9.2. ANALISIS DE RESULTADOS PARA LA HIPOTESIS 2 84 9.2.1. Discusión 86 9.2.2. Estrategias 86 9.3, ANALISIS DE RESULTADOS PARA EL PROBLEMA DE LA ESCOGENCIA DE BENEFICIARIOS PARA EL SECTOR EDUCATIVO 89 9.3.1. Discusión 90 9.3.2. Estrategias 90 9.3.3. De lo anterior se puede concluir 91 9.3.4, Recomendaciones 91 10. CONCLUSIONES Y RECOMENDACIONES 92 10.1. CONCLUSIONES 92 10.2. RECOMENDACIONES 93 BIBLIOGRAFIA 94 ANEXOS 96 | spa |
| dc.format.mimetype | application/pdf | spa |
| dc.identifier.instname | instname:Universidad Autónoma de Bucaramanga - UNAB | spa |
| dc.identifier.reponame | reponame:Repositorio Institucional UNAB | spa |
| dc.identifier.repourl | repourl:https://repository.unab.edu.co | spa |
| dc.identifier.uri | http://hdl.handle.net/20.500.12749/26552 | |
| dc.language.iso | spa | spa |
| dc.publisher.faculty | Facultad Ingeniería | spa |
| dc.publisher.grantor | Universidad Autónoma de Bucaramanga UNAB | spa |
| dc.publisher.program | Pregrado Ingeniería de Sistemas | spa |
| dc.relation.references | ALVAREZ, Rosa María. Data mining. Departamento de Ingeniería Informática y Ciencias de la Computación. Universidad de Conconcepción. 1998. http://www.inf.udec.cl/+rmalvare/Tesis/publico/ | spa |
| dc.relation.references | BARBARY. El análisis estadístico de datos biográficos en ciencias sociales: curso introductivo al uso de las nuevas metodología de análisis multivariado en el estudio de las trayectorias individuales. Simposio Nacional de estadística. Universidad Nacional de Colombia, Bogotá, 8-10 de junio de 1994. | spa |
| dc.relation.references | CHRISTIANSSON, Per. Using Knowledge Nodes for Knowledge Discovery and Data Mining. 1998. http://it.civil.auc.dk/ittreports/ascona_98/ascona98.html | spa |
| dc.relation.references | DBMINER TECHNOLOGY INC. 1998. http://www.dbminer.com/ | spa |
| dc.relation.references | DE CAMPO IBAÑEZ, Luis Miguel. Grupo de investigación de tratamiento de la Incertidumbre en la inteligencia Artificial. 1997. http://decsai.ugr.es/gte/index_gte. | spa |
| dc.relation.references | DEPARTAMENTO ADMINISTRATIVO NACIONAL DE ESTADISTICAS. DANE, Seminario Internacional sobre Indicadores Sociales y de Gestión, Santa fa de Bogotá. 1995. 650 pags. | spa |
| dc.relation.references | DEPARTAMENTO NACIONAL DE PLANEACION. DNP. Cartilla manual técnico SISBEN, Gobernación del Cesar, 1999. | spa |
| dc.relation.references | DEPARTAMENTO NACIONAL DE PLANEACION. DNP. Documento CONPES 2722, UDS - Misión Social, Santa fe de Bogotá, agosto 10 de 1994. | spa |
| dc.relation.references | DHAR, Vasant; STEIN, Roger. Seven methods form transforming corporate data into business inteligence. Upper Saddle, NJ 097458. Prentice Hall. 1997. | spa |
| dc.relation.references | FAYYAD,Usama M. Advences in Knowlegne Discovery and Data Mining. Menlo Park, AAAI Press. The MIT press, 1996. 611 pags. | spa |
| dc.relation.references | GREENACRE, M. J. Theory and Aplications of Correspondence Analysis. Academic Press, Inc. Londres. 1994. | spa |
| dc.relation.references | INTERNATIONAL BUSINESS MACHINES CORPORATION. Business Intelligent IBM. 1998. http://www4.primaview.com/ibmcdi/data/extenders/imdatasp.htm | spa |
| dc.relation.references | MALHOTRA, Naresh K. Investigación de Mercados "Un enfoque Practico”, México, Editorial Prentice Hall. 1997. 890 pags. | spa |
| dc.relation.references | MORENO A., Germán. Vendedores Ambulantes y Migración. Análisis de la movilidad espacial, social y económica de los vendedores ambulantes y estacionarios del municipio de Bucaramanga. Tesis de grado. Dos tomos. Universidad Industrial de Santander. Bucaramanga. 1997. | spa |
| dc.relation.references | ORGANIZACION DE LOS ESTADOS AMERICANOS. Análisis Multivariado: Método de los Componentes Principales, Washington, secretaria general. 1986. | spa |
| dc.relation.references | PATIÑO, Carlos Arturo; CAICEDO DE CARDOZO, Elizabeth: BOHORQUEZ, Mercedes. Pobreza y Desarrollo en Colombia " Su impacto sobre la infancia y la mujer”, Bogotá Colombia, Editorial Guadalupe Ltda, mayo de 1998. 411 pags. | spa |
| dc.relation.references | PILOT SOFTWARE. The new Dimension in Business Intelligence. Data Intelligence Group, Cambridge. 1999. http://www.pilotsw.com/ | spa |
| dc.relation.references | SPSS. Clementine Data Mining System. 1998. http://www.isl.co.uk/clem. | spa |
| dc.relation.references | STCLAIR, Caroline. Finding Useful Information Using Data Mining Algorithms, Department of Mathematical and Computer Sciences, USA. Loyola University Chicago. 1999. http://wmw.math.luc.edu/stclair/dataminel/interltindex. htm | spa |
| dc.relation.references | TUSETH AASHEIM, Oyvind; GRENAGER SOLHEIM, Helge. Data Mining ln Practice: Solutions And Requirements.Ostfold Research Foundation. Halden, Norway. 1996. http://www.pvv.ntnu.no/+hgs/project/report/ | spa |
| dc.relation.references | UNIVERSITY OF ASKATCHEWAN. Department of Computer Science.Engineering Building, 1999. http://www.cs.usask.ca/ | spa |
| dc.relation.references | WESTPHAL, Christopher; BLAXTON, Teresa. Data Mining Solution: Methods and Tools for Solving Real Worla Problems. Chicherter: Jhon Wiley & Sons. 1998. 617 pags. | spa |
| dc.relation.references | WIZSOFT. Software hased on mathematical algorithms. 1999. http://www.wizsoft.com | spa |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 2.5 Colombia | * |
| dc.rights.local | Abierto (Texto Completo) | spa |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/co/ | * |
| dc.subject.keywords | Data mining | spa |
| dc.subject.keywords | Database | spa |
| dc.subject.keywords | State | spa |
| dc.subject.keywords | Systems engineering | spa |
| dc.subject.keywords | Technological innovations | spa |
| dc.subject.keywords | Electronic data processing | spa |
| dc.subject.keywords | Computer files | spa |
| dc.subject.keywords | Public documents | spa |
| dc.subject.keywords | Beneficiary identification system for subsidies | spa |
| dc.subject.lemb | Ingeniería de sistemas | spa |
| dc.subject.lemb | Innovaciones tecnológicas | spa |
| dc.subject.lemb | Procesamiento electrónico de datos | spa |
| dc.subject.lemb | Archivos de computador | spa |
| dc.subject.lemb | Documentos públicos | spa |
| dc.subject.lemb | Sistema de identificación de beneficiarios de subsidios | spa |
| dc.subject.proposal | Minería de datos | spa |
| dc.subject.proposal | Base de datos | spa |
| dc.subject.proposal | Estatales | spa |
| dc.title | Minería de datos aplicada a base de datos estatales (Sisbén) | spa |
| dc.title.translated | Data mining applied to state database (Sisbén) | spa |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | spa |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis | |
| dc.type.hasversion | info:eu-repo/semantics/acceptedVersion | |
| dc.type.local | Trabajo de Grado | spa |
| dc.type.redcol | http://purl.org/redcol/resource_type/TP |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- 1999_Tesis_Cristian_Ospina.pdf
- Tamaño:
- 26.58 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Tesis
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 829 B
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
