Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural

Cargando...
Miniatura

Fecha

Autores

Naranjo Reyes, Kevin Alejandro

Otros contribuidores

Director / Asesor

Arizmendi Pereira, Carlos Julio    logo-CVLAC    logo-GScholar    logo-ORCID    logo-ResearchGate   

Título de la revista

ISSN de la revista

Título del volumen

Editor

Seguimiento al proceso del trabajo

Compartir

Seleccione un documento PDF para visualizar

Resumen

Se aplicó una serie de modelos que predicen el Índice de Calidad del Aire (ICA) a partir de las publicaciones realizadas por los habitantes de Bucaramanga en Twitter, para determinar la calidad del aire en la ciudad. Se seleccionó el mejor modelo a partir de diferentes métricas con base en el accuracy de la clasificación. Para ello, se recopilaron mediciones reales del ICA en varios puntos de la ciudad y se hizo la extracción de Tweets para la misma serie temporal. Al emplear distintos algoritmos de reducción de dimensionalidad junto con técnicas de clasificación, tales técnicas son FSCNCA, Forward Selection, LDA y Redes Neuronales, se desarrollaron los modelos de predicción y se seleccionó el de mayor porcentaje de clasificación. El modelo que emplea FSCNCA como técnica de reducción de dimensionalidad y LDA como clasificador fue el que obtuvo el mejor porcentaje de clasificación, con un Accuracy de 69.07% en el conjunto Validation.

Descripción

Enlace al recurso

Fuente del recurso

Citación

Aprobación

Revisión

Complementado por

Referenciado por

Licencia Creative Commons

Excepto donde se indique lo contrario, la licencia de este ítem se describe como Atribución-NoComercial-SinDerivadas 2.5 Colombia