Análisis y clasificación de información mediática electoral utilizando minería de texto
View/ Open
Date
2016-10-17Author
Jiménez Paute, Darío
Metadata
Show full item recordAbstract
La clasificación de polaridad para textos dado a nivel de documento, oración,
o rasgo/característica consiste en, la opinión expresada de un organismo en
positiva, negativa, o neutral.
Así mismo; en la actualidad el formidable aumento de la información a través
de medios de comunicación, ha determinado que el análisis manual de los
expertos en las diferentes temáticas, se vea afectado para su procesamiento
inmediato; ya que implica un esfuerzo adicional para alcanzar el objetivo de
información oportuna para la toma de decisiones.
Las temáticas electorales no son una excepción en este aspecto, la ejecución
dinámica del sistema democrático del país, a través de los diferentes
mecanismos de democracia directa como lo son: iniciativa popular, consultas
populares, y revocatorias de mandato; ha abocado a que se multipliquen las
actividades electorales, y por lo tanto su difusión y recogimiento a través de
los diferentes medios de comunicación (prensa, radio, tv, digitales),
aumentado en un volumen considerable.
Con lo cual, el proceso de monitoreo de medios para las diferentes temáticas
electorales, recopila las noticias con ciertos criterios político-electorales, y de
carácter informativo, donde se conoce cada día desde primera hora las
menciones que los medios de comunicación realizan sobre organismos
electorales, sus miembros destacados, su competencia o su ámbito de
acción.La clasificación de polaridad para textos dado a nivel de documento, oración,
o rasgo/característica consiste en, la opinión expresada de un organismo en
positiva, negativa, o neutral.
Así mismo; en la actualidad el formidable aumento de la información a través
de medios de comunicación, ha determinado que el análisis manual de los
expertos en las diferentes temáticas, se vea afectado para su procesamiento
inmediato; ya que implica un esfuerzo adicional para alcanzar el objetivo de
información oportuna para la toma de decisiones.
Las temáticas electorales no son una excepción en este aspecto, la ejecución
dinámica del sistema democrático del país, a través de los diferentes
mecanismos de democracia directa como lo son: iniciativa popular, consultas
populares, y revocatorias de mandato; ha abocado a que se multipliquen las
actividades electorales, y por lo tanto su difusión y recogimiento a través de
los diferentes medios de comunicación (prensa, radio, tv, digitales),
aumentado en un volumen considerable.
Con lo cual, el proceso de monitoreo de medios para las diferentes temáticas
electorales, recopila las noticias con ciertos criterios político-electorales, y de
carácter informativo, donde se conoce cada día desde primera hora las
menciones que los medios de comunicación realizan sobre organismos
electorales, sus miembros destacados, su competencia o su ámbito de
acción.La utilidad práctica de esta aproximación de clasificación, será avalada por los
resultados experimentales que muestren una mejora en el enfoque tradicional,
en la cual los expertos en el dominio de textos y equipos completos de
análisis definen manualmente las reglas de clasificación.El objetivo del presente estudio, es poder crear un modelo de predicción a
partir de datos de las noticias electorales reales; es decir, con el aprendizaje
supervisado y con el conjunto de datos, crear un modelo con técnicas de
aprendizaje automático que clasifique la polaridad de las noticias electorales,
en positivas, negativas o neutrales; optimizando de esta manera los tiempos
de procesamiento y la oportunidad de la información para la toma de
decisiones en el organismo electoral.
Además, con este estudio se pretende abordar el procesamiento del conjunto
de datos desbalanceado, con la efectividad de los clasificadores a través de
las diferentes métricas de evaluación. Así mismo, se estima comparar de
manera estadística los resultados del conjunto de datos de entrenamiento y
test, y comprobar si realmente no habido un sobreajuste en el aprendizaje del
modelo para determinar el mejor.