Title: | Aplicação de técnicas de data mining para previsibilidade eleitoral |
Author: | Guedes, Pedro Casali |
Abstract: |
Após casos de imprevisibilidades eleitorais nos Estados Unidos e no Reino Unido em 2016, havia uma preocupação para que o mesmo ocorresse nas eleições presidenciais brasileiras de 2018 desde o início do período eleitoral. A Ciência Política, por sua vez, apresenta diversas teorias que buscam avaliar essa questão. Entretanto, há limitações quanto aos dados utilizados nas pesquisas dessa área, além de não considerarem os efeitos das redes sociais em suas análises. Por fim, com a Reforma Político-Eleitoral de 2017, a duração das campanhas eleitorais foi reduzida, bem como foram impostas limitações financeiras a elas, demandando novas estratégias dos candidatos. Desse modo, este projeto propõe um novo método de prever resultados de eleições, baseando-se na teoria de estratégias emocionais da Neuropolítica. Aplicando a Design Science Research Methodology (DSRM), uma das metodologias mais utilizadas em projetos de pesquisa, o objetivo deste trabalho é categorizar as diferentes publicações (de 1° de janeiro até 6 de outubro de 2018) na rede social Twitter de oito dos principais candidatos à Presidência da República conforme os sentimentos transmitidos. Para isso, foram aplicadas e avaliadas diversas técnicas de mineração de opiniões (uma aplicação de data mining), como: aquisição de dados por meio de um web scraper, pré-processamento dos textos utilizando de diferentes ferramentas, categorização (com base no uso de léxicos e de seis algoritmos de aprendizado de máquina) e até a apresentação visual dos resultados. Para a construção do modelo de categorização, optou-se pelo uso do algoritmo de aprendizado de máquina de Naïve-Bayes, sendo este um dos trabalhos pioneiros no Brasil em uso de técnicas de machine learning na previsibilidade eleitoral. A partir de sua aplicação, os tweets publicados foram classificados em três emoções: positivas, negativas e neutras. Os resultados obtidos neste trabalho foram preliminares e não conclusivos em relação à previsão das eleições. Entretanto, foi permitido diferenciar as estratégias emocionais de cada candidato, as quais apresentaram relação com eventos externos que ocorreram ao longo do período eleitoral, comprovando que a teoria da Neuropolítica aplicada possui influência nas campanhas e que o modelo de classificação criado é válido para avaliá-la. Com isso, o trabalho apresenta perspectivas de maiores contribuições futuras à área de previsibilidade eleitoral com base no uso de técnicas de aprendizagem de máquina. After cases of electoral unpredictability in the United Stated and in the United Kingdom, in 2016, there were concerns that the same could happen in the 2018 Brazilian presidential elections since the beginning of the campaign period. Within Political Science, there are a few different theories which focus on studying such issues. However, there are some limitations with respect to the data used in those researches, as well as not including the effects of social media in their analysis. Finally, with the Political-Electoral Reform of 2017, campaigns’ durations were reduced as well as their allowed budget, which demands new strategies by the candidates. With such scenario, this project proposes a new method to predict election results, based on Neuropolitics’ emotional strategies theory. By applying the Design Science Research Methodology (DSRM), one of the most used methodologies in research projects, the goal is to categorize tweets shared by eight of the main candidates to Brazil’s Presidency during the period of January 1st until October 6th of 2018, according to their emotions. In order to achieve this, many techniques of text mining (one of many areas of data mining) were applied and evaluated, such as: data acquisition through a web scraper, text pre- processing with the use of different tools, classification (based on the use of dictionaries as well as six different machine learning algorithms) and even visually presenting the results. For building the classification model, it was applied machine learning’s Naïve-Bayes Algorithm, which makes this work one of the firsts in Brazil to use machine learning techniques in electoral predictability. With it, the available tweets were classified into three different emotions: positive, negative and neutral. The results obtained with this work were preliminary and non-conclusive about its capability of predicting elections. However, one was able to differentiate each candidate’s emotional strategies, which showed relation to events (such as breaking news) that occurred during the electoral period, thus showing that the Neuropolitcs’ theory applied does have influence in campaigns and that the classification model built is valid to evaluate this theory. Therefore, this work presents future perspectives for significant contributions in electoral predictability based on the use of machine learning techniques. |
Description: | TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação. |
URI: | https://repositorio.ufsc.br/handle/123456789/200018 |
Date: | 2018 |
Files | Size | Format | View |
---|---|---|---|
PFC Pedro Casali Guedes_2018-2.pdf | 8.398Mb |
View/ |