Title: | Detecção de notícias falsas utilizando aprendizado de máquina |
Author: | Battisti, Fernando |
Abstract: |
O PFC foi realizado no DAS/UFSC. Atualmente, devido à popularização da internet e a facilidade de acesso às informações, as notícias falsas propagam-se rapidamente, tornando-se uma preocupação para a sociedade. O objetivo deste PFC é obter um modelo de aprendizado de máquina para detecção de notícias falsas. Este estudo contempla o desenvolvimento de dois modelos de classificação, um utilizando regressão logística e outro redes neurais recorrentes do tipo LSTM. Ambos foram treinados e avaliados utilizando uma base de dados de notícias falsas e verdadeiras contendo 7200 amostras em Língua Portuguesa. O pré-processamento de dados foi realizado levando em consideração o modelo de aprendizado de máquina em questão. Para melhorar o desempenho, diversos experimentos foram elaborados com variações nos valores dos hiperparâmetros do modelo. Os resultados foram comparados através das métricas acurácia, precisão, recall e F1-score. O algoritmo regressão logística mostrou-se melhor que rede neural do tipo LSTM, obtendo um valor de F1-score de 92,8%. Por fim, foi desenvolvido uma interface web, a qual é possível realizar a checagem de uma notícia através da utilização do modelo treinado no back-end. This PFC was developed at DAS/UFSC. Currently, due to the popularization of the internet and the ease of access to information, fake news is spreading rapidly, becoming a concern for society. The purpose of this work is to obtain a machine learning model for fake news detection. This study contemplates the development of two classification models, one using logistic regression and the other recurrent neural networks of type LSTM. Both were trained and evaluated using data of fake and true news containing 7200 samples in Portuguese. Data pre-processing was performed taking into account the machine learning model in question. To improve performance, several experiments were carried out with variations in the values of the model’s hyperparameters. Results were compared using the metrics accuracy, precision, recall and F1-score. Logistic regression algorithm proved to be better than LSTM neural network, obtaining a value of 92,8% in F1-score. Finally, a web interface was developed using the trained model on the back-end where it is possible to check a news. |
Description: | TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação. |
URI: | https://repositorio.ufsc.br/handle/123456789/217232 |
Date: | 2020-10-20 |
Files | Size | Format | View | Description |
---|---|---|---|---|
TCC.pdf | 8.838Mb |
View/ |
TCC |