Title: | CheckBERT: um sistema de identificação de informações falsas através da comparação semântica de sentenças com notícias de portais jornalísticos de língua inglesa utilizando Google BERT |
Author: | Neves, Gabriel Medeiros das |
Abstract: |
Em uma pesquisa realizada pela Kaspersky em parceria com a CORPA entre dezembro de 2019 e janeiro de 2020, foi estimado que, em média, 62% dos brasileiros não conseguem identificar notícias falsas na internet. Mais recentemente, em julho de 2021, a pesquisa realizada pelos institutos IDEIA e Vero constatou que 79% dos brasileiros entrevistados consideram a disseminação de noticias falsas um problema grave. Diante desse contexto, o presente trabalho propõe a construção de um sistema capaz de identificar informações falsas em sentenças textuais, por meio da comparação das sentenças com o conteúdo de artigos publicados em portais de notícia de língua inglesa. Essa comparação é realizada através da análise de similaridade semântica entre a sentença fornecida e os artigos de notícia previamente coletados pelo sistema, através de um modelo profundo de processamento de linguagem natural chamado Google BERT. Ao final do projeto, espera-se entregar um software capaz de realizar esse tipo de análise de maneira totalmente automatizada, a fim de facilitar o procedimento de identificação de notícias falsas, que ainda requer intervenção manual em todas as suas etapas. In a survey conducted between December 2019 and January 2020 by Kaspersky, in part- nership with CORPA, it was estimated that, on average, 62% of the Brazilians are not able to identify fake news on the internet. More recently, in July 2021, a survey carried out by IDEIA and Vero institutes had 79% of the interviewed Brazilians affirming that they consider the dissemination of fake news a severe problem. In this regard, the present work proposes the implementation of a system capable of identifying false information in textual sentences by comparing those sentences with the content of published articles on USA news portals. This comparison process is performed through the semantic similar- ity analysis between the given sentence and previously collected news articles by a deep Natural Language Processing model called Google BERT. At the end of the project, it is expected that the delivered software will be able to execute the described analysis in a fully automated manner, in order to facilitate the procedure for identifying fake news, which still requires manual intervention in all its steps. |
Description: | TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Sistemas de Informação. |
URI: | https://repositorio.ufsc.br/handle/123456789/248713 |
Date: | 2023-06-30 |
Files | Size | Format | View | Description |
---|---|---|---|---|
TCC-Gabriel-Medeiros-das-Neves-final.pdf | 2.982Mb |
View/ |
TCC |