CheckBERT: um sistema de identificação de informações falsas através da comparação semântica de sentenças com notícias de portais jornalísticos de língua inglesa utilizando Google BERT

DSpace Repository

A- A A+

CheckBERT: um sistema de identificação de informações falsas através da comparação semântica de sentenças com notícias de portais jornalísticos de língua inglesa utilizando Google BERT

Show simple item record

dc.contributor Universidade Federal de Santa Catarina. pt_BR
dc.contributor.advisor Dorneles, Carina Friedrich
dc.contributor.author Neves, Gabriel Medeiros das
dc.date.accessioned 2023-07-12T14:22:27Z
dc.date.available 2023-07-12T14:22:27Z
dc.date.issued 2023-06-30
dc.identifier.uri https://repositorio.ufsc.br/handle/123456789/248713
dc.description TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Sistemas de Informação. pt_BR
dc.description.abstract Em uma pesquisa realizada pela Kaspersky em parceria com a CORPA entre dezembro de 2019 e janeiro de 2020, foi estimado que, em média, 62% dos brasileiros não conseguem identificar notícias falsas na internet. Mais recentemente, em julho de 2021, a pesquisa realizada pelos institutos IDEIA e Vero constatou que 79% dos brasileiros entrevistados consideram a disseminação de noticias falsas um problema grave. Diante desse contexto, o presente trabalho propõe a construção de um sistema capaz de identificar informações falsas em sentenças textuais, por meio da comparação das sentenças com o conteúdo de artigos publicados em portais de notícia de língua inglesa. Essa comparação é realizada através da análise de similaridade semântica entre a sentença fornecida e os artigos de notícia previamente coletados pelo sistema, através de um modelo profundo de processamento de linguagem natural chamado Google BERT. Ao final do projeto, espera-se entregar um software capaz de realizar esse tipo de análise de maneira totalmente automatizada, a fim de facilitar o procedimento de identificação de notícias falsas, que ainda requer intervenção manual em todas as suas etapas. pt_BR
dc.description.abstract In a survey conducted between December 2019 and January 2020 by Kaspersky, in part- nership with CORPA, it was estimated that, on average, 62% of the Brazilians are not able to identify fake news on the internet. More recently, in July 2021, a survey carried out by IDEIA and Vero institutes had 79% of the interviewed Brazilians affirming that they consider the dissemination of fake news a severe problem. In this regard, the present work proposes the implementation of a system capable of identifying false information in textual sentences by comparing those sentences with the content of published articles on USA news portals. This comparison process is performed through the semantic similar- ity analysis between the given sentence and previously collected news articles by a deep Natural Language Processing model called Google BERT. At the end of the project, it is expected that the delivered software will be able to execute the described analysis in a fully automated manner, in order to facilitate the procedure for identifying fake news, which still requires manual intervention in all its steps. pt_BR
dc.format.extent 141 f. pt_BR
dc.language.iso pt_BR pt_BR
dc.publisher Florianópolis, SC. pt_BR
dc.rights Open Access. en
dc.subject Google BERT pt_BR
dc.subject Processamento de Linguagem Natural pt_BR
dc.subject Web Scraping pt_BR
dc.subject NLP pt_BR
dc.title CheckBERT: um sistema de identificação de informações falsas através da comparação semântica de sentenças com notícias de portais jornalísticos de língua inglesa utilizando Google BERT pt_BR
dc.type TCCgrad pt_BR


Files in this item

Files Size Format View Description
TCC-Gabriel-Medeiros-das-Neves-final.pdf 2.982Mb PDF View/Open TCC

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Browse

My Account

Statistics

Compartilhar