CheckBERT: um sistema de identificação de informações falsas através da comparação semântica de sentenças com notícias de portais jornalísticos de língua inglesa utilizando Google BERT
Show simple item record
dc.contributor |
Universidade Federal de Santa Catarina. |
pt_BR |
dc.contributor.advisor |
Dorneles, Carina Friedrich |
|
dc.contributor.author |
Neves, Gabriel Medeiros das |
|
dc.date.accessioned |
2023-07-12T14:22:27Z |
|
dc.date.available |
2023-07-12T14:22:27Z |
|
dc.date.issued |
2023-06-30 |
|
dc.identifier.uri |
https://repositorio.ufsc.br/handle/123456789/248713 |
|
dc.description |
TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Sistemas de Informação. |
pt_BR |
dc.description.abstract |
Em uma pesquisa realizada pela Kaspersky em parceria com a CORPA entre dezembro
de 2019 e janeiro de 2020, foi estimado que, em média, 62% dos brasileiros não conseguem
identificar notícias falsas na internet. Mais recentemente, em julho de 2021, a pesquisa
realizada pelos institutos IDEIA e Vero constatou que 79% dos brasileiros entrevistados
consideram a disseminação de noticias falsas um problema grave. Diante desse contexto, o
presente trabalho propõe a construção de um sistema capaz de identificar informações falsas
em sentenças textuais, por meio da comparação das sentenças com o conteúdo de artigos
publicados em portais de notícia de língua inglesa. Essa comparação é realizada através
da análise de similaridade semântica entre a sentença fornecida e os artigos de notícia
previamente coletados pelo sistema, através de um modelo profundo de processamento
de linguagem natural chamado Google BERT. Ao final do projeto, espera-se entregar um
software capaz de realizar esse tipo de análise de maneira totalmente automatizada, a fim
de facilitar o procedimento de identificação de notícias falsas, que ainda requer intervenção
manual em todas as suas etapas. |
pt_BR |
dc.description.abstract |
In a survey conducted between December 2019 and January 2020 by Kaspersky, in part-
nership with CORPA, it was estimated that, on average, 62% of the Brazilians are not
able to identify fake news on the internet. More recently, in July 2021, a survey carried
out by IDEIA and Vero institutes had 79% of the interviewed Brazilians affirming that
they consider the dissemination of fake news a severe problem. In this regard, the present
work proposes the implementation of a system capable of identifying false information in
textual sentences by comparing those sentences with the content of published articles on
USA news portals. This comparison process is performed through the semantic similar-
ity analysis between the given sentence and previously collected news articles by a deep
Natural Language Processing model called Google BERT. At the end of the project, it
is expected that the delivered software will be able to execute the described analysis in
a fully automated manner, in order to facilitate the procedure for identifying fake news,
which still requires manual intervention in all its steps. |
pt_BR |
dc.format.extent |
141 f. |
pt_BR |
dc.language.iso |
pt_BR |
pt_BR |
dc.publisher |
Florianópolis, SC. |
pt_BR |
dc.rights |
Open Access. |
en |
dc.subject |
Google BERT |
pt_BR |
dc.subject |
Processamento de Linguagem Natural |
pt_BR |
dc.subject |
Web Scraping |
pt_BR |
dc.subject |
NLP |
pt_BR |
dc.title |
CheckBERT: um sistema de identificação de informações falsas através da comparação semântica de sentenças com notícias de portais jornalísticos de língua inglesa utilizando Google BERT |
pt_BR |
dc.type |
TCCgrad |
pt_BR |
Files in this item
This item appears in the following Collection(s)
Show simple item record
Search DSpace
Browse
-
All of DSpace
-
This Collection
My Account
Statistics
Compartilhar