Title: | Improving misinformation detection using multiple aspect trajectories classification techniques |
Author: | Sanchez, Juan Pablo Chavarro |
Abstract: |
A proliferação de notícias falsas e desinformação nas redes sociais representa uma ameaça significativa à integridade social. Embora existam abordagens como a análise automatizada de conteúdo e a detecção baseada em IA para mitigar esse problema, esses métodos enfrentam desafios devido à heterogeneidade dos dados encontrados em plataformas de microblogging e serviços de mensagens instantâneas. Para enfrentar esse desafio, esta dissertação de mestrado introduz uma abordagem inovadora para modelar a disseminação da desinformação como Trajetórias Multiaspecto (MAT). Inspirando-se em definições existentes de difusão da informação e trajetórias multiaspecto, definimos a trajetória da informação disseminada nas redes sociais como uma representação estruturada que captura o movimento da desinformação por meio de interações e padrões de redistribuição. Para validar essa abordagem, selecionamos e adaptamos vários conjuntos de dados de desinformação de diferentes plataformas de redes sociais, incluindo dados textuais e imagéticos. Em seguida, construímos representações baseadas em trajetórias e aplicamos métodos de classificação, comparando seu desempenho com classificadores tradicionais baseados em conteúdo e contexto social. Os resultados demonstram que os métodos baseados em trajetórias oferecem um desempenho competitivo e, frequentemente, superior na detecção de desinformação. Especificamente, foram observadas melhorias significativas em dados de texto curto, como mensagens disseminadas em grupos do WhatsApp, onde os métodos baseados em trajetórias superaram significativamente os modelos baseados em conteúdo. Em outros conjuntos de dados, como aqueles da rede social Weibo e imagens disseminadas no WhatsApp no Brasil e na Índia, os métodos baseados em trajetórias apresentaram desempenho comparável ou ligeiramente superior, destacando a eficácia e a robustez dessa abordagem em diversos cenários. Em conclusão, esta pesquisa demonstra a versatilidade e a eficácia da abordagem MAT para a detecção de desinformação. Foram introduzidos novos conjuntos de dados baseados em trajetórias, ampliada a aplicação de MAT para modelagem da desinformação e desenvolvidos novos métodos de detecção multimodal. Além disso, foi proposto um novo framework para representar a disseminação da informação como MAT. Os resultados mostram que os métodos baseados em trajetórias oferecem um desempenho consistentemente competitivo na detecção de desinformação. Para pesquisas futuras, sugere-se explorar métodos computacionalmente mais eficientes e avaliar essa abordagem em conjuntos de dados multimodais diversificados, ampliando assim sua aplicabilidade e robustez. Abstract: The proliferation of fake news and misinformation on social media poses a significant threat to social integrity. While approaches such as automated content analysis and AI-based detection exist to mitigate this issue, these methods face challenges due to the heterogeneity of data found on microblogging platforms and instant messaging services. To address this challenge, this master's thesis introduces a novel approach to modeling misinformation dissemination as Multi-Aspect Trajectories (MAT). Inspired by existing definitions of information diffusion and multi-aspect trajectories, we define the trajectory of disseminated information on social media as a structured representation that captures the movement of misinformation through interactions and redistribution patterns. To validate this approach, we selected and adapted multiple disinformation datasets from various social media platforms, including both textual and image data. Subsequently, we constructed trajectory-based representations and applied classification methods, comparing their performance with traditional content-based and social context-based classifiers. The results demonstrate that trajectory-based methods offer competitive and often superior performance in disinformation detection. Specifically, significant improvements were observed in short-text data, such as messages disseminated in WhatsApp groups, where trajectory-based methods significantly outperformed content-based models. In other datasets, such as those from the Weibo social network and images disseminated on WhatsApp in Brazil and India, trajectory-based methods showed comparable or slightly superior performance, underscoring the effectiveness and robustness of this approach in diverse scenarios. In conclusion, this research demonstrates the versatility and effectiveness of the MAT approach for disinformation detection. New trajectory-based datasets were introduced, the application of MAT to disinformation modeling was extended, and novel multimodal detection methods were developed. Additionally, a new framework was proposed to represent information dissemination as MAT. The results demonstrate that trajectory-based methods offer consistently competitive performance in disinformation detection. For future research, it is suggested to explore computationally more efficient methods and evaluate this approach on diverse multimodal datasets, thereby expanding its applicability and robustness. |
Description: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2025. |
URI: | https://repositorio.ufsc.br/handle/123456789/266123 |
Date: | 2025 |
Files | Size | Format | View |
---|---|---|---|
PGCC1306-D.pdf | 1022.Kb |
View/ |