Classificação de manchetes de cunho violento por meio de mineração de texto.

DSpace Repository

A- A A+

Classificação de manchetes de cunho violento por meio de mineração de texto.

Show simple item record

dc.contributor Universidade Federal de Santa Catarina. pt_BR
dc.contributor.advisor Urdaneta, Hugo Lara
dc.contributor.author Battiston, Tiago
dc.date.accessioned 2025-12-18T23:18:34Z
dc.date.available 2025-12-18T23:18:34Z
dc.date.issued 2025-12-16
dc.identifier.uri https://repositorio.ufsc.br/handle/123456789/271510
dc.description TCC (graduação) - Universidade Federal de Santa Catarina, Campus Blumenau, Engenharia de Controle e Automação. pt_BR
dc.description.abstract A crescente disseminação de conteúdos violentos nos meios digitais impacta diretamente a percepção social de segurança. Este trabalho propõe uma solução baseada em técnicas de Processamento de Linguagem Natural (PLN) e Aprendizado de Máquina (AM) para a identificação automática de manchetes violentas em portais de notícias. Para isso, desenvolveu-se um algoritmo de web scraping que coletou 20 mil notícias, das quais 5.000 foram analisadas manualmente para compor a base de treinamento. Após etapas de pré-processamento, vetorização por TF-IDF e balanceamento de dados, treinou-se um classificador Multinomial Naive Bayes, para a identificação de notícias violentas, que apresentou acurácia de 86% e métricas consistentes, como precisão de 91%, recall de 86% e F1-score de 88%. A aplicação prática do modelo confirmou sua viabilidade para cenários reais, abrindo perspectivas para futuras melhorias, como inclusão de subcategorias e integração em ferramentas de filtragem de conteúdo. pt_BR
dc.description.abstract The increasing dissemination of violent content in digital media directly impacts the social perception of security. This work proposes a solution based on Natural Language Processing (NLP) and Machine Learning (ML) techniques for the automatic identification of violent headlines in news portals. To achieve this, an algorithm for web scraping was developed, which collected 20,000 news articles, of which 5,000 were manually analyzed to compose the training dataset. After preprocessing steps, TF-IDF vectorization, and data balancing, a Multinomial Naive Bayes classifier was trained for the identification of violent news, achieving an accuracy of 86% and consistent metrics, such as precision of 91%, recall of 86%, and F1-score of 88%. The practical application of the model confirmed its feasibility for real-world scenarios, opening perspectives for future improvements, such as the inclusion of subcategories and integration into content filtering tools. pt_BR
dc.format.extent 42 f. pt_BR
dc.language.iso por pt_BR
dc.publisher Blumenau, SC. pt_BR
dc.rights Open Access. en
dc.subject Machine-Learning pt_BR
dc.subject multinomial-naive-bayes pt_BR
dc.subject Notícias pt_BR
dc.subject Violência pt_BR
dc.subject text-classification pt_BR
dc.title Classificação de manchetes de cunho violento por meio de mineração de texto. pt_BR
dc.type TCCgrad pt_BR


Files in this item

Files Size Format View Description
TCC Tiago Battiston.pdf 1.988Mb PDF View/Open TCC

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Browse

My Account

Statistics

Compartilhar