Classificação de manchetes de cunho violento por meio de mineração de texto.

Battiston, Tiago

Classificação de manchetes de cunho violento por meio de mineração de texto.

DSpace Repository

A- A A+

Classificação de manchetes de cunho violento por meio de mineração de texto.

Show simple item record

dc.contributor	Universidade Federal de Santa Catarina.	pt_BR
dc.contributor.advisor	Urdaneta, Hugo Lara
dc.contributor.author	Battiston, Tiago
dc.date.accessioned	2025-12-18T23:18:34Z
dc.date.available	2025-12-18T23:18:34Z
dc.date.issued	2025-12-16
dc.identifier.uri	https://repositorio.ufsc.br/handle/123456789/271510
dc.description	TCC (graduação) - Universidade Federal de Santa Catarina, Campus Blumenau, Engenharia de Controle e Automação.	pt_BR
dc.description.abstract	A crescente disseminação de conteúdos violentos nos meios digitais impacta diretamente a percepção social de segurança. Este trabalho propõe uma solução baseada em técnicas de Processamento de Linguagem Natural (PLN) e Aprendizado de Máquina (AM) para a identificação automática de manchetes violentas em portais de notícias. Para isso, desenvolveu-se um algoritmo de web scraping que coletou 20 mil notícias, das quais 5.000 foram analisadas manualmente para compor a base de treinamento. Após etapas de pré-processamento, vetorização por TF-IDF e balanceamento de dados, treinou-se um classificador Multinomial Naive Bayes, para a identificação de notícias violentas, que apresentou acurácia de 86% e métricas consistentes, como precisão de 91%, recall de 86% e F1-score de 88%. A aplicação prática do modelo confirmou sua viabilidade para cenários reais, abrindo perspectivas para futuras melhorias, como inclusão de subcategorias e integração em ferramentas de filtragem de conteúdo.	pt_BR
dc.description.abstract	The increasing dissemination of violent content in digital media directly impacts the social perception of security. This work proposes a solution based on Natural Language Processing (NLP) and Machine Learning (ML) techniques for the automatic identification of violent headlines in news portals. To achieve this, an algorithm for web scraping was developed, which collected 20,000 news articles, of which 5,000 were manually analyzed to compose the training dataset. After preprocessing steps, TF-IDF vectorization, and data balancing, a Multinomial Naive Bayes classifier was trained for the identification of violent news, achieving an accuracy of 86% and consistent metrics, such as precision of 91%, recall of 86%, and F1-score of 88%. The practical application of the model confirmed its feasibility for real-world scenarios, opening perspectives for future improvements, such as the inclusion of subcategories and integration into content filtering tools.	pt_BR
dc.format.extent	42 f.	pt_BR
dc.language.iso	por	pt_BR
dc.publisher	Blumenau, SC.	pt_BR
dc.rights	Open Access.	en
dc.subject	Machine-Learning	pt_BR
dc.subject	multinomial-naive-bayes	pt_BR
dc.subject	Notícias	pt_BR
dc.subject	Violência	pt_BR
dc.subject	text-classification	pt_BR
dc.title	Classificação de manchetes de cunho violento por meio de mineração de texto.	pt_BR
dc.type	TCCgrad	pt_BR

Files in this item

Files	Size	Format	View	Description
TCC Tiago Battiston.pdf	1.988Mb	PDF	View/Open	TCC

Classificação de manchetes de cunho violento por meio de mineração de texto.

DSpace Repository

Classificação de manchetes de cunho violento por meio de mineração de texto.

Files in this item

This item appears in the following Collection(s)

Search DSpace

Browse

All of DSpace

This Collection

My Account

Statistics

Compartilhar