Classificação de manchetes de cunho violento por meio de mineração de texto.
Show simple item record
| dc.contributor |
Universidade Federal de Santa Catarina. |
pt_BR |
| dc.contributor.advisor |
Urdaneta, Hugo Lara |
|
| dc.contributor.author |
Battiston, Tiago |
|
| dc.date.accessioned |
2025-12-18T23:18:34Z |
|
| dc.date.available |
2025-12-18T23:18:34Z |
|
| dc.date.issued |
2025-12-16 |
|
| dc.identifier.uri |
https://repositorio.ufsc.br/handle/123456789/271510 |
|
| dc.description |
TCC (graduação) - Universidade Federal de Santa Catarina, Campus Blumenau, Engenharia de Controle e Automação. |
pt_BR |
| dc.description.abstract |
A crescente disseminação de conteúdos violentos nos meios digitais impacta diretamente a percepção social de segurança. Este trabalho propõe uma solução baseada em técnicas de Processamento de Linguagem Natural (PLN) e Aprendizado de Máquina (AM) para a identificação automática de manchetes violentas em portais de notícias. Para isso, desenvolveu-se um algoritmo de web scraping que coletou 20 mil notícias, das quais 5.000 foram analisadas manualmente para compor a base de treinamento. Após etapas de pré-processamento, vetorização por TF-IDF e balanceamento de dados, treinou-se um classificador Multinomial Naive Bayes, para a identificação de notícias violentas, que apresentou acurácia de 86% e métricas consistentes, como precisão de 91%, recall de 86% e F1-score de 88%. A aplicação prática do modelo confirmou sua viabilidade para cenários reais, abrindo perspectivas para futuras melhorias, como inclusão de subcategorias e integração em ferramentas de filtragem de conteúdo. |
pt_BR |
| dc.description.abstract |
The increasing dissemination of violent content in digital media directly impacts the social perception of security. This work proposes a solution based on Natural Language Processing (NLP) and Machine Learning (ML) techniques for the automatic identification of violent headlines in news portals. To achieve this, an algorithm for web scraping was developed, which collected 20,000 news articles, of which 5,000 were manually analyzed to compose the training dataset. After preprocessing steps, TF-IDF vectorization, and data balancing, a Multinomial Naive Bayes classifier was trained for the identification of violent news, achieving an accuracy of 86% and consistent metrics, such as precision of 91%, recall of 86%, and F1-score of 88%. The practical application of the model confirmed its feasibility for real-world scenarios, opening perspectives for future improvements, such as the inclusion of subcategories and integration into content filtering tools. |
pt_BR |
| dc.format.extent |
42 f. |
pt_BR |
| dc.language.iso |
por |
pt_BR |
| dc.publisher |
Blumenau, SC. |
pt_BR |
| dc.rights |
Open Access. |
en |
| dc.subject |
Machine-Learning |
pt_BR |
| dc.subject |
multinomial-naive-bayes |
pt_BR |
| dc.subject |
Notícias |
pt_BR |
| dc.subject |
Violência |
pt_BR |
| dc.subject |
text-classification |
pt_BR |
| dc.title |
Classificação de manchetes de cunho violento por meio de mineração de texto. |
pt_BR |
| dc.type |
TCCgrad |
pt_BR |
Files in this item
This item appears in the following Collection(s)
Show simple item record
Search DSpace
Browse
-
All of DSpace
-
This Collection
My Account
Statistics
Compartilhar