Avaliação do Uso de Metalabels na Chain para Melhorar o Desempenho do Algoritmo Ensemble of Classifier Chains (ECC)

DSpace Repository

A- A A+

Avaliação do Uso de Metalabels na Chain para Melhorar o Desempenho do Algoritmo Ensemble of Classifier Chains (ECC)

Show simple item record

dc.contributor Universidade Federal de Santa Catarina. pt_BR
dc.contributor.advisor Ferrandin, Mauri
dc.contributor.author Schmitt, Leonardo dos Santos
dc.date.accessioned 2025-12-16T12:39:23Z
dc.date.available 2025-12-16T12:39:23Z
dc.date.issued 2025-12-03
dc.identifier.uri https://repositorio.ufsc.br/handle/123456789/271276
dc.description TCC (graduação) - Universidade Federal de Santa Catarina, Campus Blumenau, Engenharia de Controle e Automação. pt_BR
dc.description.abstract Problemas de classificação são comuns no estudo do aprendizado de máquina, especial- mente em situações em que é necessário atribuir múltiplos rótulos a uma única instância. Nesse contexto, destaca-se a classificação multirrótulo, em inglês Multi-label Classification (MLC), na qual instâncias podem estar associadas a diversos rótulos, sendo aplicada em áreas como categorização de músicas, identificação de funções proteicas e reconhecimento de imagens. Diversas abordagens têm sido propostas para resolver problemas de MLC, sendo o conjunto de classificadores em cadeia, em inglês Ensemble of Classifier Chains (ECC), uma das técnicas utilizadas. Pesquisadores têm desenvolvido variações do ECC com o objetivo de melhorar os resultados, seja otimizando a ordem dos classificadores na cadeia, seja reduzindo o número de rótulos no conjunto de dados. Diferentemente de abordagens anteriores, este trabalho tem como objetivo inserir metalabels, combinações de dois rótulos derivados de medidas de similaridade, no ECC e investigar se a presença desses metalabels, bem como a ordem em que são inseridos na cadeia, influencia o desempenho preditivo. Por fim, são apresentados os resultados obtidos nas simulações realizadas, avaliados por oito métricas amplamente utilizadas em problemas multirrótulo: perda de Hamming, F1 macro, F1 micro, acurácia de subconjunto, AUC macro, AUC micro, AUPRC macro e AU- PRC micro. Os experimentos mostram que a abordagem proposta proporciona melhorias consistentes em diversas dessas medidas. pt_BR
dc.description.abstract Multi-label classification (MLC) problems, in which instances may be associated with multiple labels, are common in machine learning applications such as music categorization, protein function identification, and image recognition. Several approaches have been pro- posed to address MLC problems, and the Ensemble of Classifier Chains (ECC) is one of the methods frequently adopted. Researchers have developed variations of ECC with the aim of improving predictive performance, either by optimizing the label ordering within the chain or by reducing the number of labels in the dataset. Unlike previous approaches, this work introduces metalabels pairs of labels combined based on similarity measures into the ECC framework and investigates whether the presence of these metalabels, as well as the position in which they are inserted, affects predictive performance. Finally, the results obtained from the simulations, evaluated using eight widely adopted multi-label metrics: Hamming-Loss, Macro-F1, Micro-F1, Subset Accuracy, Macro-AUC, Micro-AUC, Macro-AUPRC, and Micro-AUPRC, show that the proposed approach yields consistent improvements across several of these measures. pt_BR
dc.language.iso por pt_BR
dc.language.iso eng pt_BR
dc.publisher Blumenau, SC. pt_BR
dc.rights Open Access. en
dc.subject Classificação Multirrótulo pt_BR
dc.subject Metalabels pt_BR
dc.subject Cadeia de Classificadores pt_BR
dc.title Avaliação do Uso de Metalabels na Chain para Melhorar o Desempenho do Algoritmo Ensemble of Classifier Chains (ECC) pt_BR
dc.type TCCgrad pt_BR


Files in this item

Files Size Format View Description
TCCLeonardo.pdf 5.921Mb PDF View/Open TCC

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Browse

My Account

Statistics

Compartilhar