Avaliação do Uso de Metalabels na Chain para Melhorar o Desempenho do Algoritmo Ensemble of Classifier Chains (ECC)

DSpace Repository

A- A A+

Avaliação do Uso de Metalabels na Chain para Melhorar o Desempenho do Algoritmo Ensemble of Classifier Chains (ECC)

Show full item record

Title: Avaliação do Uso de Metalabels na Chain para Melhorar o Desempenho do Algoritmo Ensemble of Classifier Chains (ECC)
Author: Schmitt, Leonardo dos Santos
Abstract: Problemas de classificação são comuns no estudo do aprendizado de máquina, especial- mente em situações em que é necessário atribuir múltiplos rótulos a uma única instância. Nesse contexto, destaca-se a classificação multirrótulo, em inglês Multi-label Classification (MLC), na qual instâncias podem estar associadas a diversos rótulos, sendo aplicada em áreas como categorização de músicas, identificação de funções proteicas e reconhecimento de imagens. Diversas abordagens têm sido propostas para resolver problemas de MLC, sendo o conjunto de classificadores em cadeia, em inglês Ensemble of Classifier Chains (ECC), uma das técnicas utilizadas. Pesquisadores têm desenvolvido variações do ECC com o objetivo de melhorar os resultados, seja otimizando a ordem dos classificadores na cadeia, seja reduzindo o número de rótulos no conjunto de dados. Diferentemente de abordagens anteriores, este trabalho tem como objetivo inserir metalabels, combinações de dois rótulos derivados de medidas de similaridade, no ECC e investigar se a presença desses metalabels, bem como a ordem em que são inseridos na cadeia, influencia o desempenho preditivo. Por fim, são apresentados os resultados obtidos nas simulações realizadas, avaliados por oito métricas amplamente utilizadas em problemas multirrótulo: perda de Hamming, F1 macro, F1 micro, acurácia de subconjunto, AUC macro, AUC micro, AUPRC macro e AU- PRC micro. Os experimentos mostram que a abordagem proposta proporciona melhorias consistentes em diversas dessas medidas.Multi-label classification (MLC) problems, in which instances may be associated with multiple labels, are common in machine learning applications such as music categorization, protein function identification, and image recognition. Several approaches have been pro- posed to address MLC problems, and the Ensemble of Classifier Chains (ECC) is one of the methods frequently adopted. Researchers have developed variations of ECC with the aim of improving predictive performance, either by optimizing the label ordering within the chain or by reducing the number of labels in the dataset. Unlike previous approaches, this work introduces metalabels pairs of labels combined based on similarity measures into the ECC framework and investigates whether the presence of these metalabels, as well as the position in which they are inserted, affects predictive performance. Finally, the results obtained from the simulations, evaluated using eight widely adopted multi-label metrics: Hamming-Loss, Macro-F1, Micro-F1, Subset Accuracy, Macro-AUC, Micro-AUC, Macro-AUPRC, and Micro-AUPRC, show that the proposed approach yields consistent improvements across several of these measures.
Description: TCC (graduação) - Universidade Federal de Santa Catarina, Campus Blumenau, Engenharia de Controle e Automação.
URI: https://repositorio.ufsc.br/handle/123456789/271276
Date: 2025-12-03


Files in this item

Files Size Format View Description
TCCLeonardo.pdf 5.921Mb PDF View/Open TCC

This item appears in the following Collection(s)

Show full item record

Search DSpace


Browse

My Account

Statistics

Compartilhar