Title: | Fine-tuning do MLLM LLaMA para a classificação de lesões de pele e geração de laudos |
Author: | Evaristo, Eric Fernandes |
Abstract: |
Lesões de pele podem ser um indicador de diversas doenças, incluindo as graves, como o câncer de pele. A detecção precoce dessas lesões é fundamental para o tratamento e a cura da doença. No entanto, o diagnóstico preciso só pode ser feito por profissionais qualificados, como dermatologistas. Uma parte do atendimento de atenção primária no Brasil é feita por Agentes Comunitários de Saúde (ACS). Estes profissionais estão em contato direto com a população, porém, não são qualificados para realizar a triagem de casos de lesões de pele. Considerando este cenário, uma ferramenta capaz de classificar lesões de pele e também fornecer pré-diagnósticos e recomendações seria de grande utilidade. Multimodal Large Language Models (MLLMs) possuem as capacidades necessárias para o desenvolvimento de uma ferramenta como esta, pois podem classificar imagens e gerar descrições textuais com base no seu conteúdo. Além disso, estes modelos podem ser adaptados para tarefas específicas através de fine-tuning. Com o objetivo de avaliar o uso de um MLLM para a classificação de lesões de pele e a geração de laudos, foi realizado neste trabalho o fine-tuning do Large Language Model Meta AI (LLaMA) 3.2 11B com as técnicas Quantized Low Rank Adaptation (QLoRA) e Low-Rank Adaptation (LoRA), ambas baseadas em Parameter-Efficient Fine-Tuning (PEFT). O desenvolvimento foi realizado em duas etapas. Na primeira, o conjunto de imagens de dermatoscopia Human Against Machine with 10000 training images (HAM10000) foi utilizado no fine-tuning do modelo para apenas classificar lesões de pele. Nesta fase, o melhor modelo foi treinado com QLoRA e obteve uma acurácia de 87,4%. Na etapa final, um conjunto de imagens de aproximação, proveniente do Sistema Integrado Catarinense de Telemedicina e Telessaúde (STT/SC), foi utilizado no fine-tuning para a classificação de lesões e geração de laudos. O modelo final treinado com QLoRA e apresentou uma acurácia de 45,2%, enquanto o modelo com LoRA obteve 44,5%. O baixo desempenho dos modelos finais na classificação pode ser explicado por inconsistências no conjunto de dados. Skin lesions can be an indicator of several diseases, including serious ones like skin cancer. The early detection of these lesions is fundamental for the treatment and cure of the disease. However, an accurate diagnosis can only be made by qualified professionals, such as dermatologists. Part of the primary care service in Brazil is carried out by Agentes Comunitários de Saúde (ACS). These professionals are in direct contact with the population, however, they are not qualified to perform the screening of skin lesion cases. Considering this scenario, a tool capable of classifying skin lesions and also providing pre-diagnoses and recommendations would be of great use. Multimodal Large Language Models (MLLMs) have the necessary capabilities for the development of a tool like this, as they can classify images and generate textual descriptions based on their content. Furthermore, these models can be adapted for specific tasks through fine-tuning. With the objective of evaluating the use of an MLLM for the classification of skin lesions and the generation of reports, this work carried out the fine-tuning of Large Language Model Meta AI (LLaMA) 3.2 11B with the Quantized Low Rank Adaptation (QLoRA) and Low-Rank Adaptation (LoRA) techniques, both based on Parameter-Efficient Fine-Tuning (PEFT). The development was carried out in two stages. In the first, the Human Against Machine with 10000 training images (HAM10000) dermatoscopy image dataset was used in the fine-tuning of the model to only classify skin lesions. In this phase, the best model was trained with LoRA and obtained an accuracy of 86.2%. In the final stage, a set of close-up images, from the Sistema Integrado Catarinense de Telemedicina e Telessaúde (STT/SC), was used in the fine-tuning for the classification of lesions and generation of reports. The final model trained with QLoRA presented an accuracy of 45.2%, while the model with LoRA obtained 44.5%. The low performance of the final models in the classification can be explained by inconsistencies in the dataset. |
Description: | TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Ciências da Computação. |
URI: | https://repositorio.ufsc.br/handle/123456789/266618 |
Date: | 2025-07-10 |
Files | Size | Format | View | Description |
---|---|---|---|---|
TCC - Final.pdf | 11.02Mb |
View/ |
TCC |