Title: | Neuroevolutionary architecture search for facial expression recognition |
Author: | Pinheiro, Leonardo Antonio |
Abstract: |
O reconhecimento de expressão facial tem sido uma área ativa com aplicações para resolução de tarefas em diversos campos como medicina, psicologia, pedagogia e também para interação humano-computador. Para resolver esta tarefa, redes neurais convolucionais com técnicas de visão computacional para pré-processamento são as abordagens mais comuns. Além disso, nos últimos anos, a pesquisa reconhecimento de expressão facial passou de condições controladas em laboratório para condições desafiadoras na natureza. Recentemente, estudos utilizando algoritmos genéticos para atribuir automaticamente os melhores parâmetros à redes neurais convolucionais obtiveram melhores resultados do que aqueles feitos manualmente em tarefas de classificação de imagens utilizando as bases de dados CIFAR-10 e CIFAR-100. A abordagem utiliza parâmetros aleatórios para gerar arquiteturas redes neurais convolucionais, e alcança uma arquitetura competitiva em relação ao estado da arte em reconhecimento de expressões faciais. Nossa abordagem usa três dos principais conjuntos de dados para reconhecimento de expressões faciais, a saber: JAFFe, CK+ e AffectNet. O uso de um conjunto de dados não laboratorial como o AffectNet é relevante porque os ruídos da imagem se assemelham ao ambiente real. A metaheurística proposta nesta dissertação de mestrado superou os resultados do estado da arte para o conjunto de dados AffectNet. Abstract: Facial Expression Recognition (FER) has been an active field with applications to solve tasks in several areas such as medicine, psychology, pedagogy and also for human-computer interaction. To solve this task, convolutional neural networks (CNN) with computer vision techniques for pre-processing are the most common approaches. In addition, in the last years, FER research has transitioned from laboratory-controlled to challenging in-the-wild conditions. Recently, studies using genetic algorithms (GA) to automatically assign the best parameters to CNN have obtained better results than those manually-designed in image classification tasks using the CIFAR-10 and CIFAR-100 databases. Using random parameters to generate CNN architectures, applying a competitive architecture compared to state of the art in facial expression recognition. Our approach uses three of the main datasets for facial expression recognition, namely: JAFFe, CK+, and AffectNet. The use of a non-laboratory dataset such as AffectNet is relevant because the image noises resemble the real environment. The metaheuristic proposed in this master's thesis surpassed the state-of-the-art results for the AffectNet dataset. |
Description: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2022. |
URI: | https://repositorio.ufsc.br/handle/123456789/236075 |
Date: | 2022 |
Files | Size | Format | View |
---|---|---|---|
PGCC1216-D.pdf | 1.431Mb |
View/ |