Reconhecimento de emoções através da fala utilizando redes neurais
Show simple item record
dc.contributor |
Universidade Federal de Santa Catarina |
pt_BR |
dc.contributor.advisor |
Roisenberg, Mauro |
|
dc.contributor.author |
Souza, Renato Manoel de |
|
dc.date.accessioned |
2020-12-08T20:59:39Z |
|
dc.date.available |
2020-12-08T20:59:39Z |
|
dc.date.issued |
2020-11-13 |
|
dc.identifier.uri |
https://repositorio.ufsc.br/handle/123456789/218146 |
|
dc.description |
TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação. |
pt_BR |
dc.description.abstract |
A inteligência artificial vem demonstrando nos últimos anos resultados que podem auxiliar na solução de diversos problemas que com as tecnologias existentes ainda não são passíveis de solução. Devido esse fato, uma das áreas que podem utilizar-se da inteligência artificial é o reconhecimento de emoções através da fala, garantindo a aplicação real desses sistemas para facilitar e democratizar o acesso a esse tipo de tecnologia. O atendimento ao cliente será personalizado, com bots identificando o humor do cliente ao fazer um atendimento, podendo redirecionar para um atendimento humano caso notado um estresse na fala. Centrais de atendimento de seguradoras e serviços de emergência, principalmente, serão impactados positivamente com o reconhecimento de emoções.
Este trabalho apresenta a Recurrent Neural Network(RNN)-Gated Recurrent Unit(GRU) e a Convolutional Neural Network(CNN) para classificar emoções através da fala que tiveram o melhor desempenho na etapa de experimentos. Para treinar esses modelos utilizou-se o conjunto de dados Ryerson Audio-Visual Database of Emotional Speech and Song(RAVDESS), permitindo construir um ambiente para fazer a avaliação e testes. A avaliação de um modelo treinado na língua inglesa que reconhece áudios da língua portuguesa apresentou uma precisão de aproximadamente 42%, sendo considerado insatisfatório para um classificador. As principais características que foram identificadas como responsável pelo desempenho foram, o viés da classificação sem validação, as características do conjunto de amostras e a falta do tratamento de ruído.
A rede neural que apresentou a melhor precisão foi RNN-GRU com 79.69% utilizando uma técnica para aumentar o tamanho do conjunto de dados através da operação de transformação alongamento(stretch). |
pt_BR |
dc.format.extent |
113 f. |
pt_BR |
dc.language.iso |
pt_BR |
pt_BR |
dc.publisher |
Florianópolis, SC. |
pt_BR |
dc.rights |
Open Access |
|
dc.subject |
Redes neurais |
pt_BR |
dc.subject |
Reconhecimento de emoções |
pt_BR |
dc.subject |
Fala |
pt_BR |
dc.subject |
Voz |
pt_BR |
dc.title |
Reconhecimento de emoções através da fala utilizando redes neurais |
pt_BR |
dc.type |
TCCgrad |
pt_BR |
Files in this item
This item appears in the following Collection(s)
Show simple item record
Search DSpace
Browse
-
All of DSpace
-
This Collection
My Account
Statistics
Compartilhar