Reconhecimento de Fala Utilizando Aprendizado Hierárquico Multitarefa

DSpace Repository

A- A A+

Reconhecimento de Fala Utilizando Aprendizado Hierárquico Multitarefa

Show full item record

Title: Reconhecimento de Fala Utilizando Aprendizado Hierárquico Multitarefa
Author: Schlichting, André Lucas
Abstract: Neste trabalho, foi investigada a incorporação de informações fonéticas no processo de treinamento de um sistema de reconhecimento automático de fala (ASR) utilizando aprendizado hierárquico multitarefa, com foco em um encoder do tipo Zipformer. A partir de um modelo baseline composto por este encoder e um decoder RNN-T (Recurrent Neural Network Transducer) treinado conjuntamente com um decoder CTC (Connectionist Temporal Classification), foi proposta uma arquitetura estendida que integra informações fonéticas canônicas em camadas intermediárias do Zipformer através de um decodificador CTC adicional. Experimentos em diversos conjuntos de teste revelaram uma redução consistente na taxa de erro de palavras (Word Error Rate - WER) quando as informações fonéticas foram incorporadas na segunda camada do encoder. A incorporação em camadas superiores ou na primeira resultou, em geral, no aumento da taxa de erro. Os resultados abrem caminho para explorar outras formas de representações fonéticas auxiliares em tarefas que podem beneficiar o treinamento de sistemas ASR com uma arquitetura Zipformer de encoder.
Description: TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Engenharia Eletrônica.
URI: https://repositorio.ufsc.br/handle/123456789/261930
Date: 2024-12-12


Files in this item

Files Size Format View Description
TCC_ANDRELUCASSCHLICHTING.pdf 5.198Mb PDF View/Open TCC

This item appears in the following Collection(s)

Show full item record

Search DSpace


Browse

My Account

Statistics

Compartilhar