Desenvolvimento de um módulo para reconhecimento e síntese de fala em grandes modelos de línguagem

DSpace Repository

Title:	Desenvolvimento de um módulo para reconhecimento e síntese de fala em grandes modelos de línguagem
Author:	Camargo, João
Abstract:	Este trabalho tem como objetivo o desenvolvimento de um módulo multimodal com capacidades de reconhecimento automático e síntese de fala, com o intuito de ser facilmente acoplado em sistemas de processamento de linguagem natural já existentes. De modo a escolher um sistema de reconhecimento de fala adequado, foram realizados experimentos sobre modelos bases disponíveis, entre os modelos testados, o modelo Whisper-Large-V3 se demonstrou o melhor para ASR português. Subsequentemente, foi realizado uma etapa de ajuste fino sobre o modelo Whisper, melhorando sua taxa de erros por palavra de 7,4% para 5,00%. O modelo ajustado foi então utilizado em conjunto com o sistema de TTS Bark para criação de um módulo de interação por fala com um modelo Llama3-Instruct.
Description:	TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Ciências da Computação.
URI:	https://repositorio.ufsc.br/handle/123456789/266468
Date:	2025-07-08

Files	Size	Format	View	Description
monografia_final.pdf	2.223Mb	PDF	View/Open	TCC