Desenvolvimento de um módulo para reconhecimento e síntese de fala em grandes modelos de línguagem

DSpace Repository

A- A A+

Desenvolvimento de um módulo para reconhecimento e síntese de fala em grandes modelos de línguagem

Show full item record

Title: Desenvolvimento de um módulo para reconhecimento e síntese de fala em grandes modelos de línguagem
Author: Camargo, João
Abstract: Este trabalho tem como objetivo o desenvolvimento de um módulo multimodal com capacidades de reconhecimento automático e síntese de fala, com o intuito de ser facilmente acoplado em sistemas de processamento de linguagem natural já existentes. De modo a escolher um sistema de reconhecimento de fala adequado, foram realizados experimentos sobre modelos bases disponíveis, entre os modelos testados, o modelo Whisper-Large-V3 se demonstrou o melhor para ASR português. Subsequentemente, foi realizado uma etapa de ajuste fino sobre o modelo Whisper, melhorando sua taxa de erros por palavra de 7,4% para 5,00%. O modelo ajustado foi então utilizado em conjunto com o sistema de TTS Bark para criação de um módulo de interação por fala com um modelo Llama3-Instruct.
Description: TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Ciências da Computação.
URI: https://repositorio.ufsc.br/handle/123456789/266468
Date: 2025-07-08


Files in this item

Files Size Format View Description
monografia_final.pdf 2.223Mb PDF View/Open TCC

This item appears in the following Collection(s)

Show full item record

Search DSpace


Browse

My Account

Statistics

Compartilhar