Desenvolvimento de um módulo para reconhecimento e síntese de fala em grandes modelos de línguagem
Show simple item record
dc.contributor |
Universidade Federal de Santa Catarina. |
pt_BR |
dc.contributor.advisor |
Wangenheim, Aldo |
|
dc.contributor.author |
Camargo, João |
|
dc.date.accessioned |
2025-07-15T01:39:03Z |
|
dc.date.available |
2025-07-15T01:39:03Z |
|
dc.date.issued |
2025-07-08 |
|
dc.identifier.uri |
https://repositorio.ufsc.br/handle/123456789/266468 |
|
dc.description |
TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Ciências da Computação. |
pt_BR |
dc.description.abstract |
Este trabalho tem como objetivo o desenvolvimento de um módulo multimodal com
capacidades de reconhecimento automático e síntese de fala, com o intuito de ser
facilmente acoplado em sistemas de processamento de linguagem natural já existentes.
De modo a escolher um sistema de reconhecimento de fala adequado, foram realizados
experimentos sobre modelos bases disponíveis, entre os modelos testados, o modelo
Whisper-Large-V3 se demonstrou o melhor para ASR português. Subsequentemente,
foi realizado uma etapa de ajuste fino sobre o modelo Whisper, melhorando sua taxa
de erros por palavra de 7,4% para 5,00%. O modelo ajustado foi então utilizado em
conjunto com o sistema de TTS Bark para criação de um módulo de interação por fala
com um modelo Llama3-Instruct. |
pt_BR |
dc.format.extent |
73 |
pt_BR |
dc.language.iso |
por |
pt_BR |
dc.publisher |
Florianópolis, SC. |
pt_BR |
dc.rights |
Open Access. |
|
dc.subject |
Inteligência artificia |
pt_BR |
dc.subject |
Reconhecimento automático de fala |
pt_BR |
dc.subject |
Sistemas multimodais |
pt_BR |
dc.title |
Desenvolvimento de um módulo para reconhecimento e síntese de fala em grandes modelos de línguagem |
pt_BR |
dc.type |
TCCgrad |
pt_BR |
Files in this item
This item appears in the following Collection(s)
Show simple item record
Search DSpace
Browse
-
All of DSpace
-
This Collection
My Account
Statistics
Compartilhar