Análise da resiliência do modelo visão-ação ACT a mudanças visuais em tarefas de manipulação
Show simple item record
dc.contributor |
Universidade Federal de Santa Catarina. |
pt_BR |
dc.contributor.advisor |
Weihmann, Lucas Weihmann |
|
dc.contributor.author |
Girardi, João Pedro |
|
dc.date.accessioned |
2025-07-09T20:16:00Z |
|
dc.date.available |
2025-07-09T20:16:00Z |
|
dc.date.issued |
2025-06-30 |
|
dc.identifier.uri |
https://repositorio.ufsc.br/handle/123456789/266114 |
|
dc.description |
TCC (graduação) - Universidade Federal de Santa Catarina, Campus Joinville, Engenharia Mecatrônica. |
pt_BR |
dc.description.abstract |
Modelos de visão-ação representam uma alternativa promissora aos métodos
tradicionais de programação robótica, porém enfrentam desafios significativos de
generalização quando expostos a variações ambientais. Esta pesquisa analisou
sistematicamente a robustez do Action Chunking Transformer (ACT) em tarefas de
manipulação bimanual sob condições visuais variadas. O estudo objetivou quantificar o
impacto de técnicas de data augmentation na capacidade de generalização do modelo
frente a alterações de iluminação, cores de objetos e superfícies. Implementou-se
uma plataforma experimental com robôs SAM de 7 DoF, sistema de teleoperação
e configuração multi-câmera. A coleta de dados compreendeu 54 episódios de
demonstração da tarefa de dobrar flanelas, gerando dois datasets: baseline homogêneo
e com variações ambientais controladas. Os modelos foram treinados por 100.000
passos utilizando transfer learning com backbone ResNet18 pré-treinado. A avaliação
incluiu 24 testes com métricas de taxa de sucesso, eficiência temporal e análise de
falhas. O modelo com diversificação de dados demonstrou desempenho superior em
todas as métricas, alcançando 54,17% de sucesso completo contra 4,17% do modelo
base. Notavelmente, o sistema manteve 100% de eficácia em cenários com todas
as variáveis inéditas simultaneamente, indicando aprendizado de representações
verdadeiramente invariantes. A análise de progressão sequencial revelou que as
falhas concentram-se predominantemente na etapa inicial (70,8% de sucesso), com
taxa condicional de aproximadamente 88% nas etapas subsequentes. Os resultados
confirmam que a exposição sistemática a variações durante o treinamento possibilita o
desenvolvimento de políticas robustas, estabelecendo diretrizes para implementação
prática de sistemas robóticos adaptativos. |
pt_BR |
dc.format.extent |
76 f. |
pt_BR |
dc.language.iso |
por |
pt_BR |
dc.publisher |
Joinville, SC. |
pt_BR |
dc.rights |
Open Access. |
en |
dc.subject |
Action Chunking Transformer |
pt_BR |
dc.subject |
data augmentation |
pt_BR |
dc.subject |
teleoperação |
pt_BR |
dc.subject |
aprendizado por imitação |
pt_BR |
dc.subject |
robótica bimanual |
pt_BR |
dc.title |
Análise da resiliência do modelo visão-ação ACT a mudanças visuais em tarefas de manipulação |
pt_BR |
dc.type |
TCCgrad |
pt_BR |
Files in this item
This item appears in the following Collection(s)
Show simple item record
Search DSpace
Browse
-
All of DSpace
-
This Collection
My Account
Statistics
Compartilhar