|
Abstract:
|
A detecção de desalinhamentos em máquinas rotativas é essencial para a manutenção preditiva, devido ao
impacto dessa falha na produtividade e na durabilidade dos componentes. Este trabalho explorou métodos
de aprendizado de máquina aplicados à análise de sinais de vibração para classificar estados de alinhamento
e desalinhamento. Dados foram coletados usando uma bancada de simulação de falhas em máquinas
rotativas da SpectraQuest, considerando variações de acoplamento, velocidade de rotação e intensidade de
defeito para simular condições saudáveis e desalinhamentos paralelos e angulares. Acelômetros triaxiais
foram posicionados nos mancais de rolamento e os sinais de vibração foram medidos. Foram extraídas
features nos domínios do tempo, orbital e de frequência para alimentar algoritmos de classificação, incluindo
Regressão Logística, SVM, Floresta Aleatória e XGBoost. A otimização dos hiperparâmetros foi feita
com Stratified Group K-Fold com a ROC AUC (área abaixo da curva ROC) como métrica de avaliação.
Esses modelos foram treinados e testados em duas configurações de amostragem: a primeira com dados
de vibração em direções diferentes da mesma medição em amostras separadas, resultando em 3600
amostras de 23 features, classificando as amostras utilizando dados uniaxiais, e a segunda com os eixos
dos acelerômetros da mesma medição combinados na mesma amostra, utilizando a informação triaxial
para a classificação, resultando em 1200 asmotras de 69 features, sendo que as amostras combinadas
apresentaram melhor desempenho e foram adotadas para as análises subsequentes. A divisão de treino
e teste foi aleatória, com 75% e %, respectivamente. A comparação dos modelos foi realizada com as
métricas ROC AUC, acurácia balanceada, acurácia e taxa de falsos positivos para um threshold de 90%
de verdadeiros positivos. Inicialmente, o desempenho de teste apresentou o melhor desempenho com o
XGBoost, alcançando uma ROC AUC de 0,80 e acurácia balanceada de 0,52 com todas as features. Para
otimizar o desempenho, aplicou-se seleção de features com base em valores de SHAP (SHapley Additive
exPlanations), identificando as features mais relevantes. Os modelos foram então retreinados com diferentes
conjuntos de features. As features de órbita e estatísticas, isoladamente, mostraram-se insuficientes para a
detecção, resultando em métricas abaixo da média comparado ao uso de todas as features. As features de
frequência demonstraram-se mais influentes, com desempenho semelhante ao modelo completo. O melhor
resultado foi obtido utilizando as 20 features mais importantes, combinando features dos domínios de
frequência, órbita e tempo, indicando forte interatividade entre as features e atingindo ROC AUC de 0,90
e taxa de falsos positivos de 0,37 para o threshold definido. Após a seleção de features, foram criados três
subconjuntos de dados para o treino e teste das amostras: geral, desalinhamento paralelo e desalinhamento
angular. Não houve diferenças significativas de desempenho entre os três conjuntos de dados ao utilizar as
20 features mais relevantes. Observou-se uma alta taxa de falsos positivos, com frequentes classificações
incorretas de dados saudáveis como desalinhados. |