| Title: | Desenvolvimento de método para otimização da operação de estações de tratamento de efluente com predição em tempo real por modelos de aprendizagem de máquina. |
| Author: | Fuck, João Vítor Rios |
| Abstract: |
O tratamento de efluentes envolve processos complexos, altamente não lineares e influenciados por variáveis físico-químicas, biológicas e operacionais, cuja interação dificulta decisões baseadas apenas na experiência. A crescente demanda por eficiência, redução de custos e atendimento a padrões ambientais mais rigorosos tem impulsionado o uso de métodos de Inteligência Artificial (IA) aplicados à modelagem e otimização de Estações de Tratamento de Efluentes (ETEs). Neste contexto, esta dissertação desenvolve e valida uma metodologia de aprendizado de máquina voltada à previsão de parâmetros de qualidade do efluente tratado, visando subsidiar a operação de ETEs e constituir a base de um futuro Sistema de Apoio à Decisão (SAD). A metodologia inclui: (i) diagnóstico da qualidade e consistência dos dados; (ii) pré-processamento rigoroso, com padronização, tratamento de outliers, unificação de rótulos e imputação; (iii) construção, treinamento e validação de modelos (RF, SVM, MLP e LSTM); e (iv) aplicação de técnicas de interpretabilidade (Permutation Importance e PDP) para elucidar relações e avaliar a robustez dos modelos. A abordagem é aplicada a três estudos de caso complementares: uma ETE industrial com dados reais (AMBEV ? Lages/SC); uma ETE municipal simulada no software WEST (dados controlados); e uma ETE municipal (Umbilo) com dados reais e simulados, incorporando séries temporais de alta frequência. Os resultados mostram que, em ambientes com dados de boa qualidade (simulações WEST), os modelos preditivos alcançam elevada acurácia (R² até 0,99), especialmente MLP e LSTM, capazes de capturar defasagens temporais e padrões dinâmicos. Em contrapartida, no cenário industrial real (ETE AMBEV), a presença de dados inconsistentes, variabilidade na frequência de coleta, lacunas em parâmetros essenciais e ausência de monitoramento contínuo prejudicaram o desempenho dos modelos, revelando que a maturidade dos dados é o fator mais determinante para a viabilidade de aplicações de IA em ETEs. A engenharia de atributos mostrou-se crucial para representar o contexto operacional não explícito nos dados brutos, permitindo incorporar informações sobre mudanças estruturais, condições dos reatores, efeitos de carryover e eventos de manutenção. A inclusão dessas variáveis elevou o desempenho dos modelos, demonstrando que a representação do estado operacional é tão importante quanto os parâmetros físico-químicos tradicionais. As análises de interpretabilidade permitiram identificar as variáveis mais influentes em cada cenário, fornecendo aos operadores uma visão clara sobre os fatores que determinam a qualidade do efluente tratado. De forma geral, o estudo demonstra que: (i) a qualidade dos dados é o principal limitante da aplicação de ML em ETEs; (ii) modelos complexos não superam problemas de dados escassos ou inconsistentes; (iii) a engenharia de atributos é essencial para capturar o contexto operacional; e (iv) a interpretabilidade é indispensável para a adoção prática de soluções de IA em ambientes industriais. Conclui-se que, embora os algoritmos avaliados tenham mostrado alto potencial, a implementação plena de soluções baseadas em IA depende de melhorias estruturais nos sistemas de coleta e gerenciamento de dados. A metodologia proposta representa um avanço rumo ao desenvolvimento de um SAD para otimização e controle inteligente de ETEs, com potencial de aplicação em diferentes escalas e configurações de tratamento. Abstract: Wastewater treatment involves complex and highly nonlinear processes influenced by physicochemical, biological, and operational variables, whose interactions make decision-making difficult when based solely on operator experience. The growing demand for efficiency, cost reduction, and compliance with increasingly stringent environmental standards has driven the use of Artificial Intelligence (AI) methods applied to the modeling and optimization of Wastewater Treatment Plants (WWTPs). In this context, this dissertation develops and validates a machine learning methodology aimed at predicting treated effluent quality parameters, with the goal of supporting WWTP operation and serving as the foundation for a future Decision Support System (DSS). The methodology includes: (i) diagnosing data quality and consistency; (ii) rigorous preprocessing, including standardization, outlier treatment, label harmonization, and data imputation; (iii) construction, training, and validation of predictive models (RF, SVM, MLP, and LSTM); and (iv) application of interpretability techniques (Permutation Importance and PDP) to elucidate relationships and assess model robustness. The approach is applied to three complementary case studies: an industrial WWTP with real data (AMBEV ? Lages/SC); a municipal WWTP simulated in the WEST software (controlled datasets); and a municipal WWTP (Umbilo) with real and simulated data, including high-frequency time series. The results show that in environments with high-quality data (WEST simulations), predictive models achieve high accuracy (R2 up to 0.99), particularly MLP and LSTM networks, which effectively capture temporal lags and dynamic input patterns. In contrast, in the real industrial setting (AMBEV WWTP), inconsistent data, variability in sampling frequency, missing essential parameters, and the absence of continuous monitoring significantly impaired model performance, revealing that data maturity is the most decisive factor for the feasibility of AI applications in WWTPs. Feature engineering proved crucial for representing the operational context not explicitly present in raw datasets, enabling the incorporation of information on structural changes, reactor operating conditions, carryover effects, and maintenance events. Including these additional variables significantly improved model performance, demonstrating that representing the operational state is as important as traditional physicochemical parameters. Interpretability analyses allowed the identification of the most influential variables in each scenario, providing operators with a clear understanding of the factors that determine treated effluent quality. Overall, the study demonstrates that: (i) data quality is the main limiting factor for ML applications in WWTPs; (ii) complex models do not overcome issues related to scarce or inconsistent data; (iii) feature engineering is essential for capturing operational context; and (iv) interpretability is indispensable for the practical adoption of AI solutions in industrial environments. It is concluded that, although the evaluated algorithms show strong potential, full implementation of AI-based solutions depends on structural improvements in data collection and management systems. The proposed methodology represents a significant step toward the development of a DSS for intelligent optimization and control of WWTPs, with potential applicability at different scales and treatment configurations. |
| Description: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Química, Florianópolis, 2025. |
| URI: | https://repositorio.ufsc.br/handle/123456789/272456 |
| Date: | 2026 |
| Files | Size | Format | View |
|---|---|---|---|
| PENQ1089-D.pdf | 1.626Mb |
View/ |