dc.contributor |
Universidade Federal de Santa Catarina |
pt_BR |
dc.contributor.advisor |
Jaskowiak, Pablo Andretta |
|
dc.contributor.author |
Vieira Filho, Jesuino |
|
dc.date.accessioned |
2022-08-01T20:29:44Z |
|
dc.date.available |
2022-08-01T20:29:44Z |
|
dc.date.issued |
2022-07-27 |
|
dc.identifier.uri |
https://repositorio.ufsc.br/handle/123456789/237501 |
|
dc.description |
TCC (graduação) - Universidade Federal de Santa Catarina. Campus Joinville. Engenharia Mecatrônica. |
pt_BR |
dc.description.abstract |
Proper planning and management of water resources is fundamental to human well-being and contemporary socio-economic development. However, the use of increasing amounts of water has brought a series of problems that compromise its quality and durability. Given the scarcity of this natural resource and its inherent constraints, accurate forecasting of water consumption is imperative for the optimal operation of water collection, treatment, and distribution systems. Thus, the present work aims to study and compare different machine learning methods for predicting daily urban water demand in a Brazilian coastal tourist city. To this extent, four learning algorithms were employed: linear regression (LR), k-nearest neighbors (kNN), support vector regression (SVR) and multilayer perceptron (MLP). Moreover, three configurations of a time series cross-validation approach known as backtesting were considered for each method, two with a sliding window and one with an expanding window, totaling 12 models. They were all subjected to hyperparameter optimization (model selection), and then evaluated using appropriate performance metrics (model evaluation). To train the models, historical data from the city’s water distribution system (WDS) was collected, along with additional meteorological and calendar data. These raw data were submitted to exploratory analysis and preprocessing. The empirical results underscore the importance of using nonlinear models to predict short-term water demand. Based on the adopted performance metrics, MLP performed the best, while LR was the worst. SVR and kNN were second and third, respectively. With reference to the three backtesting configurations employed, each learning algorithm had its best model using the expanding window. |
pt_BR |
dc.description.abstract |
O planeamento e gestão adequados dos recursos hídricos são fundamentais para o bem-estar humano e o desenvolvimento socioeconômico contemporâneo. No entanto, a utilização de quantidades crescentes de água trouxe uma série de problemas que comprometem a sua qualidade e durabilidade. Dada a escassez deste recurso natural e os seus constrangimentos inerentes, a previsão precisa do consumo de água é imperativa para o ótimo funcionamento dos sistemas de captação, tratamento e distribuição de água. Assim, o presente trabalho tem como objetivo estudar e comparar diferentes métodos de aprendizado de máquina para prever a demanda diária de água urbana em uma cidade turística litorânea brasileira. Nesse contexto, foram utilizados quatro algoritmos de aprendizado: regressão linear (LR), k-vizinhos mais próximos (kNN), regressão por vetores suporte (SVR) e perceptron multicamadas (MLP). Além disso, três configurações de uma abordagem de validação cruzada para séries temporais conhecida como backtesting foram consideradas para cada método, duas com uma janela deslizante e uma com uma janela de expansão, totalizando 12 modelos. Todos eles foram submetidos a uma otimização de hiperparâmetros (seleção de modelos), e então avaliados por meio de métricas de desempenho apropriadas (avaliação de modelos). Para treinar os modelos, foram coletados dados históricos do sistema de distribuição de água da cidade, além de dados meteorológicos e de calendário adicionais. Estes dados bruto foram submetidos a análise exploratória e pré-processamento. Os resultados empíricos ressaltam a importância da utilização de modelos não lineares para prever a demanda de água no curto prazo. Com base nas métricas de desempenho adotadas, a MLP teve o melhor desempenho, enquanto que o LR foi o pior. SVR e kNN foram o segundo e o terceiro, respectivamente. Com referência às três configurações de backtesting utilizadas, cada algoritmo de aprendizagem teve o seu melhor modelo utilizando a janela de expansão. |
pt_BR |
dc.format.extent |
58 f. |
pt_BR |
dc.language.iso |
en |
pt_BR |
dc.publisher |
Joinville, SC |
pt_BR |
dc.rights |
Open Access |
|
dc.subject |
Water demand |
pt_BR |
dc.subject |
Time series |
pt_BR |
dc.subject |
Machine learning |
pt_BR |
dc.subject |
Backtesting |
pt_BR |
dc.title |
Comparison of machine learning methods for short-term urban water demand forecasting in a coastal tourist city |
pt_BR |
dc.type |
TCCgrad |
pt_BR |