Abstract:
|
O fornecimento de serviços básicos, como a água, em cidades turísticas que apresentam grande flutuação populacional ao longo do ano se mostra desafiador. O superdimensionamento de sistemas pode acarretar custos excessivos e ociosidade na maioria do ano, ao passo que o subdimensionamento pode levar a falta de recursos importantes tanto para turistas como moradores fixos destas cidades. Considerando a importância da distribuição de água para toda população, uma alternativa para auxiliar no seu fornecimento adequado é a previsão da demanda necessária para atender às necessidades de moradores e turistas. Neste contexto, este trabalho investiga a previsão de demanda de água considerando a criação de diferentes preditores para períodos específicos do ano. Em particular, são considerados dois particionamentos: (i) alta e baixa temporada e; (ii) primavera, verão, outono e inverno (estações do ano). Para o trabalho foram considerados e utilizados dados da cidade litorânea de Guaratuba–PR, em função da sua alta variabilidade populacional acarretada pelo turismo. Os dados incluem informações meteorológicas (temperatura, pressão, umidade e radiação), além de informações de calendário, como feriados, recessos escolares de Guaratuba, Curitiba e Joinville (cidades próximas). Dados acerca do período de Carnaval também foram considerados. A variável alvo do estudo foi a água produzida, visto que esta apresenta alta correlação com a demanda de água observada. Foram aplicados quatro modelos de previsão, a saber: Regressão Linear (LR), k-Vizinhos Mais Próximos (kNN), Regressão de Vetor Suporte (SVR) e Perceptron de Múltiplas Camadas (MLP). Estes modelos foram avaliados nos cenários de divisão anteriormente citados e também em um cenário sem divisão, isto é, com um único modelo. Todos os métodos foram avaliados em um cenário de previsões de curto prazo: demanda dos próximos sete dias. Para avaliar os modelos, três metodologias foram consideradas: uma janela expansiva de 7 dias (EW-7D) com 1 ano inicial de treinamento e; duas janelas deslizantes com conjuntos de treinamento iniciais de 1 e 2 anos, respectivamente (SW-1Y7D e SW-2Y7D). As métricas de erro aplicadas foram Erro Médio Absoluto (MAE), Erro Percentual Médio Absoluto (MAPE) e Raiz do Erro Médio Quadrático (RMSE). Os resultados obtidos indicam que o particionamento dos dados favoreceu os modelos LR e SVR, especialmente com o particionamento por estações do ano. No entanto, os modelos kNN e MLP tiveram melhores desempenhos sem a partição dos dados em subconjuntos. Durante a alta temporada, todos os modelos mostraram melhora de desempenho com o particionamento (independentemente da forma), ao contrário do observado em baixa temporada, para a qual a partição dos dados não resultou em ganhos significativos. |