Aplicação de Algoritmos de Aprendizado de Máquina para o Mapeamento de Suscetibilidade a Inundações da Bacia Hidrográfica do Rio Itajaí

DSpace Repository

A- A A+

Aplicação de Algoritmos de Aprendizado de Máquina para o Mapeamento de Suscetibilidade a Inundações da Bacia Hidrográfica do Rio Itajaí

Show full item record

Title: Aplicação de Algoritmos de Aprendizado de Máquina para o Mapeamento de Suscetibilidade a Inundações da Bacia Hidrográfica do Rio Itajaí
Author: Silva, Luiz Felipe da
Abstract: As inundações fluviais representam um dos desastres naturais mais recorrentes em nível mundial e estão entre os eventos de maior custo econômico global. O mapeamento de suscetibilidade é fundamental para o planejamento territorial, mas demanda grande volume de dados e elevado custo computacional. Nesse contexto, algoritmos de aprendizado de máquina têm se consolidado como alternativas mais acessíveis, em contraste com os modelos hidrodinâmicos tradicionais. Este trabalho teve como objetivo estimar a suscetibilidade a inundações na Bacia Hidrográfica do Rio Itajaí por meio da aplicação de cinco modelos supervisionados: AdaBoost, XGBoost, K-Nearest Neighbors (KNN), Support Vector Machine (SVM) e Random Forest (RF). Os modelos foram treinados com base em um inventário de áreas inundadas, construído a partir de registros da Defesa Civil e o Índice de Diferença Normalizada da Água (NDWI), além de oito variáveis ambientais preditoras selecionadas como fatores condicionantes da ocorrência de inundações. Para avaliar a adequação das variáveis selecionadas, foi analisada sua capacidade discriminativa e realizada uma análise de multicolinearidade, com base no Fator de Inflação da Variância (VIF) e Tolerância (TOL), a fim de reduzir redundâncias. A performance dos modelos foi avaliada por meio da média de cinco métricas de desempenho: acurácia, precisão, recall, F1-score e Área sob a Curva (AUC). A importância relativa dos fatores condicionantes foi determinada com o método SHAP (SHapley Additive exPlanations). A coerência espacial da mancha gerada ocorreu através da sobreposição com a mancha de inundação do Banco Mundial, referente a um tempo de retorno de 50 anos. Os fatores condicionantes apresentaram bom potencial discriminativo. O modelo RF apresentou os melhores resultados (AUC = 0,99; acurácia = 0,94; precisão = 0,92; recall = 0,98; F1-score = 0,94), seguido por XGBoost e AdaBoost. A análise SHAP para o RF apontou o HAND e a altitude como os fatores condicionantes mais relevantes. O mapa de suscetibilidade gerado com o modelo RF classificou 86,56% da área como muito baixa, 3,62% como baixa, 2,80% como média, 2,38% como alta e 4,65% como muito alta suscetibilidade. As divergências observadas ao comparar as manchas podem ser atribuídas à capacidade do modelo de generalizar padrões em áreas sem registros históricos e às possíveis limitações da mancha de referência. Os resultados evidenciam o potencial do aprendizado de máquina como ferramenta de apoio ao planejamento territorial e à formulação de políticas públicas voltadas à prevenção de inundações.Fluvial floods represent one of the most recurrent natural disasters worldwide and are among the events with the highest economic costs globally. Susceptibility mapping is essential for territorial planning but requires large volumes of data and high computational cost. In this context, machine learning algorithms have emerged as more accessible alternatives compared to traditional hydrodynamic models. This study aimed to estimate flood susceptibility in the Itajaí River Basin by applying five supervised models: AdaBoost, XGBoost, K-Nearest Neighbors (KNN), Support Vector Machine (SVM), and Random Forest (RF). The models were trained based on a flood inventory constructed from records provided by the Civil Defense and the Normalized Difference Water Index (NDWI), along with eight environmental predictor variables selected as flood-conditioning factors. To evaluate the adequacy of the selected variables, their discriminative capacity was analyzed, and multicollinearity was assessed using the Variance Inflation Factor (VIF) and Tolerance (TOL) in order to reduce redundancies. Model performance was evaluated based on the average of five metrics: accuracy, precision, recall, F1-score, and Area Under the Curve (AUC). The relative importance of the conditioning factors was determined using the SHAP (SHapley Additive exPlanations) method. The spatial coherence of the generated flood map was assessed through overlay with the World Bank’s 50-year return period flood extent. The conditioning factors showed good discriminative potential. The RF model achieved the best results (AUC = 0.99; accuracy = 0.94; precision = 0.92; recall = 0.98; F1-score = 0.94), followed by XGBoost and AdaBoost. The SHAP analysis for the RF model identified HAND and altitude as the most influential conditioning factors. The susceptibility map generated by the RF model classified 86.56% of the area as very low, 3.62% as low, 2.80% as moderate, 2.38% as high, and 4.65% as very high susceptibility. The observed discrepancies between the generated and reference maps may be attributed to the model’s ability to generalize patterns in areas without historical records and to possible limitations of the reference flood extent. The results highlight the potential of machine learning as a decisionsupport tool for territorial planning and the development of public policies aimed at flood prevention.
Description: TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Engenharia Sanitária e Ambiental.
URI: https://repositorio.ufsc.br/handle/123456789/266382
Date: 2025-07-07


Files in this item

Files Size Format View Description
TCC_LuizFelipeDaSilva.pdf 5.729Mb PDF View/Open TCC

This item appears in the following Collection(s)

Show full item record

Search DSpace


Browse

My Account

Statistics

Compartilhar