Title: | Avaliação em massa de terrenos usando regressão linear múltipla e random forest: um estudo comparativo no bairro de Jurerê, Florianópolis (SC) |
Author: | Silvestre, Acácio Gomes Corrêa |
Abstract: |
Este estudo elabora e compara modelos de avaliação de imóveis em massa aplicados a terrenos urbanos do bairro de Jurerê, em Florianópolis, um mercado imobiliário heterogêneo e de alto padrão. O objetivo principal foi determinar a abordagem metodológica mais acurada e estatisticamente robusta, confrontando um modelo econométrico tradicional, a Regressão Linear Múltipla (RLM), com um algoritmo de aprendizado de máquina, o Random Forest (RF), além de uma análise complementar geoestatística por Krigagem. A metodologia baseou-se em uma amostra de 50 terrenos, cujos dados foram coletados em março e abril de 2024, e envolveu a modelagem e validação de cada modelo. Os resultados indicaram que o modelo de RLM alcançou um excelente poder explicativo (R² ajustado = 0,9111), atendendo todos os pressupostos estatísticos, com transparência no entendimento do comportamento do mercado. O modelo RF também apresentou forte acurácia (R² OOB = 0,8796) e a vantagem de modelar variáveis que a RLM não conseguiu parametrizar, mas a análise diagnóstica revelou um viés sistemático de subestimação para imóveis no segmento de mais alto valor. A análise complementar geoestatística demonstrou a ausência de autocorrelação espacial significativa nos resíduos, inviabilizando a aplicação da krigagem dos resíduos para fins preditivos, embora eficaz para a visualização dos resultados. Conclui-se que, para a amostra estudada, o modelo de RLM se provou a ferramenta mais confiável e estatisticamente defensável para uma aplicação global. No entanto, a pesquisa revelou uma clara especialização de cada modelo: o RLM é superior na avaliação de imóveis de alto padrão, enquanto o RF performa melhor em segmentos intermediários e em Jurerê Tradicional. Como resultado prático, a geração de Plantas de Valores Genéricas preliminares para cada modelo permitiu a visualização e comparação espacial destas diferentes abordagens metodológicas, fornecendo um subsídio visual para a análise de políticas urbanas. O estudo evidencia, portanto, que a maior complexidade de um algoritmo não assegura, por si só, sua superioridade, e que a escolha do modelo ideal deve ponderar a acurácia global com o comportamento diagnóstico em diferentes nichos do mercado. This study develops and compares mass appraisal models applied to urban land plots in the Jurerê neighborhood of Florianópolis, a heterogeneous and high-end real estate market. The main objective was to determine the most accurate and statistically robust methodological approach by comparing a traditional econometric model, Multiple Linear Regression (MLR), with a machine learning algorithm, Random Forest (RF), in addition to a complementary geostatistical analysis using Kriging. The methodology was based on a sample of 50 land plots, with data collected in March and April 2024, and involved the modeling and validation of each model. The results indicated that the MLR model achieved excellent explanatory power (adjusted R² = 0,9111), meeting all statistical assumptions and offering transparency in understanding market behavior. The RF model also showed strong accuracy (OOB R² = 0,8796) and the advantage of modeling variables that MLR could not parameterize, but a diagnostic analysis revealed a systematic underestimation bias for properties in the highest-value segment. The complementary geostatistical analysis demonstrated the absence of significant spatial autocorrelation in the residuals, making the application of residual kriging for predictive purposes unfeasible, although it proved effective for visualizing the results. It is concluded that, for the studied sample, the MLR model proved to be the most reliable and statistically defensible tool for a global application. However, the research revealed a clear specialization for each model: MLR is superior in valuing high-end properties, while RF performs better in intermediate segments and in the Jurerê Tradicional area. As a practical result, the generation of spatial value maps for each model allowed for the visualization and spatial comparison of these different methodological approaches, providing a visual basis for the analysis of urban policies. The study thus highlights that the greater complexity of an algorithm does not, by itself, ensure its superiority, and that the choice of the ideal model must weigh global accuracy against diagnostic behavior across different market niches. |
Description: | TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Engenharia Civil. |
URI: | https://repositorio.ufsc.br/handle/123456789/267208 |
Date: | 2025-07-21 |
Files | Size | Format | View |
---|---|---|---|
TCC Acacio Silvestre.pdf | 8.312Mb |
View/ |