Title: | Estimativa dos níveis de glicose usando processamento de sinais de fotopletismografia com suporte da variabilidade da frequência cardíaca e modelos de machine learning |
Author: | Barros, Guilherme Alves Nunes de |
Abstract: |
A glicose é a principal fonte de energia do organismo, obtida por meio da alimentação. Seu uso eficiente pelas células depende da regulação adequada dos níveis de glicose no sangue, controlada pela insulina, hormônio produzido pelas células pancreáticas. Na diabetes mellitus, há disfunção na produção ou uso da insulina, resultando em desequilíbrios que podem causar complicações graves, como doenças renais, infartos e acidentes vasculares cerebrais. Segundo a Organização Mundial da Saúde (OMS), a diabetes é a nona maior causa de mortes no mundo, com 1,5 milhão de óbitos anuais. O monitoramento regular dos níveis de glicose no sangue é essencial, especialmente em pessoas com diabetes, permitindo a detecção precoce de complicações. No entanto, os métodos atuais são invasivos, caros e podem ser desconfortáveis, criando a necessidade de alternativas não invasivas e acessíveis. Este estudo propõe uma solução baseada em sinais de fotopletismografia (PPG) e algoritmos de Inteligência Artificial, investigando como a idade e a Variabilidade da Frequência Cardíaca (HRV) podem afetar a precisão das estimativas de glicose. Utilizou-se o conjunto de dados UFSC-BGL, disponibilizado por (DEUS, Luis Felipe de, 2023), para aprimorar estudos prévios e testar novas abordagens. Após o pré-processamento, os sinais PPG foram segmentados em janelas de 10 segundos, sem sobreposição, com extração de 65 características nos domínios da frequência, não linear e morfológico. Os dados foram divididos em treinamento (70%) e teste (30%) para treinar e avaliar modelos de aprendizado de máquina. A análise revelou que a limitação por idade até 50 anos, combinada à Decomposição Empírica de Modos (EMD) e à HRV, apresentou os melhores resultados. O modelo Random Forest (RF) obteve um erro médio absoluto (MAE) de 7,69 mg/dL, erro médio absoluto percentual (MAPE) de 6,27% e 92,2% das estimativas na zona A do gráfico de Clarke, destacando robustez e confiabilidade. O modelo CatBoost também demonstrou bom desempenho, com MAPE de 6,57% e 86,2% das estimativas na zona A. Este estudo traz três contribuições principais: o aprimoramento das análises do conjunto de dados UFSC-BGL, a inclusão de HRV como variável analítica, e o desenvolvimento de modelos precisos que consideram a influência da idade e da dinâmica autonômica na estimativa da glicose, reforçando o potencial de soluções não invasivas para monitoramento contínuo. Glucose is the primary source of energy for the body, obtained through diet. Its efficient utilization by cells depends on the proper regulation of blood glucose levels, controlled by insulin, a hormone produced by pancreatic cells. In diabetes mellitus, there is a dysfunction in insulin production or utilization, resulting in imbalances that can lead to severe complications such as kidney disease, heart attacks, and strokes. According to the World Health Organization (WHO), diabetes is the ninth leading cause of death worldwide, with 1.5 million annual fatalities. Regular monitoring of blood glucose levels is essential, particularly for individuals with diabetes, enabling early detection of complications. However, current methods are invasive, costly, and potentially uncomfortable, highlighting the need for non-invasive and accessible alternatives. This study proposes a solution based on photoplethysmography (PPG) signals and Artificial Intelligence algorithms, investigating how age and Heart Rate Variability (HRV) may impact the accuracy of glucose estimates. The UFSC-BGL dataset, provided by (DEUS, Luis Felipe de, 2023), was utilized to refine previous studies and test new approaches. After preprocessing, PPG signals were segmented into 10-second windows without overlap, with the extraction of 65 features across frequency, non-linear, and morphological domains. The data were split into training (70%) and testing (30%) sets to train and evaluate machine learning models. The analysis revealed that age restriction up to 50 years, combined with Empirical Mode Decomposition (EMD) and HRV, yielded the best results. The Random Forest (RF) model achieved a mean absolute error (MAE) of 7.69 mg/dL, a mean absolute percentage error (MAPE) of 6.27%, and 92.2% of estimates in zone A of the Clarke error grid, demonstrating robustness and reliability. The CatBoost model also showed good performance, with a MAPE of 6.57% and 86.2% of estimates in zone A. This study makes three main contributions: the refinement of analyses using the UFSC-BGL dataset, the inclusion of HRV as an analytical variable, and the development of accurate models that account for the influence of age and autonomic dynamics on glucose estimation, reinforcing the potential of non-invasive solutions for continuous monitoring. |
Description: | TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Engenharia Eletrônica. |
URI: | https://repositorio.ufsc.br/handle/123456789/262615 |
Date: | 2024-12-19 |
Files | Size | Format | View | Description |
---|---|---|---|---|
TCC.pdf | 3.431Mb |
View/ |
TCC |