Um modelo computacional utilizando técnicas de machine learning e exames laboratoriais de rotina na triagem e apoio ao diagnóstico de diabetes mellitus

Cardozo, Glauco

Um modelo computacional utilizando técnicas de machine learning e exames laboratoriais de rotina na triagem e apoio ao diagnóstico de diabetes mellitus

DSpace Repository

A- A A+

DSpace Home
Teses e Dissertações
Programa de Pós-Graduação em Engenharia Elétrica
View Item

Um modelo computacional utilizando técnicas de machine learning e exames laboratoriais de rotina na triagem e apoio ao diagnóstico de diabetes mellitus

Show full item record

Title:	Um modelo computacional utilizando técnicas de machine learning e exames laboratoriais de rotina na triagem e apoio ao diagnóstico de diabetes mellitus
Author:	Cardozo, Glauco
Abstract:	Estima-se que cerca de 10% da população mundial seja portadora de diabetes mellitus (DM), sendo que em torno de 50% destes indivíduos não foram diagnosticados e não sabem que possuem a doença. Isso ocorre principalmente pelo fato de apenas 40% dos indivíduos com DM tipo2 (DM2) apresentarem sintomas. O DM2 pode permanecer não detectado por vários anos, ocasionando complicações severas e aumentando os custos com o tratamento de saúde. Por esta razão, o diagnóstico precoce é de extrema importância, sendo que quando feito no início, ainda na etapa conhecida como pré-diabetes, o quadro pode ser revertido e estabilizado. O diagnóstico do DM é feito por meio de exames laboratoriais, sendo a glicose no sangue em jejum (FPG) e a hemoglobina glicada (HbA1c) os mais realizados. No entanto eles podem apresentar discrepâncias entre si, uma vez que o FPG exige jejum de oito horas, apresentando variações ao longo do dia. Por apresentar vantagens em relação ao FPG, o exame de HbA1c tem sido mais indicado na busca por um diagnóstico, apesar de, por questões culturais e financeiras, o FPG ainda ser mais utilizado. Nesse contexto, buscou-se utilizar exames laboratoriais de rotina com técnicas de Machine Learning, tendo como objetivo a predição do HbA1c e a detecção de falsos negativos em exame de FPG. Nesta segunda etapa, foi desenvolvido uma metodologia para, com base na glicose média, calcular um fator de ajuste que melhorasse a concordância entre os exames de FPG e HbA1c. Como ferramenta de predição, foram testados os métodos KNN, SVM, Naïve Bayes, Random Forest e ANN, utilizando exames de 201.338 pacientes. Na predição do HbA1c, o desempenho dos modelos de classificação e regressão foram avaliados utilizando diferentes subconjuntos de dados, como saudáveis, pré-diabéticos, diabéticos, não saudáveis e sem diabetes. Nesta etapa, o melhor desempenho foi obtido com a classificação após a regressão do modelo de rede neural artificial na identificação de indivíduos não saudáveis. O modelo obteve 78,1%, 78,7% e 78,4% para sensibilidade, precisão e F1-Score, respectivamente. Já na detecção de falsos negativos de FPG, o modelo de regressão ANN obteve o melhor resultado no cálculo do fator de ajuste. Com ele foi possível obter um ganho de 16,6% no diagnóstico de diabetes e 35% no de pré-diabetes, sendo estes valores relevantes na identificação de falsos negativos. Desta forma, concluímos que modelos baseados em aprendizado de máquina conseguem prever valores de hemoglobina glicada a partir de exames laboratoriais de rotina e podem ser usados como uma ferramenta de triagem e apoio no diagnóstico de diabetes. Da mesma forma, por meio do ajuste dos valores do FPG, é possível aumentar a concordância destes com o HbA1c e diminuir a ocorrência de falsos negativos. Assim, durante a rotina de exames laboratoriais, o modelo poderia ser utilizado na triagem de possíveis falsos negativos e consequentemente sugerir a realização do exame de HbA1c para confirmação do diagnóstico de Diabetes Mellitus. Abstract: It is estimated that around 10% of the world population has diabetes mellitus (DM), and around 50% of these individuals have not been diagnosed and do not know they have the disease. This is mainly because only 40% of individuals with type 2 DM (DM2) have symptoms. T2DM can remain undetected for several years, causing severe complications and increasing health care costs. For this reason, early diagnosis is extremely important, and when made early, still in the stage known as pre-diabetes, the condition can be reversed and stabilized. The diagnosis of DM is made through laboratory tests, with fasting blood glucose (FPG) and glycated hemoglobin (HbA1c) being the most frequently performed. However, they may have discrepancies between them, since the FPG requires an 8-hour fasting, with variations throughout the day. As it has advantages over the FPG, the HbA1c test has been more indicated in the search for a diagnosis, although, for cultural and financial reasons, the FPG is still more used. In this context, we sought to use routine laboratory tests along with Machine Learning techniques, with the objective of predicting HbA1c and detecting false negatives for the FPG test. In this second stage, a methodology was developed to calculate an adjustment factor based on average glucose that would improve the agreement between the FPG and HbA1c tests. As a prediction tool, the KNN, SVM, Naïve Bayes, Random Forest and ANN methods were tested, using exams from 201338 patients. In predicting HbA1c, the performance of classification and regression models were evaluated on different subsets of data, such as healthy, pre-diabetic, diabetic, unhealthy and non-diabetic. In this step, the best performance was obtained with the classification after the regression of the artificial neural network model in the identification of unhealthy individuals. The model obtained 78.1%, 78.7% and 78.4% for sensitivity, precision and F1-Score, respectively. In the detection of false negatives of FPG, the ANN regression model obtained the best result in the calculation of the adjustment factor. With it, it was possible to obtain a gain of 16.6% in the diagnosis of diabetes and 35% in the diagnosis of pre-diabetes, these values being significant in the identification of false negatives. In this way, we conclude that models based on machine learning are able to predict glycated hemoglobin values from routine laboratory tests and can be used as a screening tool and support in the diagnosis of diabetes. Likewise, by adjusting the FPG values, it is possible to increase their agreement with HbA1c and reduce the occurrence of false negatives. Thus, during routine laboratory tests, the model could be used to screen for possible false negatives and consequently suggest performing the HbA1c test to confirm the diagnosis of Diabetes Mellitus.
Description:	Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2022.
URI:	https://repositorio.ufsc.br/handle/123456789/244403
Date:	2022

Files in this item

Files	Size	Format	View
PEEL2095-T.pdf	57.64Mb	PDF	View/Open

Um modelo computacional utilizando técnicas de machine learning e exames laboratoriais de rotina na triagem e apoio ao diagnóstico de diabetes mellitus

DSpace Repository

Um modelo computacional utilizando técnicas de machine learning e exames laboratoriais de rotina na triagem e apoio ao diagnóstico de diabetes mellitus

Files in this item

This item appears in the following Collection(s)

Search DSpace

Browse

All of DSpace

This Collection

My Account

Statistics

Compartilhar