Title: | Detecção de ataques em ambientes de fog computing e IoT com a utilização de deep learning: uma abordagem federada |
Author: | Pimentel, Erivan Laranjeira |
Abstract: |
A sociedade contemporânea caracteriza-se por transformações tecnológicas significativas, impulsionadas consideravelmente pela Internet of Things (IoT) e pela Artificial Intelligence (AI). A adoção e disseminação dessas tecnologias têm englobado diversos setores da sociedade, otimizando a execução de tarefas e processos. A introdução da IoT em múltiplos domínios resulta na geração de volumes massivos de dados, os quais são transmitidos via internet a dispositivos de maior poder computacional para subsequente processamento. Tais dados advêm de múltiplas fontes de informações, abrangendo desde a área da saúde até grandes transações empresariais e governamentais. Realizar a manutenção da segurança na internet convencional é desafiador. Em ambientes distribuídos, como os da IoT, essa tarefa agrega um maior nível de complexidade. Isso ocorre devido às limitações inerentes a estes dispositivos, como capacidade computacional reduzida, restrições de energia e comunicação, além da elevada heterogeneidade dos dispositivos envolvidos, ocasionando na ocorrência de novas vulnerabilidades e compartilhando das existentes na internet convencional. Em virtude destes fatores, atacantes habilidosos apresentam uma propensão a direcionar ataques contra estes dispositivos, visando roubo, danos e interceptação das informações de forma não autorizada. Diante desse panorama, esta dissertação propõe o desenvolvimento, treinamento e validação de um modelo híbrido, implementando o Deep Federated Learning (FLD) utilizando uma arquitetura de rede CNN-BiLSTM. No conjunto de dados CIC-IDS2017, foram conduzidas as etapas de tratamento, redução, balanceamento e extração de características, além da implementação do aprendizado federado considerando cenários multiclasse e a distribuição dos dados no formato Non-Independently and Identically Distributed (Non-IID). O modelo proposto foi validado e comparado em relação às abordagens do estado da arte, utilizando métricas como accuracy, precision, recall e F-Score, além da avaliação da taxa de detecção de cada classe de ataque específico. Os resultados obtidos apresentam taxas de accuracy em 98,40%, precision em 91,17%, recall em 95,21% e F-Score em 93%, evidenciando que o modelo desenvolvido apresenta desempenho competitivo em relação às soluções implementadas na literatura. Superando inúmeros modelos que implementam o aprendizado centralizado e o aprendizado federado multiclasse. Esses achados reforçam o potencial de modelos federados como alternativas viável e eficazes frente às abordagens centralizadas. Abstract: Contemporary society is characterized by significant technological transformations, driven significantly by the Internet of Things (IoT) and Artificial Intelligence (AI). The adop- tion and dissemination of these technologies has encompassed various sectors of society, optimizing the execution of tasks and processes. The introduction of IoT in multiple domains results in the generation of massive vol- umes of data, which are transmitted via the internet to devices with greater computing power for subsequent processing. This data comes from multiple sources, ranging from healthcare to large business and government transactions. Maintaining security on the conventional internet is challenging. In distributed envi- ronments, such as the IoT, this task adds a greater level of complexity. This is due to the inherent limitations of these devices, such as reduced computing power, power and communication constraints, and the high heterogeneity of the devices involved, leading to the emergence of new vulnerabilities and sharing existing ones on the conventional internet. Due to these factors, skilled attackers are prone to targeting these devices, aiming to steal, damage, and unauthorized interception of information. Given this sce- nario, this dissertation proposes the development, training, and validation of a hybrid model, implementing Deep Federated Learning (FLD) using a CNN-BiLSTM network architecture. On the CIC-IDS2017 dataset, the stages of processing, reduction, balancing, and fea- ture extraction were conducted, in addition to the implementation of federated learn- ing considering multiclass scenarios and the data distribution in the Non-Independently and Identically Distributed (Non-IID) format. The proposed model was validated and compared against state-of-the-art approaches, using metrics such as accuracy, precision, recall, and F-Score, in addition to evaluating the detection rate of each specific attack class. The results obtained present accuracy rates of 98.40%, precision of 91.17%, recall of 95.21% and F-Score of 93%, evidencing that the developed model presents competitive performance in relation to the solutions implemented in the literature. Out- performing numerous models that implement centralized learning and multiclass feder- ated learning. These findings reinforce the potential of federated models as viable and effective alternatives to centralized approaches. |
Description: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2025. |
URI: | https://repositorio.ufsc.br/handle/123456789/267627 |
Date: | 2025 |
Files | Size | Format | View |
---|---|---|---|
PGCC1312-D.pdf | 1.229Mb |
View/ |