Title: | Método FOCUSeR para ranqueamento de sensores em ambientes IoT |
Author: | Costa, Felipe Schneider |
Abstract: |
Dados obtidos de sensores conectados a Wireless Sensor Networks (WSNs) devem ser armazenados e processados para viabilizar ambientes como cidades inteligentes. No entanto, com o crescimento exponencial do número de dispositivos na borda da rede, faz-se necessária a implementação de técnicas robustas, capazes de selecionar fontes de dados confiáveis e atender requisitos de baixa latência, capazes de servir aplicações críticas. Assim, para superar esses desafios, este trabalho de pesquisa apresenta um método para ranking de sensores denominado FOCUSeR. O método utiliza a avaliação de dados como critério para o ranking, permitindo a identificação de ocorrências de falhas em sensores e anomalias em ambientes. Para atender aos requisitos inerentes às WSNs, o método proposto foi projetado para execução em um ambiente típico de Fog Computing, utilizando aprendizagem online e atualização constante ao longo do tempo para evitar efeitos como desvio de tempo (concept drift). O método também oferece recursos para recuperação de dados oriundos de falhas, buscando dados de sensores similares nas regiões próximas ao sensor em estado de falha. As listas de ranking geradas são gerenciadas por meio de tabelas de hash distribuídas. Para dar maior confiabilidade aos resultados experimentais, foi desenvolvido um ambiente experimental real (testbed). Em adição, utilizando este testbed, foram geradas amostras com rótulos, constituindo um novo conjunto de dados, com o intuito de apoiar a avaliação do método desenvolvido. Outros quatro conjuntos de dados reais também foram utilizados, três dos quais rotulados por meio de injeção artificial de falhas. Esses conjuntos de dados foram rotulados em um trabalho relacionado com foco na injeção de falhas artificiais. Os resultados experimentais obtidos indicam que o método proposto pode fornecer confiabilidade no uso dos dados dos sensores, utilizando poucos recursos computacionais e reduzindo a latência no processo de seleção dos sensores. Nos testes realizados, foram obtidas taxas de Precisão de aproximadamente 98% e taxas de Acurácia superiores a 94% em todos os conjuntos de dados. Além disso, as análises realizadas apontam que a Acurácia tem uma taxa crescente à medida que o número de amostras também aumenta. Os resultados obtidos na recuperação de dados de falhas também indicam a viabilidade do método proposto neste recurso, no qual foi obtida uma taxa de recuperação de dados falhos de mais de 87%. Dessa forma as principais contribuições do trabalho consistem em um método capaz de reduzir a latência no uso de dados de sensores e ao mesmo tempo capaz de aprender e manter atualizados, de forma online, os parâmetros necessários para avaliação dos dados produzidos pelos sensores. Abstract: Data obtained from sensors connected to Wireless Sensor Networks must be stored and processed to enable environments such as Smart Cities. However, with the exponential growth in the number of devices at the edge of the network, it is necessary to implement robust techniques, capable of selecting reliable data sources and meeting low latency requirements, in order to serve critical ap-plications. Thus, to overcome these challenges, this research presents FOCUSeR, a method for ranking sensors. The method uses the evaluation of data as a criterion for the ranking, allowing the identification of occurrences of failures in sensors and anomalies in environments. In order to meet the requirements inherent to WSNs, the proposed method was developed to run in a Fog Computing environment, using online learning and constant updating over time to avoid effects such as time drift. The method also offers resources for data recovery from failures, searching for data from similar sensors in regions close to the sensor in a failure state. The generated ranking lists are managed through distributed hash tables. To provide reliability to the experimental results, a real experimental environment was developed. Also, using this developed testbed, a dataset with labels was created, to support the evaluation of the method. In addition, four other real datasets were used, three of which were labeled through artificial fault injection. These datasets were labeled in a related work that focused on injecting artificial faults. The experimental results obtained indicate that the proposed approach can provide reliability in the use of sensor data, using low computational resources and reducing latency in the sensor selection process. Precision rates are approximately 98% and accuracy rates greater than 94% across all datasets. In addition, the analyzes carried out show that the accuracy has an increasing rate as the number of samples also increases. Results obtained in the recovery of data from failures also indicate the feasibility of the proposal in this resource in which a rate of recovery of failed data of more than 87% was obtained. Thus, the main contributions of the work consist of a method capable of reducing latency in the use of sensor data and at the same time capable of learning and keeping updated, in a online way, the parameters necessary for evaluating the data produced by the sensors. |
Description: | Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2022. |
URI: | https://repositorio.ufsc.br/handle/123456789/238299 |
Date: | 2022 |
Files | Size | Format | View |
---|---|---|---|
PGCC1219-T.pdf | 5.025Mb |
View/ |