Modelo de descoberta de conhecimento em texto para detecção de sinais fracos para tecnologias emergentes

DSpace Repository

A- A A+

Modelo de descoberta de conhecimento em texto para detecção de sinais fracos para tecnologias emergentes

Show full item record

Title: Modelo de descoberta de conhecimento em texto para detecção de sinais fracos para tecnologias emergentes
Author: Artese, Letícia Silveira
Abstract: Sinais fracos são fragmentos de informação que a princípio podem parecer vagos e desconexos, mas que atuam como indicadores de um evento futuro e potenciais questões emergentes. Em particular, o domínio tecnológico se destaca no interesse em antecipar informações, visto a estreita relação entre avanço tecnológico e vantagem competitiva. Nessa perspectiva, sinais fracos se mostram uma informação relevante para o planejamento estratégico. O contexto atual de desenvolvimento acelerado enaltece a necessidade de uma abordagem que considere o conceito de incerteza nos planejamentos, viabilizando a antecipação da informação a fim de aproveitar vantagens e minimizar riscos. Diante desse cenário, esta tese propõe um modelo de descoberta de conhecimento em texto para detectar sinais fracos para tecnologias emergentes. A proposta tem sua originalidade marcada pela idealização da identificação de novas palavras como recomendações de sinais fracos. A proposição se sustenta na premissa de compreensão de palavras como o menor nível de abstração de uma informação com base na teoria semiótica de Peirce, e assim, uma forma de buscar a máxima antecipação. O modelo foi elaborado a partir da Design Science Research Methodology e tem como foco explorar a semântica presente nos dados não estruturados contido nos documentos de publicações científicas e tecnológicas. O modelo tem como cerne três tarefas de mineração de texto: (1) a identificação de sinais novos: descoberta de palavras novas; (2) a identificação de sinais latentes: monitoramento temporal das palavras; e (3) a identificação de sinais fracos: estimativa sobre o potencial de impacto tecnológico. Para sua operacionalização, métodos e técnicas de processamento de linguagem natural e técnicas de análise de redes temporais foram implementadas, como o modelo para embedding BERT e a análise burst de redes temporais. A demostração conceitual do modelo e sua operacionalização simulada baseada em um cenário de estudo real apresentaram resultados satisfatórios. Evidenciando a capacidade de obtenção de sinais fracos para tecnologias emergentes a partir da identificação e monitoramento temporal de palavras novas, uma vez que, o modelo é capaz de obter a contextualização dinâmica das palavras novas identificadas. Além disso, como contribuição enaltece-se a viabilidade e importância de abordagens quantitativas e computacionais para a detecção de sinais fracos, particularmente, considerando dados não estruturados como os textos. Assim, o modelo desenvolvido demonstrou competência em prover sinais fracos que apontam para novas tecnologias com antecedência colaborando para processos de planejamento estratégico.Abstract: Weak signals are fragments of information that initially may appear vague or disconnected, but they act as indicators of a future event and potential emerging issues. In particular, the technological domain stands out in its interest to anticipate information, given the close relationship between technological advancement and competitive advantage. In this perspective, weak signals are relevant information for strategic planning. The current context of accelerated development emphasizes the need for an approach that considers the concept of uncertainty in strategic planning, enabling the anticipation of information to take advantages and minimize risks. Given this scenario, this thesis proposes a knowledge discovery in text model for detecting weak signals for emerging technologies. The proposition is premised on the understanding of words as the lowest level of abstraction of information based on Peirce's semiotic theory, and thus, a way to aim for maximum anticipation. The developed model followed the Design Science Research Methodology guidelines and focused on exploring the semantics contained in the unstructured part of the data in documents as scientific and technological publications. The model has three text mining tasks as its core: (1) identification of new signals: discovery of new words; (2) identification of latent signals: temporal monitoring of words; and (3) identification of weak signals: estimation of potential technological impact. For its operationalization methods and techniques of natural language processing and temporal network analysis techniques are implemented, such as the BERT embedding model and burst analysis of temporal networks. The conceptual demonstration of the model and its simulated operationalization based on a real scenario showed satisfactory results. Evidencing the ability to obtain weak signals for emerging technologies by identifying and monitoring new words, once the model is capable of obtain the contextualization of the new identified words. Furthermore, as a contribution, the feasibility and importance of quantitative and computational approaches for detecting weak signals are highlighted, specially approaches toward non structured data as texts. Thus, the developed model proves to be capable of providing weak signals that point to new technologies in advance, thus contributing to strategic planning processes.
Description: Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2023.
URI: https://repositorio.ufsc.br/handle/123456789/251831
Date: 2023


Files in this item

Files Size Format View
PEGC0788-T.pdf 10.02Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record

Search DSpace


Browse

My Account

Statistics

Compartilhar