Abstract:
|
Dados tabulares são uma forma de armazenamento de dados muito comum em diversas áreas do conhecimento, sendo os Bancos de Dados Relacionais a principal tecnologia para este propósito. Esse tipo de banco de dado faz uso da Linguagem de Consulta Estruturada (SQL) para recuperação dos dados armazenados. Todavia, para a criação de consultas nessa linguagem, são requeridos conhecimentos técnicos, dificultando que usuários comuns acessem dados e gerem informações sem contar com auxílio especializado. Mais recentemente, através dos Grandes Modelos de Linguagem (LLM) e da Inteligência Artificial Generativa (GenAI), tem-se buscado preencher essa lacuna por meio da geração de consultas automatizadas a partir de linguagem natural. O método aqui proposto trata de uma implementação na área de Respostas à Perguntas (QA), capaz de receber uma pergunta do usuário na forma de texto, criar uma consulta SQL para coletar dados necessários para respondê-la e gerar uma análise sobre os resultados obtidos. Nesse sentido, o trabalho objetiva permitir que usuários sem conhecimento técnico em SQL interajam com bancos de dados relacionais em linguagem natural. Para a avaliação do método foram coletados dados do Inep na área educacional e foram criadas cinco perguntas com complexidade crescente. Os resultados obtidos mostram uma boa capacidade de geração de consultas SQL para perguntas de menor complexidade, assim como a geração de consultas sintaticamente corretas, mas semanticamente incorretas para perguntas complexas. As análises, na forma de texto, sobre os resultados das consultas SQL se mostram adequadas e promovem uma visão descritiva que possui sua relevância, mas, de maneira geral, adicionam pouca informação na forma de insights que possam melhorar a tomada de decisão. |