Title: | Estudo e Implementação de Entity Linking e extração de participantes de narrativas em Processamento de Linguagem Natural |
Author: | Machado, Juliana |
Abstract: |
O entity linking e a extração de participantes em narrativas textuais são importantes áreas do Processamento de Linguagem Natural (PLN), importantes para compreender e extrair significados de textos não estruturados. Este trabalho de fim de curso tem o objetivo de estudar a eficácia do DBpedia Spotlight, uma ferramenta de entity linking baseada no DBpedia, implementada no projeto Text2Story do INESC TEC para analisar textos jornalísticos em língua portuguesa. O DBpedia Spotlight identifica entidades mencionadas nos textos e as vincula com suas respectivas páginas na DBpedia, trazendo mais informações da entidade reconhecida, podendo assim, enriquecer e melhorar a compreensão do texto. Os resultados deste estudo indicam que o DBpedia Spotlight é promissor na identificação de participantes em narrativas jornalísticas, demonstrando desempenho eficaz em textos jornalísticos e ressaltando sua utilidade para análises em português, ainda assim, também trazem alguns desafios que devem ser enfrentados ao longo do contínuo estudo de ferramentas de entity linking. A ferramenta escolhida para implementação, facilita a obtenção de informações contextuais, aprimorando a interpretação das narrativas. Este estudo destaca o potencial das bases de conhecimento como o DBpedia para melhorar a compreensão narrativa e sugere que futuras pesquisas explorem técnicas de entity linking e extração de participantes em diversos domínios e idiomas. Entity linking and extraction of participants in textual narratives are important areas of Natural Language Processing (NLP), important for understanding and extract meanings from unstructured texts. This final course work has the objective of studying the effectiveness of DBpedia Spotlight, an entity linking tool based on DBpedia, implemented in INESC TEC’s Text2Story project to analyze journalistic texts in Portuguese. DBpedia Spotlight identifies entities mentioned in the texts and links them to their respective pages on DBpedia, providing additional information about the recognized entity and enriching the text’s comprehension. The results of this study indicate that DBpedia Spotlight is promising in identifying participants in journalistic narratives, demonstrating effective performance in journalistic texts and highlighting their usefulness for analyzes in Portuguese, however, they also bring some challenges that must be faced throughout the continuous study of entity linking tools. The tool facilitates the acquisition of contextual information, enhancing the interpretation of narratives. This study highlights the potential of knowledge bases like DBpedia to improve narrative understanding and suggests that future research explore entity linking and participant extraction techniques in various domains and languages. |
Description: | TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Engenharia de Controle e Automação. |
URI: | https://repositorio.ufsc.br/handle/123456789/256415 |
Date: | 2024-07-12 |
Files | Size | Format | View | Description |
---|---|---|---|---|
TCC_Juliana_Machado.pdf | 10.62Mb |
View/ |
TCC |