Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro

Heck, Amabyle Rabeche

Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro

DSpace Repository

A- A A+

Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro

Show simple item record

dc.contributor	Universidade Federal de Santa Catarina	pt_BR
dc.contributor.advisor	Antonelo, Eric Aislan
dc.contributor.author	Heck, Amabyle Rabeche
dc.date.accessioned	2022-03-28T18:34:14Z
dc.date.available	2022-03-28T18:34:14Z
dc.date.issued	2022-03-21
dc.identifier.uri	https://repositorio.ufsc.br/handle/123456789/233250
dc.description	TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação.	pt_BR
dc.description.abstract	O Reconhecimento de Entidades Nomeadas (REN) (ou Named Entity Recognition (NER)) é uma técnica de Processamento de Linguagem Natural (PLN) que consiste em encontrar e identificar nomes de entidades pré-definidas (como pessoas, organizações, locais, etc.) em dados textuais. Essa tarefa é uma forma de extração de informação de documentos, o que facilita a análise e a manipulação deles. Este projeto tem como objetivo obter um modelo de Inteligência Artificial (IA) que realize a tarefa de NER especificamente em textos legais escritos no idioma Português Brasileiro, reconhecendo as entidades Pessoa, Tempo, Local, Organização, Legislação e Jurisprudência. As arquiteturas de redes neurais utilizadas foram Bidirectional Long Short-Term Memory (BiLSTM) e Bidirectional Encoder Representation from Transformers (BERT) (pré-treinada em língua portuguesa brasileira), com e sem camadas Conditional Random Field (CRF). O dataset de textos jurídicos usado para realizar os treinamentos foi o LeNER-Br. As métricas para avaliar os desempenhos foram precisão, recall e F1-score, e o modelo treinado com melhor performance, uma rede BERT-CRF, obteve valores de métricas de, respectivamente, 90,16%, 91,86% e 91,00%, superando o modelo baseline.	pt_BR
dc.description.abstract	Named Entity Recognition is a Natural Language Processing technique that consists in finding and identifying names of pre-defined entities (such as people, organizations, locations, etc.) in textual data. This task is a type of information extraction from documents that facilitate their analysis and manipulation. This project’s objective is to obtain a Artificial Intelligence model that perform the NER task specifically in legal texts written in Brazilian Portuguese, recognizing the entities Person, Time, Location, Organization, Legislation (Laws) and Legal Cases. The neural networks architectures chosen were Bidirectional Long Short-Term Memory (BiLSTM) and Bidirectional Encoder Representation from Transformers (BERT) (pre-trained in Brazilian Portuguese), both with and without Conditional Random Fields layers. The legal texts dataset used for training was LeNER-Br. Metrics used to evaluate the performances were precision, recall and F1-score, and the trained model with the best results (a BERT-CRF neural network) achieved the following values of metrics, respectively, 90,16%, 91,86% and 91,00%, surpassing the baseline model.	pt_BR
dc.format.extent	71	pt_BR
dc.language.iso	por	pt_BR
dc.publisher	Florianópolis, SC.	pt_BR
dc.rights	Open Access
dc.subject	Processamento de Linguagem Natural	pt_BR
dc.subject	Reconhecimento de Entidades Nomeadas	pt_BR
dc.subject	Redes neurais	pt_BR
dc.title	Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro	pt_BR
dc.type	Tese (Doutorado)	pt_BR

Files in this item

Files	Size	Format	View
Monografia_PFC-Final-A.pdf	1.534Mb	PDF	View/Open

This item appears in the following Collection(s)

TCC Engenharia de Controle e Automação [520]
Engenharia de Controle e Automação

Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro

DSpace Repository

Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro

Files in this item

This item appears in the following Collection(s)

Search DSpace

Browse

All of DSpace

This Collection

My Account

Statistics

Compartilhar