dc.contributor |
Universidade Federal de Santa Catarina |
pt_BR |
dc.contributor.advisor |
Gonçalves, Alexandre L. |
|
dc.contributor.author |
Murguero Júnior, Ronaldo Tadeu |
|
dc.date.accessioned |
2013-04-04T18:20:34Z |
|
dc.date.available |
2013-04-04T18:20:34Z |
|
dc.date.issued |
2013-02-22 |
|
dc.date.submitted |
2013-02-22 |
|
dc.identifier.uri |
http://repositorio.ufsc.br/xmlui/handle/123456789/99631 |
|
dc.description |
TCC (graduação) - Universidade Federal de Santa Catarina, Campus Araranguá, Curso de Tecnologias da Informação e Comunicação. |
pt_BR |
dc.description.abstract |
Uma quantidade cada vez maior de informações está disponível em formato textual e eletrônico. Essas informações contêm padrões textuais, tais como, conceitos, relacionamentos, regras, entre outros, podendo ser de grande auxílio na integração com outros sistemas ou mesmo, para auxiliar processos de tomada de decisão. Contudo, existe uma grande preocupação em como recuperar, organizar, armazenar e compartilhar estes padrões considerando uma formalização adequada. Neste sentido, a área de Extração de Informação promove suporte através de técnicas que analisam o texto e extraem padrões tidos como relevantes. Após a fase de extração, torna-se necessária a correta atribuição dos padrões para classes de um domínio em particular, em que estes passam a se chamar entidades. Tal processo é realizado através da subárea chamada de Reconhecimento de Entidades. Além disso, visando o compartilhamento e a manutenção de determinado domínio de conhecimento, as entidades devem ser armazenadas em um meio que possibilite atingir tais objetivos. Neste contexto a área de Ontologia se insere. Para demonstrar a viabilidade da proposição deste trabalho foi desenvolvido um protótipo voltado às fases de extração e reconhecimento de entidades, bem como, a adição dessas entidades em uma ontologia para posterior manutenção. O processo de manutenção envolve a participação de um especialista de domínio responsável por validar os conceitos e modificar estes para as suas devidas classes quando necessário. Sendo assim, a manutenção pode ser entendida como semiautomática. De modo geral, a aplicação do protótipo em alguns cenários permitiu demonstrar que o sistema proposto é capaz de obter resultados satisfatórios, ainda que iniciais, mesmo que não exista conhecimento prévio de determinado domínio. |
pt_BR |
dc.description.abstract |
An increasing amount of information is available in textual and electronic format. This information has textual patterns, such as concepts, relationships, rules, among others. It can be valuable whether integrated with other systems or even to support decision making processes. However, there is great concern about how to retrieve, organize, store and share these patterns considering a suitable formalization. In this sense, the Information Extraction area promotes support through techniques that analyze the text and extract patterns regarded as relevant. After extraction phase it becomes necessary the correct assignment of patterns to classes in a particular domain. Thus, these patterns are called entities. This process is accomplished through the Named Entity Recognition area. Additionally, aiming sharing and maintenance of a specific knowledge domain, entities should be stored in a way that allows achieve these goals. In this context the Ontology area stands. To demonstrate the feasibility of the proposed work we have developed a prototype toward pattern extraction and entity recognition phases, as well as the addition of these entities into ontology for subsequent analyses. The maintenance process involves the participation of a domain expert which is responsible for the concepts validation, as well as by moving these entities to the properly classes when needed. Thus, maintenance can be understood as semiautomatic. In general, the application of the prototype in some scenarios demonstrated that the proposed system, although in an initial stage, is able to obtain satisfactory results even without prior knowledge of a particular domain. |
pt_BR |
dc.format.extent |
63p. |
pt_BR |
dc.language.iso |
pt_BR |
pt_BR |
dc.subject |
Extração de informação. |
pt_BR |
dc.subject |
Reconhecimento de entidades nomeadas. |
pt_BR |
dc.subject |
Ontologia. |
pt_BR |
dc.subject |
Manutenção de ontologia. |
pt_BR |
dc.title |
Um sistema de manutenção semiautomática de ontologias a partir do reconhecimento de entidades. |
pt_BR |
dc.type |
TCCgrad |
pt_BR |