Recomendação ordenada de classes de patentes por meio da técnica de Embedding
Show simple item record
dc.contributor |
Universidade Federal de Santa Catarina. |
pt_BR |
dc.contributor.advisor |
Gonçalves, Alexandre Leopoldo |
|
dc.contributor.author |
Guedes, Rodrigo Bueno |
|
dc.date.accessioned |
2023-07-12T18:31:55Z |
|
dc.date.available |
2023-07-12T18:31:55Z |
|
dc.date.issued |
2023-07-10 |
|
dc.identifier.uri |
https://repositorio.ufsc.br/handle/123456789/248750 |
|
dc.description |
TCC (graduação) - Universidade Federal de Santa Catarina, Campus Araranguá, Engenharia de Computação. |
pt_BR |
dc.description.abstract |
Patentes representam uma fonte de informação valiosa quanto às invenções tecnológicas e possibilidades de análises em variados cenários com o objetivo de auxiliar na tomada de decisão estratégica, principalmente àquelas voltadas à pesquisa, desenvolvimento e inovação. Ademais, fornecem insumos para uma ampla gama de tarefas, entre elas a tarefa de classificação de patentes. Todavia, devido a quantidade de categorias envolvidas no processo de avaliação por examinadores, classificar uma patente constitui-se em uma atividade dispendiosa e de difícil realização. Neste contexto, o presente trabalho propõe o desenvolvimento de um método de classificação baseado em Aprendizado Profundo voltado à recomendação de subclasses de patentes de maneira ordenada pela sua relevância, ou seja, um ranking. Para tal, um modelo pré-treinado de Processamento de Linguagem Natural foi considerado com o intuito de representar patentes na forma de vetores densos (embeddings). Visando cumprir este objetivo utilizou-se um conjunto de patentes presentes no dataset USPTO-2M® referentes aos anos de 2014 e 2015, sendo utilizados para as fases de treinamento e teste do método, respectivamente. Para a análise do método foram estabelecidos três cenários específicos e um cenário geral. No primeiro caso, apresentou-se de maneira detalhada como a recomendação de subclasses na forma de ranking funciona, além de analisar exemplos pontuais com o intuito de clarificar os resultados gerais obtidos. Por outro lado, o cenário geral apresentou os resultados com diferentes configurações na quantidade de subclasses recomendadas (k) para diferentes níveis de recuperação de documentos de patentes (n). Os resultados se mostram consistentes, atingindo uma acurácia em torno de 80% para valores de k entre 5 e 6, levando em conta um n de 50 documentos retornados para a análise e composição do ranking de subclasses. Diante dos resultados, o método proposto de recomendação ordenada de subclasses mostrou-se viável, com potencial para auxiliar examinadores na tarefa de classificação de patentes. |
pt_BR |
dc.language.iso |
pt_BR |
pt_BR |
dc.publisher |
Araranguá, SC. |
pt_BR |
dc.rights |
Open Access. |
en |
dc.subject |
análise de patentes |
pt_BR |
dc.subject |
classificação de patentes |
pt_BR |
dc.subject |
classificação multi-saída |
pt_BR |
dc.subject |
incorporação de palavras |
pt_BR |
dc.title |
Recomendação ordenada de classes de patentes por meio da técnica de Embedding |
pt_BR |
dc.type |
TCCgrad |
pt_BR |
Files in this item
This item appears in the following Collection(s)
Show simple item record
Search DSpace
Browse
-
All of DSpace
-
This Collection
My Account
Statistics
Compartilhar