Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento
Show simple item record
dc.contributor |
Universidade Federal de Santa Catarina |
pt_BR |
dc.contributor.advisor |
Hubner, Jomi Fred |
|
dc.contributor.author |
Pelison, Luis Felipe |
|
dc.date.accessioned |
2019-08-21T19:24:31Z |
|
dc.date.available |
2019-08-21T19:24:31Z |
|
dc.date.issued |
2018 |
|
dc.identifier.uri |
https://repositorio.ufsc.br/handle/123456789/200013 |
|
dc.description |
TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação. |
pt_BR |
dc.description.abstract |
A Neoway Business Solutions, empresa brasileira focada em inteligência de negócios a
partir de um grande volume de dados, coletados em mais de 3.000 fontes públicas, atua em
um mercado Business to Business (B2B) para prospectar e entender o mercado ou prevenir
perdas dos clientes. Nesse contexto, a área interna de Analytics é responsável por gerar
inteligência em cima dos mais variados dados. O projeto desenvolvido, dentro da área de
Analytics, visa gerar inteligência a partir de dados relacionados à natureza e localidade das
empresas, a fim de predizer se o crescimento médio dos próximos três anos será superior a
17%, para qualquer empresa ativa do Brasil que possua 10 ou mais funcionários. Aliado
à inteligência, o projeto tem como objetivo validar uma abordagem muito recente no
mundo de aprendizado de máquina e ciência de dados: a geração automática de features.
Com a geração automática de features, os modelos inteligentes podem ser rapidamente
implementados, com uma redução de até 5x no tempo de desenvolvimento, comparado ao
pipeline de ciência de dados padrão. Técnicas de geração automática de features foram
estudadas e uma foi escolhida para ser utilizada. Base de dados relacionais foram utilizadas
para a geração automática de features a partir da teoria chamada Deep Feature Synthesis.
Com essas features, alguns modelos foram criados e comparados entre si. Por fim, o melhor
modelo preditivo (com features automáticas) foi comparado com outro, gerado por um
cientista de dados especialista no domínio, e atingiu resultados muito semelhantes. |
pt_BR |
dc.description.abstract |
The Neoway Business Solutions is a brazilian company focused in business intelligence for
big data. With more than 3.000 public data sources, the company operates in a Business-to-
Business (B2B) marketplace to prospect and understand the customer’s market or prevent
customer losses. At this scenario, the Neoway’s Analytics team is responsible for generating
intelligence on the most varied data. The project developed aims to generate knowledge
from data related to the firmographics, in order to predict wich brazilian company with
10 or more employees will be a High-Growth Firm. Also, the projects aims to validate
a very recent approach in the Data Science world: the Automated Feature Generation.
With this approach, smart models can be raplidly deployed, with up to a 5x reduction in
development time compared to standard Data Science pipeline. Some techniques about
Automated Feature Generation have been studied and one chosen to be used. Relational
databases were used to generate the automated features from the Deep Feature Synthesis
theory. With these new features, some models were created and compared to each other.
Lastly, the best predictive model generated (with automated features) was compared to
another, builded by a senior data scientist, and have gotten results very similar. |
pt_BR |
dc.language.iso |
pt_BR |
pt_BR |
dc.publisher |
Florianópolis, SC. |
pt_BR |
dc.rights |
Open Access |
|
dc.subject |
Geração de Features Automáticas. Engenharia de Features. Modelo Preditivo. Aprendizado de Máquina Automático. Inteligência Artificial. Empresas de Alto Crescimento. |
pt_BR |
dc.subject |
Automated Feature Generation. Automated Machine Learning. Feature Engi- neering. Deep Feature Synthesis. Artificial Intelligence. High-Growth Firms. |
pt_BR |
dc.title |
Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento |
pt_BR |
dc.type |
TCCgrad |
pt_BR |
Files in this item
This item appears in the following Collection(s)
Show simple item record
Search DSpace
Browse
-
All of DSpace
-
This Collection
My Account
Statistics
Compartilhar