Aprendizado de Máquina para Detecção de Anomalias em Bancos de Dados de Clientes - Parceria com o Instituto Eldorado/Dell (2021 - Finalizado)

1 minuto(s) de leitura

Este projeto concentra-se na aplicação de algoritmos de aprendizado de máquina para identificar anomalias e valores atípicos em grandes conjuntos de dados de clientes. O objetivo primordial é aprimorar a precisão dessas detecções e otimizar o processo por meio da utilização de dados, engenharia de características e métodos avançados de machine learning.

Ao adotar um fluxo de trabalho padrão de aprendizado de máquina e integrar as melhores práticas de DevOps e MLOps (operações de machine learning), o projeto busca aumentar a agilidade das experimentações e a escalabilidade do processo para aplicação em outros conjuntos de dados e equipes. O foco na incorporação de práticas de DevOps e MLOps é fundamental para garantir a eficiência, automação e simplificação contínuas ao longo de todas as fases do projeto.

ML_architecture_final

Resultados obtidos

No contexto do projeto, uma série de atividades cruciais foram empreendidas para viabilizar o desenvolvimento e aprimoramento de uma metodologia robusta. Inicialmente, foi realizada uma análise minuciosa das informações e das atividades executadas, visando estabelecer uma metodologia que defina a clusterização e os critérios para a transformação dos dados. Ademais, é de suma importância contribuir para o desenvolvimento dos critérios fundamentais empregados na fase de Extração, Transformação e Carga (ETL). Uma parte significativa do projeto envolve a criação de soluções capazes de detectar anomalias nas transformações da ETL, além de gerar feedbacks pertinentes para aprimoramentos futuros.

Com base no banco de dados de clientes (costumers), foram criados modelos de machine learning com o propósito de identificar outliers e um modelo específico destinado à detecção de keyboardsmashing.

Além das atividades mencionadas, outro ponto de destaque são os artefatos produzidos. São elaboradas documentações abrangentes que descrevem detalhadamente as metodologias, técnicas, ferramentas e processos testados em cada hipótese ou modelo de Machine Learning explorado. Paralelamente, há a criação de documentação detalhada sobre as metodologias, técnicas, ferramentas e processos adotados no processo de detecção de outliers, bem como nos testes dos modelos de Machine Learning utilizados. Esses artefatos documentais desempenham um papel crucial para o entendimento, registro e disseminação dos resultados e métodos desenvolvidos ao longo do projeto.

Financiamento

Finalizado

  • Instituto Eldorado - Projeto de Pesquisa - (2021)

Contatos

Atualizado em: