MN

Matheus Neves da Silva

Analista & Cientista de Dados

Transformando dados em insights acionáveis e construindo pipelines robustos para decisões baseadas em dados

Sobre Mim

Engenharia de Dados

Construção de pipelines ETL robustos, automação de processos e arquitetura de dados escalável

Análise de Dados

Análise exploratória, visualização de dados e geração de insights para decisões estratégicas

Desenvolvimento

Scripts automatizados, APIs de dados e ferramentas personalizadas para otimização de processos

Com 1,5 anos de experiência profissional, desenvolvi soluções de dados que impactaram diretamente a eficiência operacional e a tomada de decisão. Especializado em transformar processos manuais em pipelines automatizados e dados brutos em insights acionáveis.

Projetos

Machine Learning & Data Science

Sistema de Predição de Depressão

Pipeline completo de ML para identificação precoce de depressão, com acurácia de 94%. Análise de 2.556 casos incluindo EDA, feature engineering e modelagem preditiva.

Python Scikit-learn Pandas Plotly Random Forest
Acurácia de 94% e AUC ROC de 0.94
Classes customizadas para automação (PsyCleaner, PsyPreditor)
Visualizações interativas e análise de grupos de risco
Engenharia de Dados

Pipeline de ETL Automatizado

Desenvolvimento de pipeline automatizado para extração, transformação e carga de dados de múltiplas fontes.

Python Pandas PostgreSQL Airflow
Redução de 70% no tempo de processamento
Automação completa de processo manual
Tratamento de dados de 5+ fontes diferentes
Análise de Dados

Dashboard Analytics Executivo

Criação de dashboard interativo para análise de KPIs e métricas de negócio em tempo real.

Power BI SQL DAX
Visualização de 15+ métricas principais
Atualização automática diária
Insights acionáveis para tomada de decisão
Engenharia de Dados

Sistema de Qualidade de Dados

Implementação de sistema para monitoramento e validação da qualidade dos dados corporativos.

Python Great Expectations SQL
Identificação automática de anomalias
Redução de 85% em erros de dados
Alertas em tempo real

Projetos em Desenvolvimento

Projetos ativos que demonstram meu processo de trabalho e evolução contínua em ciência de dados

Em Desenvolvimento
Machine Learning & Business Analytics

Previsão de Churn em Telecomunicações

Projeto end-to-end de ciência de dados para identificar clientes com alto risco de cancelamento. Análise exploratória completa revelou insights críticos: clientes Month-to-month com tenure < 12 meses apresentam taxa de churn de 57%, representando perda estimada de R$ 1,5M/ano.

Progresso do Projeto 40%

Status das Etapas

Análise Exploratória de Dados (EDA) - Completa
Identificação de Perfis de Alto Risco - Completa
Recomendações Estratégicas de Negócio - Completa
Feature Engineering - Em andamento
Modelagem (Regressão Logística, Random Forest, XGBoost)
Avaliação de Performance (Precision, Recall, F1-Score)
Deploy e Documentação Final

Principais Descobertas (EDA)

Perfil de Alto Risco

57% de churn em contratos Month-to-month com tenure < 12 meses

Impacto Financeiro

~R$ 1,5M/ano em receita perdida (27% de taxa de churn)

Método de Pagamento

Cheque eletrônico tem maior correlação com churn

Zona de Fidelização

Clientes com tenure > 12 meses têm baixa taxa de churn

Stack Tecnológica

Python Pandas NumPy Matplotlib Seaborn Scikit-learn Em breve: XGBoost

Valor de Negócio Entregue

  • Identificação de 3 segmentos de risco críticos para ações de retenção
  • Programa de retenção segmentado por tenure com potencial de reduzir 15-20% do churn
  • Recomendações acionáveis: promoções iniciais, migração de método de pagamento, incentivo a contratos longos

Entre em Contato