📊
ChatGPT intermediate

Melhores práticas de debugging em ciência de dados para Ciência de Dados

Prompt gerado automaticamente para Debugging em Ciência de Dados em Ciência de Dados

4 usos Ciência de Dados

Prompt completo

"Você é um engenheiro de machine learning sênior, com vasta experiência em depuração de modelos complexos e pipelines de dados. Um cientista de dados júnior em sua equipe está enfrentando um problema persistente: um modelo de classificação de churn de clientes em produção começou a apresentar uma queda significativa e inexplicável na performance (AUC) nos últimos 3 dias, sem que nenhuma alteração no código ou nos dados de treinamento/inferência tenha sido explicitamente implantada. O modelo usa features de comportamento do cliente (histórico de compras, interações com o suporte, uso do aplicativo) e é treinado com LightGBM.

**Sua tarefa é elaborar um guia passo a passo, detalhado e acionável, para o cientista de dados júnior investigar e depurar este problema. O guia deve cobrir as etapas mais prováveis e eficientes para identificar a causa raiz da queda de performance. Considere cenários como:**

1.  **Degradação dos dados de entrada (data drift/data quality issues):** Como verificar se os dados de inferência recentes são consistentes com os dados de treinamento, e como identificar anomalias nos dados de entrada que poderiam estar 'quebrando' o modelo.
2.  **Problemas na pipeline de inferência:** Como investigar se há erros silenciosos ou alterações inesperadas no pré-processamento, engenharia de features ou na própria chamada do modelo em produção.
3.  **Monitoramento e métricas:** Quais métricas adicionais, além da AUC, deveriam ser monitoradas (e.g., distribuição de predições, calibração, feature importance ao longo do tempo) e como interpretá-las para diagnosticar o problema.
4.  **Análise do próprio modelo:** Embora nenhuma mudança tenha sido 'implantada', como investigar se o modelo em si foi corrompido, substituído acidentalmente ou se há algum problema de versionamento.
5.  **Ambiente de execução:** Como descartar problemas no ambiente de produção (e.g., recursos, bibliotecas desatualizadas).

O guia deve ser claro, conciso e priorizar as ações com maior probabilidade de sucesso. Utilize exemplos práticos de comandos, ferramentas ou abordagens sempre que possível, sem ser excessivamente específico a uma única ferramenta, mas sim focado em princípios gerais de depuração. O objetivo final é capacitar

Tags relacionadas

Ciência de Dados Debugging em Ciência de Dados gerado-automaticamente

Como usar este prompt

1

Clique no botão "Copiar" para copiar o prompt para sua área de transferência

2

Acesse sua ferramenta de IA preferida (ChatGPT, ChatGPT, Claude, etc.)

3

Cole o prompt e adapte conforme necessário para seu contexto específico