Prompt completo
"Você é um engenheiro de machine learning sênior, com vasta experiência em depuração de modelos complexos e pipelines de dados. Um cientista de dados júnior em sua equipe está enfrentando um problema persistente: um modelo de classificação de churn de clientes em produção começou a apresentar uma queda significativa e inexplicável na performance (AUC) nos últimos 3 dias, sem que nenhuma alteração no código ou nos dados de treinamento/inferência tenha sido explicitamente implantada. O modelo usa features de comportamento do cliente (histórico de compras, interações com o suporte, uso do aplicativo) e é treinado com LightGBM. **Sua tarefa é elaborar um guia passo a passo, detalhado e acionável, para o cientista de dados júnior investigar e depurar este problema. O guia deve cobrir as etapas mais prováveis e eficientes para identificar a causa raiz da queda de performance. Considere cenários como:** 1. **Degradação dos dados de entrada (data drift/data quality issues):** Como verificar se os dados de inferência recentes são consistentes com os dados de treinamento, e como identificar anomalias nos dados de entrada que poderiam estar 'quebrando' o modelo. 2. **Problemas na pipeline de inferência:** Como investigar se há erros silenciosos ou alterações inesperadas no pré-processamento, engenharia de features ou na própria chamada do modelo em produção. 3. **Monitoramento e métricas:** Quais métricas adicionais, além da AUC, deveriam ser monitoradas (e.g., distribuição de predições, calibração, feature importance ao longo do tempo) e como interpretá-las para diagnosticar o problema. 4. **Análise do próprio modelo:** Embora nenhuma mudança tenha sido 'implantada', como investigar se o modelo em si foi corrompido, substituído acidentalmente ou se há algum problema de versionamento. 5. **Ambiente de execução:** Como descartar problemas no ambiente de produção (e.g., recursos, bibliotecas desatualizadas). O guia deve ser claro, conciso e priorizar as ações com maior probabilidade de sucesso. Utilize exemplos práticos de comandos, ferramentas ou abordagens sempre que possível, sem ser excessivamente específico a uma única ferramenta, mas sim focado em princípios gerais de depuração. O objetivo final é capacitar
Tags relacionadas
Ciência de Dados
Debugging em Ciência de Dados
gerado-automaticamente
Como usar este prompt
1
Clique no botão "Copiar" para copiar o prompt para sua área de transferência
2
Acesse sua ferramenta de IA preferida (ChatGPT, ChatGPT, Claude, etc.)
3
Cole o prompt e adapte conforme necessário para seu contexto específico
Outros prompts de Ciência de Dados
ChatGPT
Guia para fundamentos de ciência de dados em Ciência de Dados
Prompt gerado automaticamente para Fundamentos de Ciência de Dados em Ciência de Dados
3 usos
ChatGPT
Guia para casos de uso práticos em ciência de dados em Ciência de Dados
Prompt gerado automaticamente para Casos de uso práticos em Ciência de Dados em Ciência de Dados
3 usos
ChatGPT
Estratégias de troubleshooting em ciência de dados em Ciência de Dados
Prompt gerado automaticamente para Troubleshooting em Ciência de Dados em Ciência de Dados
3 usos