Melhores práticas de debugging em ciência de dados para Ciência de Dados

Prompt gerado automaticamente para Debugging em Ciência de Dados em Ciência de Dados

5.0
40 usos
ChatGPT
Usar no ChatGPT
"Você é um engenheiro de machine learning sênior, com vasta experiência em depuração de modelos complexos e pipelines de dados. Um cientista de dados júnior em sua equipe está enfrentando um problema persistente: um modelo de classificação de churn de clientes em produção começou a apresentar uma queda significativa e inexplicável na performance (AUC) nos últimos 3 dias, sem que nenhuma alteração no código ou nos dados de treinamento/inferência tenha sido explicitamente implantada. O modelo usa features de comportamento do cliente (histórico de compras, interações com o suporte, uso do aplicativo) e é treinado com LightGBM.

**Sua tarefa é elaborar um guia passo a passo, detalhado e acionável, para o cientista de dados júnior investigar e depurar este problema. O guia deve cobrir as etapas mais prováveis e eficientes para identificar a causa raiz da queda de performance. Considere cenários como:**

1.  **Degradação dos dados de entrada (data drift/data quality issues):** Como verificar se os dados de inferência recentes são consistentes com os dados de treinamento, e como identificar anomalias nos dados de entrada que poderiam estar 'quebrando' o modelo.
2.  **Problemas na pipeline de inferência:** Como investigar se há erros silenciosos ou alterações inesperadas no pré-processamento, engenharia de features ou na própria chamada do modelo em produção.
3.  **Monitoramento e métricas:** Quais métricas adicionais, além da AUC, deveriam ser monitoradas (e.g., distribuição de predições, calibração, feature importance ao longo do tempo) e como interpretá-las para diagnosticar o problema.
4.  **Análise do próprio modelo:** Embora nenhuma mudança tenha sido 'implantada', como investigar se o modelo em si foi corrompido, substituído acidentalmente ou se há algum problema de versionamento.
5.  **Ambiente de execução:** Como descartar problemas no ambiente de produção (e.g., recursos, bibliotecas desatualizadas).

O guia deve ser claro, conciso e priorizar as ações com maior probabilidade de sucesso. Utilize exemplos práticos de comandos, ferramentas ou abordagens sempre que possível, sem ser excessivamente específico a uma única ferramenta, mas sim focado em princípios gerais de depuração. O objetivo final é capacitar

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!

Outros prompts de Ciência de Dados

Continue explorando prompts nesta categoria.

Guia para otimização e performance em ciência de dados em Ciência de Dados

Prompt gerado automaticamente para Otimização e performance em Ciência de Dados em Ciência de Dados

Guia para casos de uso práticos em ciência de dados em Ciência de Dados

Prompt gerado automaticamente para Casos de uso práticos em Ciência de Dados em Ciência de Dados

Guia para fundamentos de ciência de dados em Ciência de Dados

Prompt gerado automaticamente para Fundamentos de Ciência de Dados em Ciência de Dados