Prompt completo
**Prompt:** "Você é um cientista de dados sênior e consultor especializado em otimização de fluxo de trabalho e depuração de modelos. Um cliente, uma startup de Machine Learning em rápido crescimento, está enfrentando um problema persistente: o modelo de recomendação de produtos em produção, baseado em um algoritmo de aprendizado supervisionado (classificação multi-classe), ocasionalmente retorna recomendações completamente irrelevantes ou até mesmo nulas para um pequeno percentual de usuários. O problema é intermitente e não se correlaciona diretamente com picos de tráfego ou atualizações de código recentes. Eles já verificaram a integridade dos dados de entrada, a versão do modelo implantado e os logs de erro básicos da aplicação. Sua tarefa é criar um guia passo a passo detalhado para o time de engenharia de MLOps e cientistas de dados dessa startup, focado em metodologias de depuração sistemática para identificar a causa raiz desse comportamento anômalo. O guia deve abranger as seguintes áreas, com exemplos práticos ou sugestões de ferramentas/abordagens para cada ponto: 1. **Monitoramento Avançado de Modelos:** O que monitorar além das métricas de desempenho agregadas (acurácia, precisão, recall, F1-score)? Como identificar desvios em subpopulações de usuários ou tipos de produtos? 2. **Análise de Desempenho por Segmento:** Como segmentar os dados e as previsões para isolar os casos problemáticos? Quais técnicas podem ser usadas para visualizar e comparar o comportamento do modelo em diferentes segmentos (ex: usuários novos vs. antigos, produtos de alta vs. baixa demanda, etc.)? 3. **Inspeção de Previsões Individuais (Post-hoc Explanations):** Quais ferramentas ou métodos podem ser empregados para entender por que o modelo fez uma recomendação específica (ou nula) para um determinado usuário? Como usar técnicas de explicabilidade (SHAP, LIME, etc.) para depurar erros em casos específicos? 4. **Verificação de Desvio de Dados (Data Drift) e Desvio de Conceito (Concept Drift):** Como detectar mudanças sutis na distribuição dos dados de entrada ou na relação entre features e targets que possam estar impactando o desempenho do modelo em produção? 5. **Testes de Robust
Tags relacionadas
Ciência de Dados
Debugging em Ciência de Dados
gerado-automaticamente
Como usar este prompt
1
Clique no botão "Copiar" para copiar o prompt para sua área de transferência
2
Acesse sua ferramenta de IA preferida (ChatGPT, ChatGPT, Claude, etc.)
3
Cole o prompt e adapte conforme necessário para seu contexto específico
Outros prompts de Ciência de Dados
ChatGPT
Guia para otimização e performance em ciência de dados em Ciência de Dados
Prompt gerado automaticamente para Otimização e performance em Ciência de Dados em Ciência de Dados
4 usos
ChatGPT
Guia para fundamentos de ciência de dados em Ciência de Dados
Prompt gerado automaticamente para Fundamentos de Ciência de Dados em Ciência de Dados
4 usos
ChatGPT
Guia para casos de uso práticos em ciência de dados em Ciência de Dados
Prompt gerado automaticamente para Casos de uso práticos em Ciência de Dados em Ciência de Dados
4 usos