📊
ChatGPT intermediate

Estratégias de debugging em ciência de dados em Ciência de Dados

Prompt gerado automaticamente para Debugging em Ciência de Dados em Ciência de Dados

2 usos Ciência de Dados

Prompt completo

**Prompt:**

"Você é um cientista de dados sênior e consultor especializado em otimização de fluxo de trabalho e depuração de modelos. Um cliente, uma startup de Machine Learning em rápido crescimento, está enfrentando um problema persistente: o modelo de recomendação de produtos em produção, baseado em um algoritmo de aprendizado supervisionado (classificação multi-classe), ocasionalmente retorna recomendações completamente irrelevantes ou até mesmo nulas para um pequeno percentual de usuários. O problema é intermitente e não se correlaciona diretamente com picos de tráfego ou atualizações de código recentes. Eles já verificaram a integridade dos dados de entrada, a versão do modelo implantado e os logs de erro básicos da aplicação.

Sua tarefa é criar um guia passo a passo detalhado para o time de engenharia de MLOps e cientistas de dados dessa startup, focado em metodologias de depuração sistemática para identificar a causa raiz desse comportamento anômalo. O guia deve abranger as seguintes áreas, com exemplos práticos ou sugestões de ferramentas/abordagens para cada ponto:

1.  **Monitoramento Avançado de Modelos:** O que monitorar além das métricas de desempenho agregadas (acurácia, precisão, recall, F1-score)? Como identificar desvios em subpopulações de usuários ou tipos de produtos?
2.  **Análise de Desempenho por Segmento:** Como segmentar os dados e as previsões para isolar os casos problemáticos? Quais técnicas podem ser usadas para visualizar e comparar o comportamento do modelo em diferentes segmentos (ex: usuários novos vs. antigos, produtos de alta vs. baixa demanda, etc.)?
3.  **Inspeção de Previsões Individuais (Post-hoc Explanations):** Quais ferramentas ou métodos podem ser empregados para entender por que o modelo fez uma recomendação específica (ou nula) para um determinado usuário? Como usar técnicas de explicabilidade (SHAP, LIME, etc.) para depurar erros em casos específicos?
4.  **Verificação de Desvio de Dados (Data Drift) e Desvio de Conceito (Concept Drift):** Como detectar mudanças sutis na distribuição dos dados de entrada ou na relação entre features e targets que possam estar impactando o desempenho do modelo em produção?
5.  **Testes de Robust

Tags relacionadas

Ciência de Dados Debugging em Ciência de Dados gerado-automaticamente

Como usar este prompt

1

Clique no botão "Copiar" para copiar o prompt para sua área de transferência

2

Acesse sua ferramenta de IA preferida (ChatGPT, ChatGPT, Claude, etc.)

3

Cole o prompt e adapte conforme necessário para seu contexto específico