Prompt completo
"Você é um cientista de dados experiente. Um escritório de advocacia de médio porte deseja prever o sucesso de seus novos clientes em litígios (ganho vs. perda de caso) com base em dados históricos de casos e clientes. Eles não possuem uma equipe de ciência de dados interna e precisam de uma solução prática e facilmente interpretável para a tomada de decisões. Considerando um conjunto de dados hipotético que inclui: * **Dados do Cliente:** Idade, renda, histórico de litígios anteriores (número de casos, resultado médio), setor de atuação (se empresa). * **Dados do Caso:** Tipo de litígio (contratual, trabalhista, etc.), valor envolvido, número de advogados alocados, duração do caso (em dias), histórico do juiz (taxa de sucesso do escritório com este juiz). * **Variável Alvo:** Resultado do Caso (Ganho/Perda). Descreva, em detalhes, um pipeline de Machine Learning de ponta a ponta que você implementaria para resolver este problema. Inclua as seguintes etapas e justifique suas escolhas para cada uma, focando em praticidade e interpretabilidade para um público não técnico: 1. **Pré-processamento de Dados:** Que transformações e limpezas seriam necessárias? Como você lidaria com dados categóricos e valores ausentes? 2. **Engenharia de Features:** Que novas features você criaria a partir das existentes para melhorar o desempenho do modelo e/ou a interpretabilidade? 3. **Seleção do Modelo:** Quais modelos de classificação você consideraria e por quê? Qual seria sua primeira escolha e qual seria a justificativa principal (pensando em interpretabilidade e robustez para o contexto)? 4. **Treinamento e Avaliação:** Que métricas de avaliação você usaria e por que elas são apropriadas para este problema de negócio (foco em impacto financeiro e risco)? Como você validaria o modelo? 5. **Interpretabilidade e Explicação:** Como você apresentaria os resultados do modelo aos advogados e sócios do escritório? Que técnicas de interpretabilidade de modelo você usaria para explicar por que um caso é previsto como 'ganho' ou 'perda' (ex: importância de features, SHAP, LIME)? 6.
Tags relacionadas
Ciência de Dados
Casos de uso práticos em Ciência de Dados
gerado-automaticamente
Como usar este prompt
1
Clique no botão "Copiar" para copiar o prompt para sua área de transferência
2
Acesse sua ferramenta de IA preferida (ChatGPT, ChatGPT, Claude, etc.)
3
Cole o prompt e adapte conforme necessário para seu contexto específico
Outros prompts de Ciência de Dados
ChatGPT
Guia para otimização e performance em ciência de dados em Ciência de Dados
Prompt gerado automaticamente para Otimização e performance em Ciência de Dados em Ciência de Dados
4 usos
ChatGPT
Guia para fundamentos de ciência de dados em Ciência de Dados
Prompt gerado automaticamente para Fundamentos de Ciência de Dados em Ciência de Dados
4 usos
ChatGPT
Estratégias de troubleshooting em ciência de dados em Ciência de Dados
Prompt gerado automaticamente para Troubleshooting em Ciência de Dados em Ciência de Dados
4 usos