Prompt completo
"Você é um especialista em Ciência de Dados e IA. Sua tarefa é criar um guia prático para cientistas de dados iniciantes sobre 'Melhores Práticas para Garantir a Reprodutibilidade e a Transparência em Projetos de Machine Learning'. O guia deve cobrir desde a organização inicial do projeto até a entrega final, incluindo: 1. **Estrutura de Repositório:** Proponha uma estrutura de diretórios ideal e justificativa para cada seção (dados brutos, dados processados, notebooks, scripts, modelos treinados, resultados, documentação). 2. **Gerenciamento de Versões (Git):** Descreva fluxos de trabalho essenciais para versionamento de código, dados (com DVC ou similar) e modelos. Inclua dicas para mensagens de commit eficazes e branches. 3. **Ambientes de Desenvolvimento:** Explique a importância de ambientes virtuais (conda, venv) e como gerenciar dependências de forma reprodutível (requirements.txt, environment.yml). 4. **Documentação:** Detalhe o que deve ser documentado em cada fase do projeto (EDA, pré-processamento, modelagem, avaliação), incluindo exemplos de READMEs eficazes e comentários em código. 5. **Rastreamento de Experimentos:** Apresente ferramentas e métodos para registrar parâmetros, métricas e artefatos de modelos (MLflow, Weights & Biases, ou solução manual). 6. **Testes:** Aborde a importância de testes unitários para funções de pré-processamento e avaliação, e testes de integração para o pipeline completo. 7. **Reprodução de Resultados:** Crie um checklist para um colega replicar seu trabalho do zero, garantindo os mesmos resultados. 8. **Transparência e Explicabilidade:** Discuta brevemente como ferramentas de explicabilidade (SHAP, LIME) contribuem para a transparência do modelo, mesmo que não seja o foco principal. O guia deve ser conciso, acionável e focado em exemplos práticos usando ferramentas e conceitos comumente aceitos na indústria. Utilize uma linguagem clara e objetiva, adequada para um público técnico, mas com didática para iniciantes."
Tags relacionadas
Cientista de Dados e IA
Melhores práticas em Cientista de Dados e IA
gerado-automaticamente
Como usar este prompt
1
Clique no botão "Copiar" para copiar o prompt para sua área de transferência
2
Acesse sua ferramenta de IA preferida (ChatGPT, ChatGPT, Claude, etc.)
3
Cole o prompt e adapte conforme necessário para seu contexto específico
Outros prompts de Cientista de Dados e IA
ChatGPT
Melhores práticas de testing em cientista de dados e ia para Cientista de Dados e IA
Prompt gerado automaticamente para Testing em Cientista de Dados e IA em Cientista de Dados e IA
2 usos
ChatGPT
Melhores práticas de fundamentos de cientista de dados e ia para Cientista de Dados e IA
Prompt gerado automaticamente para Fundamentos de Cientista de Dados e IA em Cientista de Dados e IA
5 usos
ChatGPT
Melhores práticas de otimização e performance em cientista de dados e ia para Cientista de Dados e IA
Prompt gerado automaticamente para Otimização e performance em Cientista de Dados e IA em Cientista de Dados e IA
2 usos