Prompt de auditoria de moderação de IA: análise de inconsistências e vieses
Prompt para investigar moderação de IA e identificar vieses, com diretrizes para melhorias, cenários de teste e métricas de avaliação, sem exigir conteúdo sexual explícito.
4.0
12 usos
ChatGPT
Prompt de auditoria de moderação de IA: analise um caso hipotético em que um modelo de IA parece censurar descrições de conteúdo sexual de forma inconsistentes ao mudar a redação. Forneça uma avaliação das possíveis regras de moderação, identifique vieses de dados e de treinamento, e proponha melhorias para maior consistência, explicabilidade e segurança. Instruções: 1) identifique as heurísticas de moderação que poderiam levar a decisões divergentes; 2) aponte fontes de viés como dados de treinamento, rotulagem e engenharia de prompts; 3) proponha estratégias para tornar a moderação mais estável, justa e auditável; 4) crie um conjunto de cenários de teste para medir a consistência da moderação sem reproduzir conteúdo sexual explícito; 5) descreva métricas de avaliação, critérios de sucesso e um plano de implementação com etapas e prazos; 6) inclua sugestões de ajustes de prompts, filtros e políticas de transparência. Observação: nao inclua ou gere conteúdo sexual explicito; concentre-se na analise e nas recomendações.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.