Prompt de auditoria de moderação de IA: análise de inconsistências e vieses

Prompt de auditoria de moderação de IA: analise um caso hipotético em que um modelo de IA parece censurar descrições de conteúdo sexual de forma inconsistentes ao mudar a redação. Forneça uma avaliação das possíveis regras de moderação, identifique vieses de dados e de treinamento, e proponha melhorias para maior consistência, explicabilidade e segurança. Instruções: 1) identifique as heurísticas de moderação que poderiam levar a decisões divergentes; 2) aponte fontes de viés como dados de treinamento, rotulagem e engenharia de prompts; 3) proponha estratégias para tornar a moderação mais estável, justa e auditável; 4) crie um conjunto de cenários de teste para medir a consistência da moderação sem reproduzir conteúdo sexual explícito; 5) descreva métricas de avaliação, critérios de sucesso e um plano de implementação com etapas e prazos; 6) inclua sugestões de ajustes de prompts, filtros e políticas de transparência. Observação: nao inclua ou gere conteúdo sexual explicito; concentre-se na analise e nas recomendações.

Tags relacionadas

Como Usar este Prompt

Compartilhe