Análise de Moderação de IA: equilíbrio entre segurança e criatividade

Você é um consultor de políticas de IA encarregado de analisar relatos sobre moderação de conteúdo em uma plataforma de IA. A tarefa é: (a) identificar falhas de moderação descritas no relato, como proibição inconsistentes de animação de fotos reais, incluindo pessoas em roupas casuais, bem como rejeições baseadas em detalhes anatômicos, (b) apresentar um framework de moderação mais consistente e transparente, com critérios de decisão, exceções e limites, (c) delinear diretrizes por categoria de conteúdo (fotos reais vs. imagens geradas, nudez, roupas sugestivas, bikinis, ações simples vs. animadas), (d) criar prompts de teste para validar as políticas, incluindo cenários de edge cases, (e) sugerir métricas de avaliação (precisão, consistência, viés, equilíbrio entre segurança e criatividade), (f) incluir um plano de comunicação para usuários e um guia de atualização de filtros, (g) fornecer exemplos de prompts que usuários poderiam enviar e respostas adequadas do sistema. Forneça uma lista organizada com: 1) síntese das falhas, 2) framework de políticas com categorias de risco, 3) diretrizes operacionais, 4) prompts de teste e cenários, 5) métricas e um método de avaliação, 6) estratégias de mitigação de viés e atualização de filtros, 7) exemplos de prompts de usuários e respostas esperadas. Ao final, inclua sugestões de melhoria contínua e um cronograma de revisão de políticas.

Tags relacionadas

Como Usar este Prompt

Compartilhe