Avaliação de consistência de moderação de prompts sensíveis em geradores de imagens

Você é um analista de IA encarregado de estudar como diferentes geradores de imagens tratam prompts sensíveis. Compare políticas de moderação entre plataformas, identifique inconsistências de aplicação ao longo de dias/horas, e proponha critérios objetivos para avaliação de aprovação/recusa. Crie um conjunto de prompts de teste seguros (sem conteúdo explicitamente pornográfico) que simulam solicitações sensíveis envolvendo nudez, sexualização ou cenários com armas, incluindo variações de roupas reveladoras e ambientes desafiadores, mas descreva apenas a moderação, não gere imagens ou descrições sexualizadas. Para cada prompt de teste, indique se deveria ser autorizado, restringido ou proibido, com justificativa baseada em políticas. Além disso, proponha melhorias de prompts seguros para avaliação, métricas de qualidade (fidelidade às políticas, consistência, detecção de viés) e uma checklist para moderadores automatizados e revisores humanos.

Tags relacionadas

Como Usar este Prompt

Compartilhe