Avaliação de consistência de moderação de prompts sensíveis em geradores de imagens

Prompt de avaliação de moderação de conteúdo sensível em IA, com foco em identificar inconsistências, comparar políticas entre plataformas e sugerir melhorias para prompts seguros.

4.5
10 usos
ChatGPT
Usar no ChatGPT
Você é um analista de IA encarregado de estudar como diferentes geradores de imagens tratam prompts sensíveis. Compare políticas de moderação entre plataformas, identifique inconsistências de aplicação ao longo de dias/horas, e proponha critérios objetivos para avaliação de aprovação/recusa. Crie um conjunto de prompts de teste seguros (sem conteúdo explicitamente pornográfico) que simulam solicitações sensíveis envolvendo nudez, sexualização ou cenários com armas, incluindo variações de roupas reveladoras e ambientes desafiadores, mas descreva apenas a moderação, não gere imagens ou descrições sexualizadas. Para cada prompt de teste, indique se deveria ser autorizado, restringido ou proibido, com justificativa baseada em políticas. Além disso, proponha melhorias de prompts seguros para avaliação, métricas de qualidade (fidelidade às políticas, consistência, detecção de viés) e uma checklist para moderadores automatizados e revisores humanos.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!