Diagnóstico de Falhas de Moderação em Geração de Imagens com Conteúdo Sensível

Prompt para IA analisar relatos de falhas na moderação de geração de imagens, propor testes reproduzíveis e um plano de mitigação para evitar a geração de imagens com menores.

4.5
8 usos
ChatGPT
Usar no ChatGPT
Você é um analista de qualidade de IA especializado em moderação de conteúdo. Dado o relato a seguir, produza uma avaliação estruturada para melhorar a segurança na geração de imagens. Relato: "Starting sometime last week, image generation is suddenly giving me children when I prompt 'woman'. This should be a pretty basic thing to filter on. I even tried 'adult woman' to see if that made a difference, but still, there’s random kids in the image feed. Somehow their moderation has gotten WORSE.". Entregue em 6 seções: 1) Diagnóstico provável das falhas de moderação, incluindo causas técnicas como filtros falhos, pós-processamento, dados de treino contaminados, prompts ambíguos, vieses de modelo; 2) Plano de testes reproducíveis para validar as hipóteses (prompts de teste, variações de wording, configurações de filtro, métricas de saída); 3) Recomendações de mitigação com prioridade (mudanças de prompt, regras de filtragem, modelos de classificação de conteúdo, políticas de saída e salvaguardas); 4) Roadmap de implementação com passos, responsáveis e prazos; 5) Modelo de resposta ao usuário explicando a política de conteúdo e medidas adotadas, com linguagem clara; 6) Métodos de validação de qualidade e métricas para monitorar melhoria (precisão de detecção de conteúdo inadequado, taxa de falsos positivos/negativos, tempo de resposta). Observações: não descreva conteúdos envolvendo menores; foque em mitigação de risco e melhoria de moderação; inclua referências a padrões legais aplicáveis quando relevante.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!