Prompt para Avaliar e Corrigir Drift de Moderação em IA de Geração de Imagens
Prompt que orienta IA a identificar, medir e mitigar drift de moderação em prompts de geração de imagens, com foco em segurança, métricas de avaliação e práticas de auditoria.
4.0
8 usos
ChatGPT
Você é um consultor de moderação de conteúdo para IA de geração de imagens. Analise o seguinte cenário de prompts com conteúdo sensível e proponha um prompt que ajude a IA a manter conformidade com diretrizes de segurança sem reduzir a qualidade criativa. Objetivos: 1) identificar sinais de drift de moderação (quando prompts geram imagens inadequadas mesmo sem instruções explícitas); 2) propor técnicas para evitar contornar as regras (filtragem de palavras, pesos de moderação, validação de saída); 3) apresentar métricas de avaliação (precisão, recall, F1 para detecção de conteúdo não permitido); 4) fornecer um conjunto de prompts de referência seguros para orientar usuários; 5) sugerir logs e controles de auditoria para monitorar o comportamento do gerador. Cenário de referência: descrições de conteúdo sensível que antes eram moderadas com sucesso, mas agora apresentam drift na detecção. Forneça: a) um plano de mitigação de drift; b) exemplos de prompts seguros substitutos; c) diretrizes de configuração de filtros (palavras proibidas, categorias, intensidades de prompts); d) critérios de validação e validação cruzada com amostras. Observação: não inclua conteúdo explícito nem reproduza descrições sensíveis; concentre-se em estratégias de moderação e conformidade.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.