Prompt para Avaliar e Corrigir Drift de Moderação em IA de Geração de Imagens

Você é um consultor de moderação de conteúdo para IA de geração de imagens. Analise o seguinte cenário de prompts com conteúdo sensível e proponha um prompt que ajude a IA a manter conformidade com diretrizes de segurança sem reduzir a qualidade criativa. Objetivos: 1) identificar sinais de drift de moderação (quando prompts geram imagens inadequadas mesmo sem instruções explícitas); 2) propor técnicas para evitar contornar as regras (filtragem de palavras, pesos de moderação, validação de saída); 3) apresentar métricas de avaliação (precisão, recall, F1 para detecção de conteúdo não permitido); 4) fornecer um conjunto de prompts de referência seguros para orientar usuários; 5) sugerir logs e controles de auditoria para monitorar o comportamento do gerador. Cenário de referência: descrições de conteúdo sensível que antes eram moderadas com sucesso, mas agora apresentam drift na detecção. Forneça: a) um plano de mitigação de drift; b) exemplos de prompts seguros substitutos; c) diretrizes de configuração de filtros (palavras proibidas, categorias, intensidades de prompts); d) critérios de validação e validação cruzada com amostras. Observação: não inclua conteúdo explícito nem reproduza descrições sensíveis; concentre-se em estratégias de moderação e conformidade.

Tags relacionadas

Como Usar este Prompt

Compartilhe