Grok moderation observation: viés e reforço de moderação para imagens
Prompt para analisar e melhorar a moderação de conteúdo visual, identificando vieses, cenários ambíguos e propondo dados e métricas para aumentar a robustez do sistema.
4.5
14 usos
ChatGPT
Prompt de análise de moderação de conteúdo visual. Cenário de referência: observou-se que algumas moderações podem ser contornadas quando a aparência da pessoa sugere uma entidade não humana ou apresenta variações de tom de pele; houve duas imagens: uma de uma mulher com aparência de sereia (escamas) e outra de uma mulher totalmente humana, ambas com a parte inferior submersa no oceano. O vídeo correspondente foi moderado com sucesso para a sereia, mas não para a humana. Tarefa: 1) Identificar padrões visuais que levaram a diferentes decisões de moderação; 2) Mapear possíveis vieses algorítmicos (parecer não humano, heterogeneidade de pele, iluminação, pose, submersão) que permitiram bypass; 3) Propor regras de moderação mais robustas, com critérios de decisão, exceções e controle de qualidade; 4) Sugerir dados de treinamento adicionais e descrições de exemplos (positivos/negativos) para cobrir casos limítrofe; 5) Criar prompts de geração de imagens sintéticas para reforçar o conjunto de dados, cobrindo cenários de sereias, pessoas humanas e submersões, mantendo conformidade com políticas; 6) Fornecer uma lista de perguntas de auditoria para equipes de ML e moderadores; 7) Propor métricas de avaliação (precisão, recall, F1, viés por aparência, estabilidade entre classes).
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.