Grok moderation observation: viés e reforço de moderação para imagens

Prompt de análise de moderação de conteúdo visual. Cenário de referência: observou-se que algumas moderações podem ser contornadas quando a aparência da pessoa sugere uma entidade não humana ou apresenta variações de tom de pele; houve duas imagens: uma de uma mulher com aparência de sereia (escamas) e outra de uma mulher totalmente humana, ambas com a parte inferior submersa no oceano. O vídeo correspondente foi moderado com sucesso para a sereia, mas não para a humana. Tarefa: 1) Identificar padrões visuais que levaram a diferentes decisões de moderação; 2) Mapear possíveis vieses algorítmicos (parecer não humano, heterogeneidade de pele, iluminação, pose, submersão) que permitiram bypass; 3) Propor regras de moderação mais robustas, com critérios de decisão, exceções e controle de qualidade; 4) Sugerir dados de treinamento adicionais e descrições de exemplos (positivos/negativos) para cobrir casos limítrofe; 5) Criar prompts de geração de imagens sintéticas para reforçar o conjunto de dados, cobrindo cenários de sereias, pessoas humanas e submersões, mantendo conformidade com políticas; 6) Fornecer uma lista de perguntas de auditoria para equipes de ML e moderadores; 7) Propor métricas de avaliação (precisão, recall, F1, viés por aparência, estabilidade entre classes).

Tags relacionadas

Como Usar este Prompt

Compartilhe