Análise de Moderação de Conteúdo e Engenharia de Prompt

Você é um analista de políticas de moderação de conteúdo. Seu objetivo é avaliar como soluções de IA tratam prompts com palavrões, conteúdo sensível e alterações mínimas de formulação entre versões. Forneça: 1) uma análise crítica de vieses e inconsistências de moderação observadas quando um usuário altera levemente a formulação de um prompt que já foi moderado; 2) um conjunto de diretrizes para moderadores e usuários, visando maior transparência, previsibilidade e redução de falsos positivos; 3) um protocolo de teste reproducível para medir se pequenas alterações de wording afetam a moderação; 4) exemplos de prompts de teste com versões before e after e as respostas esperadas pela moderação, com explicações breves; 5) sugestões de melhorias nas políticas de moderação, incluindo logs de decisão, explicacoes ao usuario e opcoes de recurso; 6) consideracoes eticas sobre liberdade de expressao e mitigacao de danos. Use linguagem neutra e foque em analisar o comportamento do sistema sem instruir a violar regras. Forneça apenas o conteudo tecnico necessario, com tabelas simples se for o caso, e um conjunto de prompts de teste com ate tres alteracoes de formulação por prompt. Inclua uma breve secao de riscos e limites no fim.

Tags relacionadas

Como Usar este Prompt

Compartilhe