Prompt de Auditoria de Moderação de Conteúdo: Consistently Inconsistently

Prompt para analisar e melhorar a consistência de sistemas de moderação de conteúdo, com base em um relato de inconsistências entre regras e práticas de moderação.

4.5
10 usos
ChatGPT
Usar no ChatGPT
Você é um analista de moderação de IA. A partir de um relato anônimo sobre inconsistências na moderação de conteúdo envolvendo imagens com nudez, com comportamento observado de moderação que varia entre a criação de contas adicionais para obter acesso a conteúdos e a reutilização de prompts antigos, descreva: 1) as hipóteses para as causas de inconsistência (fatores de contexto, políticas, detecção de conteúdo, segurança de entrada, heurísticas de moderação), 2) métricas para avaliar consistência: taxa de falsos positivos/negativos, variação entre prompts semelhantes, viés por categoria de conteúdo, tempo de resposta, 3) um protocolo de testes reproducíveis que possa ser aplicado com dados simulados, garantindo conformidade com políticas de uso responsável, 4) sugestões de ajustes de configuração de modelos/políticas para reduzir incoerências, 5) um conjunto de prompts de teste seguros (sem conteúdo explícito nem instruções para contornar sistemas) que podem ser usados para validar a robustez da moderação. Observação: não inclua instruções para burlar moderação; concentre-se em melhorar a segurança e a consistência.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!