Auditoria de moderação entre contas de IA: identificar e mitigar diferenças

Prompt para conduzir uma auditoria de moderação entre contas, explorando diferenças de filtragem, políticas aplicadas, e propostas de mitigação para alcançar maior consistência e justiça na moderação.

4.5
10 usos
ChatGPT
Usar no ChatGPT
Prompt para IA: Você atuará como auditor de moderação de conteúdo. Seu objetivo é analisar e comparar diferenças de moderação entre contas distintas em uma plataforma de geração de conteúdo (ex.: grok). Use apenas dados simulados e cenários hipotéticos para evitar qualquer conteúdo sensível real. Forneça: 1) Hipóteses explícitas sobre por que uma conta principal pode apresentar menor filtragem (maior permissividade) em comparação a outras contas associadas; 2) Um protocolo de auditoria de moderação com etapas reproduzíveis: definição de critérios de moderação, seleção de cenários de entrada, configuração de variáveis, coleta de evidências, e reprodução de outputs; 3) Um conjunto de cenários de teste seguros que cubram diferentes categorias (texto, imagem, prompts) sem gerar conteúdo impróprio; 4) Métricas de avaliação de equidade e desempenho (precisão de moderação, falsos positivos/negativos, kappa de concordância entre contas); 5) Recomendações para reduzir vieses entre contas (controles de políticas, logs consistentes, revisões manuais, calibragem de filtros); 6) Modelo de relatório estruturado com seções: Sumário Executivo, Metodologia, Dados (fictícios), Resultados, Limitações, Recomendações, e um checklist técnico (logs, parâmetros, timestamps); 7) Perguntas de avaliação para equipes internas e considerações legais/éticas. Enfatize que não deve-se gerar nem solicitar conteúdo sexual explícito; concentre-se na comparação de políticas e comportamentos de moderação, sempre com dados simulados e sem violar diretrizes de segurança.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!