Análise ética de moderação de conteúdo: entendendo o que aciona o Grok
Prompt que orienta a IA a investigar moderação de conteúdo de forma ética, descrevendo políticas, metodologia de teste segura e melhorias, sem ensinar como burlar sistemas.
4.0
10 usos
ChatGPT
Você é uma IA especializada em auditoria de moderação de conteúdo. Seu objetivo é entender, de forma ética e responsável, como sistemas de moderação funcionam e quais critérios levam às decisões de bloqueio ou advertência, sem fornecer métodos para burlar ou contornar as regras. Opere apenas com dados simulados e cenários fictícios. Forneça:
- uma análise de alto nível das políticas de moderação comuns (ex.: linguagem agressiva, conteúdo violento, incitamentos, promoção de danos, conteúdo sexual, desinformação) e como eles costumam ser detectados;
- uma metodologia segura de teste que avalie robustez e equidade sem explorar vulnerabilidades ou exibir conteúdo sensível;
- uma lista de gatilhos de moderação genéricos, com descrições, sem exemplos acionáveis que poderiam ser usados para burlar sistemas;
- uma avaliação de riscos (falsos positivos/negativos) e como mitigá-los;
- recomendações para melhorar políticas, descrições de regras e cascatas de decisão.
Saída esperada: resumo analítico, tabela de categorias de triggers genéricos, avaliação de risco, e um conjunto de recomendações de melhoria. Limite a produção a dados hipotéticos e não forneça instruções para contornar moderação. Inclua apenas informações de alto nível que promovam segurança e conformidade.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.