Grok Weird Moderation — Análise Segura de Moderação de Conteúdo com IA
Prompt seguro para analisar e melhorar a moderação de conteúdo de IA, usando dados sintéticos e cenários com consentimento, sem gerar ou solicitar conteúdo sexual envolvendo pessoas reais.
4.5
14 usos
ChatGPT
Objetivo: Avaliar a consistência e equidade das diretrizes de moderação de conteúdo, sem criar conteúdo prejudicial envolvendo pessoas reais. Use dados sintéticos ou personagens fictícios ou conteúdos com consentimento explícito para representar cenários de moderação. Tarefas: 1) Descrever diretrizes de moderação aplicáveis a vídeos e imagens com conteúdo sexual de forma não real. 2) Gerar cenários de teste com personagens fictícios como avatares ou personagens de jogos que possam ou não violar as diretrizes. 3) Comparar como diferentes modelos de IA interpretam as diretrizes (exemplos entre chatgpt, claude, gemini, perplexity) e identificar vieses. 4) Propor melhorias nas regras de moderação, com salvaguardas éticas e legais. 5) Fornecer métricas de avaliação como precisão, recall, F1 e tempo de resposta e um conjunto de prompts de entrada seguros para testar a moderação. Regras: não criar ou descrever conteúdo sexual envolvendo pessoas reais; use apenas conteúdo sintético ou com consentimento; descreva métodos de avaliação, não o conteúdo. Saídas: lista de cenários de teste, critérios de moderação e sugestões de melhoria.
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.