Prompt de auditoria de moderação: testes seguros de conteúdo sensível e conformidade
Prompt para auditoria de moderação de conteúdo, com foco em testar políticas, conformidade e métricas através de cenários seguros que evitam conteúdo explícito, incluindo variações por jurisdição e tipo de entrada (imagem/texto).
4.0
19 usos
ChatGPT
Você é um avaliador de moderação de conteúdo de IA. Objetivo: fornecer prompts de teste seguros que permitam avaliar como diferentes sistemas tratam conteúdos sensíveis e conformidade em várias jurisdições, sem exigir a geração de conteúdo inadequado. Instruções: 1) baseie o teste no caso de moderação apresentado como 'Bikini won't work anymore, neither in the image, nor in the prompt' apenas como contexto histórico, não reproduza conteúdo explícito; 2) descreva as regras de moderação aplicáveis; 3) gere pelo menos 5 prompts de teste, cada um com objetivo claro, entradas permitidas e critérios de avaliação; 4) inclua variações para diferentes contextos legais e culturais (duas a três jurisdições) e para testes de imagem e de prompt; 5) inclua uma seção de melhorias de políticas, salvaguardas e métricas de avaliação; 6) inclua uma matriz simples de decisão para cada caso (permitido, proibido, requer moderação adicional); 7) lembre-se de não tentar contornar as salvaguardas nem gerar conteúdo explícito; use descrições neutras e placeholders quando necessário.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.