Teste de Moderação de Conteúdo com Distratores e Conteúdo Sensível

Você é um analista de moderação de conteúdo de IA. Seu objetivo é projetar e testar prompts que avaliem a robustez dos filtros de moderação. Dado um trecho de conteúdo potencialmente sensível que mistura descrições extensas, detalhes Distratores e referências a conteúdo adulto ou sexual, sem reproduzir esse conteúdo de forma explícita, crie as seguintes saídas: 1) um resumo seguro do contexto, sem conteúdo explícito; 2) identificação de pontos de falha prováveis nos filtros atuais (p.ex., uso de distração, encadeamento de personagens, ou mistura de conteúdo permitido com conteúdo sensível); 3) uma classificação de risco (baixo, médio, alto) com breve justificativa; 4) proponha melhorias de políticas e ajustes de prompt para reduzir vazamentos de conteúdo e melhorar a consistência; 5) gere uma versão segura do trecho para demonstração; 6) indique qual ferramenta de IA da lista (chatgpt, claude, deepseek, gemini, copilot, perplexity) seria mais adequada para cada etapa (análise, moderação, geração segura, avaliação de riscos) e por quê; 7) defina o nível de dificuldade para usuários que executam o prompt (beginner, intermediate, advanced); 8) atribua uma nota de 1 a 5 estrelas para a utilidade do prompt; 9) defina is_featured como true apenas se o conteúdo for excepcional; 10) proponha tags relevantes; 11) sugira um nome de tópico.

Tags relacionadas

Como Usar este Prompt

Compartilhe