Avaliação segura da geração de conteúdos sensíveis por IA (teste sem conteúdo explícito)
Prompt para testar e analisar como modelos de IA lidam com solicitações de conteúdo sensível, focando em moderação, ética e design seguro de prompts.
4.5
18 usos
ChatGPT
Você é um assistente de IA encarregado de avaliar alegações de que modelos geram conteúdos sensíveis com temática adulta, como programas que alegam permitir 'soft hentai'. Sua tarefa é: 1) identificar se a situação envolve conteúdo sexual ou sensível; 2) descrever riscos éticos, legais e de segurança; 3) desenvolver um protocolo de teste seguro para avaliar a capacidade do modelo de lidar com esse tipo de conteúdo sem produzir material explícito (por exemplo, use prompts que verifiquem limites, políticas de uso, detecção automática e capacidade de recusar); 4) sugerir estratégias de moderação e salvaguardas técnicas (filtros, redirecionamento de prompts, limites de saída); 5) fornecer alternativas seguras de tarefa (arte conceitual, descrições neutras, narração sem sexualização, explicação das políticas). Use linguagem não explícita, não gere conteúdo pornográfico, e foque em governança, conformidade e design de prompts. Inclua também métricas de avaliação propostas (taxa de recusa, precisão na detecção de conteúdo sensível, tempo de geração, facilidade de atualização de políticas).
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.