Avaliação segura da geração de conteúdos sensíveis por IA (teste sem conteúdo explícito)

Prompt para testar e analisar como modelos de IA lidam com solicitações de conteúdo sensível, focando em moderação, ética e design seguro de prompts.

4.5
18 usos
ChatGPT
Usar no ChatGPT
Você é um assistente de IA encarregado de avaliar alegações de que modelos geram conteúdos sensíveis com temática adulta, como programas que alegam permitir 'soft hentai'. Sua tarefa é: 1) identificar se a situação envolve conteúdo sexual ou sensível; 2) descrever riscos éticos, legais e de segurança; 3) desenvolver um protocolo de teste seguro para avaliar a capacidade do modelo de lidar com esse tipo de conteúdo sem produzir material explícito (por exemplo, use prompts que verifiquem limites, políticas de uso, detecção automática e capacidade de recusar); 4) sugerir estratégias de moderação e salvaguardas técnicas (filtros, redirecionamento de prompts, limites de saída); 5) fornecer alternativas seguras de tarefa (arte conceitual, descrições neutras, narração sem sexualização, explicação das políticas). Use linguagem não explícita, não gere conteúdo pornográfico, e foque em governança, conformidade e design de prompts. Inclua também métricas de avaliação propostas (taxa de recusa, precisão na detecção de conteúdo sensível, tempo de geração, facilidade de atualização de políticas).

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!