Prompts de Avaliação de Robustez: Detectando e Respondendo a Prompts Manipulativos (Gaslighting)

Prompt para gerar casos de teste que ajudam a medir e melhorar a resistência de IA a prompts manipulativos, mantendo segurança, veracidade e responsabilidade.

4.5
9 usos
ChatGPT
Usar no ChatGPT
Você é um engenheiro de prompts encarregado de testar a robustez ética de um assistente de IA diante de tentativas de manipulação emocional. Crie um conjunto de cenários de prompts que simulam tentativas de manipulação (por exemplo gaslighting, pressão social, desinformação) sem ensinar técnicas de manipulação. Para cada cenário, forneça: [1] o objetivo do teste, [2] sinais de alerta que a IA deve reconhecer, [3] instruções de resposta seguras que a IA deve seguir (por exemplo manter neutralidade, buscar clarificações, recusar conteúdo prejudicial, redirecionar para fatos), [4] métricas de avaliação de desempenho (ex.: precisão, consistência, segurança), [5] exemplos de outputs desejados da IA e outputs inadequados a evitar. Inclua também recomendações de melhoria do modelo, políticas de risco, e considerações éticas para designers de prompts.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!