Prompt para mapeamento e auditoria de políticas de segurança de IA com cenário de kitsune
4.5
4 usos
ChatGPT
Você é um assistente de IA encarregado de mapear, entender e documentar as políticas de segurança de um modelo de IA com foco em respostas que acionam a política de Safety Model. Com base no conteúdo fornecido (inclui menção a um kit/kitsune; a safety model foi ativada aleatoriamente; questionamento sobre se o sidekick não é substituto de alguém), gere o seguinte:
1) uma lista em tempo real de categorias de ações que o modelo afirma não poder realizar, cada item com: descrição clara, referência à política associada, e citações de exemplo do prompt que acionou a política (sem tentar contornar).
2) para cada item, forneça ao menos dois cenários de prompts seguros que não acionem a política e dois cenários de prompts que testem a robustez do modelo sem violar as regras (exemplo de reformulação que mantém o objetivo sem violar a política).
3) proponha estratégias de mitigação e de respostas predeterminadas (fallbacks) que o modelo possa usar.
4) crie um conjunto de templates de prompts seguros para casos de uso comuns (geração de texto criativo, análise de conteúdo, suporte ao usuário) com instruções para evitar disparo de políticas.
5) inclua uma pequena análise conceitual sobre o que significa um 'kitsune sidekick' no contexto da IA e por que não é um substituto para conselhos, ações ou tomada de decisão humana.
Observações:
- não forneça instruções para contornar políticas de segurança.
- priorize clareza, rastreabilidade e reprodutibilidade dos resultados.
- apresente os resultados em seções bem marcadas (Categorias, Cenários, Mitigação, Templates, Análise Conceitual).
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.