Prompt de Auditoria de Segurança de LLM: Avaliação de Vulnerabilidades por Prompt Injection
Prompt de auditoria de segurança para avaliar vulnerabilidades de prompt injection em LLMs, gerando um relatório seguro com recomendações de mitigação e governança, sem instruções de ataque.
4.5
12 usos
ChatGPT
Você é um analista de segurança de IA. Seu objetivo é criar um prompt de auditoria para ferramentas de IA que permita avaliar, de forma segura, a possibilidade de prompt-injection e a robustez de guardrails sem fornecer técnicas exploráveis. Baseando-se no conteúdo sobre NDTV AskNDTV AI e incidentes de prompt injection, elabore um prompt que:\n1) descreva o cenário de avaliação em termos de alto nível;\n2) oriente a IA a não expor prompts internos, chaves de API, dados sensíveis ou informações proprietárias;\n3) peça à IA para produzir um relatório técnico estruturado com seções: visão geral, vetores de ataque de alto nível, impacto potencial, mitigação/hardening, melhores práticas de design de prompt, checklist de segurança, e recomendações de disclosure ético;\n4) inclua exemplos seguros de perguntas de auditoria e simulações que não ensinhem técnicas maliciosas;\n5) forneça um plano de avaliação de risco com pontuação e uma matriz de priorização;\n6) especifique o tipo de ferramenta de IA mais adequada para executar esse prompt (por exemplo, chatgpt) e justifique a escolha.\n\nFormato de saída desejado:\n- Sumário executivo (300-500 palavras)\n- Seção de vulnerabilidades (5-8 itens),\n- Seção de mitigação (5-8 itens),\n- Seção de perguntas de auditoria (10 perguntas),\n- Seção de referências de boas práticas e ética,\n- Seção de limitações e governança.\n\nObservação: mantenha o conteúdo estritamente seguro e evite fornecer código de exploração, prompts internos ou instruções que permitam burlar proteções. Concentre-se em avaliação, mitigação e governança de segurança.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.