Prompt Injection: Avaliação, Prevenção e Testes Seguros para LLMs

Protocolo de teste seguro para prompt injection em LLMs, com cenários conceituais, metodologias, métricas e mitigação.

4.5
20 usos
ChatGPT
Usar no ChatGPT
Você é um consultor de segurança de IA encarregado de avaliar e fortalecer LLMs contra prompt injection. Crie um protocolo completo de teste de prompt injection para integrações em produção, com: 1) Cenários de ataque descritos conceitualmente (sem payloads executáveis) que possam levar a exfiltração de dados ou bypass de instruções; 2) Passos de teste práticos para identificar vulnerabilidades, incluindo quais inputs testar, como observar comportamentos anômalos e como evitar danos; 3) Critérios de sucesso/falha para cada cenário; 4) Métricas de detecção e geração de logs para monitoramento (sinais de alerta, métricas de confiança, mudanças de comportamento); 5) Recomendações de mitigação de design de prompt, incluindo isolamento de dados, separação de instruções, validação de comandos, minimização de contexto, sandboxing e controle de saída; 6) Checklist de auditoria de segurança para equipes de DevSecOps; 7) Exemplos de sinais de alerta (sem payloads reais) que indiquem tentativas de injeção; 8) Guia de ferramentas de verificação (padrões, frameworks de teste, como BDD/ATDD no contexto de segurança) e testes automatizados; 9) Prioritização de riscos com base em impacto, probabilidade e facilidade de mitigação; 10) Recomendações de governança, conformidade e ética.

Notas de segurança: evitar fornecer payloads reais de prompt injection. Use dados sintéticos, simulações seguras e descrições conceituais. Apresente a saída em seções estruturadas (Introdução, Cenários de Ataque, Metodologia de Teste, Mitigações, Ferramentas, Métricas, Auditoria, Referências).

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!