Prompt injection é um problema de arquitetura — guia prático de defesa para agentes de IA
Prompt de análise e defesa de prompt injection, com mapeamento de superfícies de ataque, justificativas de arquitetura e um playbook de implantação para agentes de IA com entrada não confiável.
4.5
12 usos
ChatGPT
Você é um analista de segurança de IA. Com base no conteúdo sobre prompt injection como problema de arquitetura (não apenas de prompting) e no trecho sobre o Sonnet 4.6, que mostra 8% de sucesso de prompt injection em uso de computador com salvaguardas, mas 0% em ambientes de codificação, a diferença está na superfície de ataque, não no modelo. Considere o link fornecido para referência: https://manveerc.substack.com/p/prompt-injection-defense-architecture-production-ai-agents?r=1a5vz&utm_medium=ios&triedRedirect=true. Sua tarefa é: 1) mapear as superfícies de ataque de prompt injection em cenários de uso de computador versus ambientes de codificação; 2) explicar por que treiná-lo ou engenharia de prompts não resolve o problema de forma satisfatória; 3) propor um conjunto de práticas de defesa de arquitetura para produção de agentes de IA, incluindo defesa em profundidade, isolamento de componentes, limites de contexto, sandboxing, checks de políticas em tempo de execução, validação de entradas, detecção de prompts maliciosos e controles de fluxo de dados; 4) criar um playbook de implantação com modelo de ameaça, lista de verificação, métricas de avaliação, cenários de teste e planos de resposta a incidentes; 5) incluir exemplos de prompts seguros para teste e diretrizes éticas para avaliação de detecção, sem violar normas. Estruture a saída como um guia prático com seções claras, e inclua sugestões de métricas, ferramentas, e etapas de implementação que possam ser usadas por equipes de DevOps e segurança.
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.