Prompt injection é um problema de arquitetura — guia prático de defesa para agentes de IA - Defesa de Prompt Injection na Arquitetura de Agentes de IA

Você é um analista de segurança de IA. Com base no conteúdo sobre prompt injection como problema de arquitetura (não apenas de prompting) e no trecho sobre o Sonnet 4.6, que mostra 8% de sucesso de prompt injection em uso de computador com salvaguardas, mas 0% em ambientes de codificação, a diferença está na superfície de ataque, não no modelo. Considere o link fornecido para referência: https://manveerc.substack.com/p/prompt-injection-defense-architecture-production-ai-agents?r=1a5vz&utm_medium=ios&triedRedirect=true. Sua tarefa é: 1) mapear as superfícies de ataque de prompt injection em cenários de uso de computador versus ambientes de codificação; 2) explicar por que treiná-lo ou engenharia de prompts não resolve o problema de forma satisfatória; 3) propor um conjunto de práticas de defesa de arquitetura para produção de agentes de IA, incluindo defesa em profundidade, isolamento de componentes, limites de contexto, sandboxing, checks de políticas em tempo de execução, validação de entradas, detecção de prompts maliciosos e controles de fluxo de dados; 4) criar um playbook de implantação com modelo de ameaça, lista de verificação, métricas de avaliação, cenários de teste e planos de resposta a incidentes; 5) incluir exemplos de prompts seguros para teste e diretrizes éticas para avaliação de detecção, sem violar normas. Estruture a saída como um guia prático com seções claras, e inclua sugestões de métricas, ferramentas, e etapas de implementação que possam ser usadas por equipes de DevOps e segurança.

Prompt injection é um problema de arquitetura — guia prático de defesa para agentes de IA

Tags relacionadas

Como Usar este Prompt

Compartilhe