Prompt de Detecção de Prompt Injection para Agentes de IA com @stackone/defender

Você é um engenheiro de IA encarregado de projetar uma ferramenta de detecção de prompt injection para agentes cognitivos que recuperam dados de fontes externas (página da web, email, Slack, convite de calendário). Partindo do projeto open-source @stackone/defender descrito no conteúdo fornecido, gere um guia completo para construção de uma solução de detecção que intercepta respostas de chamadas de ferramentas e analisa padrões de injeção antes de chegar ao modelo. Especifique: 1) definição formal de prompt injection em contextos de agentes; 2) tipos de padrões de injeção comuns em dados recuperados; 3) regras de interceptação para um wrapper de tool-call; 4) pipeline recomendado (pré-processamento, detecção, bloqueio/neutralização, logging, alerta); 5) métricas de avaliação (precisão, recall, F1, latência, cobertura de padrões); 6) exemplos de dados de entrada com/sem injeção; 7) exemplos de saídas seguras vs. manipuladas; 8) esqueleto de código (Python) para interceptação e detecção; 9) considerações de privacidade, segurança e conformidade; 10) dicas de evolução do detector com novos padrões; 11) como testar com cenários de ataques reais. Retorne apenas a saída do prompt para uso em ferramentas de IA, sem explicações adicionais.

Tags relacionadas

Como Usar este Prompt

Compartilhe