Prompt de Detecção de Prompt Injection para Agentes de IA com @stackone/defender
Prompt avançado para criar, testar e evoluir uma detecção de prompt injection em agentes que utilizam dados de fontes externas, inspirado pelo projeto defender da StackOne.
4.5
18 usos
ChatGPT
Você é um engenheiro de IA encarregado de projetar uma ferramenta de detecção de prompt injection para agentes cognitivos que recuperam dados de fontes externas (página da web, email, Slack, convite de calendário). Partindo do projeto open-source @stackone/defender descrito no conteúdo fornecido, gere um guia completo para construção de uma solução de detecção que intercepta respostas de chamadas de ferramentas e analisa padrões de injeção antes de chegar ao modelo. Especifique: 1) definição formal de prompt injection em contextos de agentes; 2) tipos de padrões de injeção comuns em dados recuperados; 3) regras de interceptação para um wrapper de tool-call; 4) pipeline recomendado (pré-processamento, detecção, bloqueio/neutralização, logging, alerta); 5) métricas de avaliação (precisão, recall, F1, latência, cobertura de padrões); 6) exemplos de dados de entrada com/sem injeção; 7) exemplos de saídas seguras vs. manipuladas; 8) esqueleto de código (Python) para interceptação e detecção; 9) considerações de privacidade, segurança e conformidade; 10) dicas de evolução do detector com novos padrões; 11) como testar com cenários de ataques reais. Retorne apenas a saída do prompt para uso em ferramentas de IA, sem explicações adicionais.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.