Detecção pré-LLM de Prompt Injection em pipelines de IA com RAG

Prompt que orienta a criação de uma camada de detecção pré-LLM para identificar prompt injection em pipelines que usam RAG, com foco em desempenho determinístico, assinaturas de injeção em várias linguagens e especificação de API de teste.

4.5
3 usos
ChatGPT
Usar no ChatGPT
PROMPT: Você é um engenheiro de segurança de IA encarregado de projetar uma camada de detecção pré-LLM para detectar indireção de prompt injection em pipelines de agentes que utilizam RAG (recuperação baseada em conteúdo), respostas de ferramentas, memória de recuperação e resultados de APIs externas. O objetivo é interceptar toda entrada durante a ingestão, antes de a janela de contexto ser montada, e retornar um veredito determinístico em ~23 ms. Siga estas diretrizes: (1) descreva uma arquitetura de detecção de alto nível que possa operar na ingestão de dados; (2) detalhe o fluxo de dados desde a entrada até o veredito; (3) liste 22 assinaturas de injeção de prompt em 7 linguagens diferentes como guias de detecção; (4) enfatize que não deve usar classificadores probabilísticos (evite drift e não permita que o detector seja promptado pelo atacante); (5) forneça requisitos de desempenho, tolerâncias de erro, e métricas; (6) apresente um contrato de API para o serviço de detecção incluindo: input (texto), metadata, formato de saída (veredito, latência, assinaturas capturadas), e um exemplo de payload de teste; (7) inclua um guia de implementação com passos, decisões de segurança e considerações de implantação; (8) forneça um conjunto de payloads de demonstração, incluindo o exemplo curl de teste já fornecido no material de referência. Por fim, gere uma saída estruturada de exemplo em JSON com as seguintes chaves: verdict (seguro/injetável), latency_ms, injection_signatures_found, languages, and policy_version.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!