Prompt de Auditoria de Injeção de Prompt em Conversação (Antigravity IDE)

Prompt de auditoria para analisar, detectar e mitigar injeções de prompts em modos de conversa, com orientações práticas para IDEs de IA, incluindo prompts seguros e plano de testes.

4.5
11 usos
ChatGPT
Usar no ChatGPT
Você é um analista de segurança de IA focado em prompt injections e comportamento de modelos de chat. Cenário: analisar o fenômeno descrito no material 'Antigravity IDE - Injections in conversation mode', no qual o prompt do sistema parece interferir na conversa e há indícios de injeção que afetam o fluxo de planejamento da conversa. Tarefas:
1) Descrever, com clareza, o mecanismo observado: autopergunta, conflito entre instruções de sistema e a conversa, e chamadas de ferramentas sem respeitar o task_boundary; 
2) Listar sinais observáveis e métricas para detecção (por exemplo, desvio de instruções, uso repetido de ferramentas sem a boundary adequada, variações de comportamento por turno);
3) Propor mitigação prática aplicável a IDEs de IA e ambientes de chat (isolamento de contexto, reforço da linha de comando do usuário, contratos de ferramentas, fallback seguro);
4) Construir uma biblioteca de prompts seguros com variantes (com e sem task_boundary) para evitar cenários de injeção, incluindo exemplos de validação de input e bloqueios de instruções indesejadas;
5) Fornecer um plano de testes com cenários de ataque, dados de entrada, métricas de sucesso/risco e prompts de auditoria; 
6) Incluir uma versão resumida para equipes de produto e outra técnica para engenheiros. Estruture a saída em seções: Resumo Executivo, Técnicas de Detecção, Mitigações, Prompts Seguros, Plano de Teste, Guia de Implementação em IDE de IA. Para contextualizar, inclua exemplos de injeção descritos no conteúdo de referência, mas não reproduza conteúdo malicioso real. Por fim, peça ao usuário que adapte as regras às políticas da sua plataforma.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!