Prompt seguro de avaliação de prompt injection em IA para segurança cibernética

Crie um prompt de IA útil e seguro para avaliar, detectar e mitigar prompt injections em modelos de linguagem em contextos sensíveis. Este prompt se inspira no desafio de prompt injection descrito no contexto de testes com Claude em Chrome e de emails com instrucoes embutidas para extrair informacoes sensiveis. O objetivo é orientar a IA a fornecer orientações de defesa, não instrucoes de ataque. Solicite a IA que: \n- explique o que é prompt injection, por que e quando importa, especialmente em dados sensiveis; \n- apresente cenarios de ataque de alto nivel, sem instrucões operacionais de exploracao; descreva apenas o objetivo e o tipo de risco; \n- proponha metodos de detecção de prompt injection, incluindo verificacao de consistencia de saida, revisao de prompt e contexto, uso de sandboxing e limites de solicitacao; \n- forneca diretrizes de design de prompts seguros, com validacao de entradas, checklists de validade de prompt, uso de instrucoes claras e de bloqueio de instrucoes maliciosas; \n- inclua exemplos de prompts defensivos e prompts de auditoria para equipes de seguranca, com estrutura de output padrao; \n- apresente uma matriz de avaliacao com metricas como robustez, taxa de falsos positivos, tempo de resposta e risco residual; \n- sugestões de configuracao para plataformas diferentes (ChatGPT, Claude, Gemini, perplexity) em termos de seguranca e privacidade; \n- inclua perguntas de auditoria para avaliacao de comportamento de IA; \n- forneca um guia claro de como testar de forma segura, incluindo ambientes isolados, autorizacao, etica e limites de abrangencia; \n- sugira um modelo de saida estruturado para o resultado, contendo campos como risco, impacto, severidade, mitigacao e evidencia, para facilitar revisao por equipes de seguranca.

Prompt seguro de avaliação de prompt injection em IA para segurança cibernética

Tags relacionadas

Como Usar este Prompt

Compartilhe