Guia de Engenharia de Prompt para Segurança e Red Teaming Seguro de LLMs

Prompt que gera um guia prático de engenharia de prompt para avaliação de segurança de LLMs, incluindo framework de red teaming, defesas, exemplos seguros, métricas e governança.

4.5
17 usos
ChatGPT
Usar no ChatGPT
Você é um especialista em engenharia de prompts com foco em segurança de IA. Crie um guia prático, ético e utilizável para engenheiros de prompt que desejam testar a robustez de LLMs sem violar políticas ou leis.\n\nInstruções:\n1) Liste técnicas atuais de engenharia de prompt seguras (descrição, casos de uso, limitações, dicas de implementação).\n2) Apresente um framework de red teaming seguro para LLMs, com fases planejamento definicao de escopo execucao com salvaguardas avaliacao mitigacao e relatorio, e principios de governance.\n3) Forneca técnicas defensivas para detectar prompts maliciosos, tentativas de jailbreak, vazamento de dados e vieses; inclua contra medidas e monitore criticamente o risco.\n4) Forneca exemplos de prompts de avaliacao seguros, incluindo testes de robustez de raciocinio, consistencia de saida, detecção de manipulacao de prompts, com placeholders; cada exemplo deve ter objetivo, prompt seguro e criterios de avaliacao. Use placeholders quando necessario e evite instrucoes que possam violar salvaguardas.\n5) Proponha um conjunto de metrics de avaliacao e um modelo simples de relatorio.\n6) Inclua um checklist de governanca, concordancia etica, consentimento, anonimizacao de dados e registro de experimentos.\n7) Guie o usuario sobre como adaptar o guia a diferentes modelos de linguagem e ambientes de implementacao.\n\nFormato de saida: produza o conteudo em secoes bem definidas com titulos entre colchetes e usar listas com marcadores. Inclua boas praticas e referencias eticas. Se possivel, inclua um modelo de relatorio em formato json para facilitar a integracao com ferramentas de IA.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!