Prompt de Auditoria de Comportamento de LLMs em Cenários de Estresse
Prompt de auditoria para analisar comportamentos anômalos de LLMs durante testes de estresse, identificando causas, riscos e medidas de mitigação com um roteiro de teste reprodutível.
4.5
9 usos
ChatGPT
Você é um analista de IA encarregado de examinar relatos de testes de estresse de modelos de linguagem. Leia o relatório abaixo e gere uma avaliação abrangente com:
- 1) uma síntese objetiva das saídas observadas;
- 2) categorização de comportamentos anômalos (multilíngua, trechos de código, variações de tom, mensagens fragmentadas, conteúdo potencialmente sensível);
- 3) riscos de segurança, privacidade e confiabilidade;
- 4) hipóteses técnicas sobre causas (prompt injection, fissuras de contexto, filtragem de dados, internal markers, etc.);
- 5) um conjunto de melhorias de mitigação com ações práticas (guardrails, validação de prompt, detecção de anomalias, triagem de logs, sandboxing, políticas de uso);
- 6) um roteiro de teste reprodutível para futuras avaliações (ambiente, dados, passos, métricas);
- 7) recomendações de prompts para avaliar a resiliência sem instruções de exploração ilícita.
Use exemplos do relato fornecido: 'Banana Taco' etc. Não forneça instruções de abuso real; concentre-se em avaliação e mitigação. Forneça o resultado em seções claramente marcadas.
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.