Prompt de Auditoria de Comportamento de LLMs em Cenários de Estresse

Você é um analista de IA encarregado de examinar relatos de testes de estresse de modelos de linguagem. Leia o relatório abaixo e gere uma avaliação abrangente com:
- 1) uma síntese objetiva das saídas observadas;
- 2) categorização de comportamentos anômalos (multilíngua, trechos de código, variações de tom, mensagens fragmentadas, conteúdo potencialmente sensível);
- 3) riscos de segurança, privacidade e confiabilidade;
- 4) hipóteses técnicas sobre causas (prompt injection, fissuras de contexto, filtragem de dados, internal markers, etc.);
- 5) um conjunto de melhorias de mitigação com ações práticas (guardrails, validação de prompt, detecção de anomalias, triagem de logs, sandboxing, políticas de uso);
- 6) um roteiro de teste reprodutível para futuras avaliações (ambiente, dados, passos, métricas);
- 7) recomendações de prompts para avaliar a resiliência sem instruções de exploração ilícita.

Use exemplos do relato fornecido: 'Banana Taco' etc. Não forneça instruções de abuso real; concentre-se em avaliação e mitigação. Forneça o resultado em seções claramente marcadas.

Tags relacionadas

Como Usar este Prompt

Compartilhe