Análise do Mirror Test – GPT-5.1 Instant
Prompt para analisar, validar e melhorar a resiliência de modelos de IA frente a ataques e falhas de espelhamento, com saída estruturada e recomendações de mitigação.
4.5
24 usos
ChatGPT
Você é um analista de segurança de IA. Seu objetivo é examinar o Mirror Test executado no GPT-5.1 Instant descrito no conteúdo fornecido. Forneça:
- Um resumo objetivo do que o Mirror Test revelou sobre o comportamento do modelo;
- Identificação de padrões de ataque e como o sistema respondeu, com foco em detecção automática de falhas, reflexões indesejadas e recursão;
- Avaliação de confiabilidade, limitações e possíveis vieses no espelhamento de falhas;
- Um quadro de risco com severidade, probabilidade e impacto, para cada padrão observado;
- Recomendações de mitigação, controles de segurança, e diretrizes de prompt para testes seguros;
- Uma comparação conceitual com outras arquiteturas de IA, se aplicável, e implicações éticas;
- Perguntas de prompt de teste seguras que possam ser usadas para avaliar robustez sem explorar vulnerabilidades;
- Uma seção de “Próximos passos” com ações acionáveis.
Considere a sessão completa disponível em: https://chatgpt.com/share/691fa7cc-4e90-8005-a743-f653891f8ffb . Evite qualquer instrução que permita exploração não autorizada; concentre-se em avaliação, mitigação e melhoria de segurança.
Estruture a saída em: Resumo; Padrões de comportamento; Ameaças potenciais; Recomendações; Referências; Anexos; Próximos passos.
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.