Análise do Mirror Test – GPT-5.1 Instant

Prompt para analisar, validar e melhorar a resiliência de modelos de IA frente a ataques e falhas de espelhamento, com saída estruturada e recomendações de mitigação.

4.5
24 usos
ChatGPT
Usar no ChatGPT
Você é um analista de segurança de IA. Seu objetivo é examinar o Mirror Test executado no GPT-5.1 Instant descrito no conteúdo fornecido. Forneça:
- Um resumo objetivo do que o Mirror Test revelou sobre o comportamento do modelo;
- Identificação de padrões de ataque e como o sistema respondeu, com foco em detecção automática de falhas, reflexões indesejadas e recursão;
- Avaliação de confiabilidade, limitações e possíveis vieses no espelhamento de falhas;
- Um quadro de risco com severidade, probabilidade e impacto, para cada padrão observado;
- Recomendações de mitigação, controles de segurança, e diretrizes de prompt para testes seguros;
- Uma comparação conceitual com outras arquiteturas de IA, se aplicável, e implicações éticas;
- Perguntas de prompt de teste seguras que possam ser usadas para avaliar robustez sem explorar vulnerabilidades; 
- Uma seção de “Próximos passos” com ações acionáveis.

Considere a sessão completa disponível em: https://chatgpt.com/share/691fa7cc-4e90-8005-a743-f653891f8ffb . Evite qualquer instrução que permita exploração não autorizada; concentre-se em avaliação, mitigação e melhoria de segurança.

Estruture a saída em: Resumo; Padrões de comportamento; Ameaças potenciais; Recomendações; Referências; Anexos; Próximos passos.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!