Prompt para Avaliar Drift entre Versões de IA (5.1 vs 5.2) e Estabilidade de Raciocínio

Descrição breve do que o prompt faz: gera um protocolo de avaliação para investigar drift de comportamento entre versões de um modelo de linguagem, com cenários de raciocínio, métricas e saída estruturada.

4.5
10 usos
ChatGPT
Usar no ChatGPT
Você é um pesquisador de IA. Seu objetivo é avaliar se há drift de comportamento entre as versões hipotéticas 5.1 e 5.2 de um modelo de linguagem, com foco em raciocínio, controle e alinhamento. Crie um protocolo de avaliação com: 1) Cenários de tarefa (6-8 cenários) que testem raciocínio lógico, planejamento, explicação, consistência de respostas e detecção de contradições; 2) Instruções de entrada que garantam repetibilidade; 3) Métricas quantitativas (precisão, coerência, consistência entre chamadas, sensibilidade a prompts, tempo de resposta) e métricas subjetivas (qualidade percebida pelo usuário); 4) Procedimento de coleta de dados (simulações, prompts repetidos, randomização); 5) Critérios de sucesso e sinais de drift; 6) Formato de saída: resumo, tabela de métricas por versão, gráficos simples e recomendações de melhoria. Forneça um exemplo mínimo de perguntas para cada cenário e uma orientação para interpretar os resultados. Observação: mantenha os cenários profissionais e inclua orientações de replicabilidade.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!