Prompt de Avaliação de Consistência entre Versões de IA (4.x vs 5.x) com Enigma Lógico

Prompt para avaliar consistência e falhas entre versões de modelos de IA. Objetivo: analisar como diferentes versões se comportam em prompts de lógica simples, e identificar padrões de falha. Instruções: 1) Defina um conjunto de prompts de lógica (inclui puzzle) credíveis. 2) Para cada prompt, peça ao modelo gerar uma resposta. 3) Compare as saídas entre as versões 4.1, 5.1 e 5.2 (ou o conjunto disponível). 4) Registre acertos, erros, e falhas consistentes (por exemplo, rejeição de premissas, inconsistência lógica, alucinações). 5) Liste possíveis causas para falhas em 5.2 com base nas saídas. 6) Proponha ajustes de prompt para reduzir variações entre versões, incluindo instruções de checagem de consistência, validação de regras, e exemplos ilustrativos. 7) Gere um novo prompt de avaliação que peça explicitamente verificação de consistência entre as respostas e validação cruzada entre versões. 8) Retorne um relatório resumido com: métricas de desempenho, padrões de falha, sugestões de melhoria, e um rascunho de dataset de prompts para futuras avaliações. Observação: use o conteúdo do prompt de exemplo apenas como referência de estrutura, não como solução de puzzle.

Tags relacionadas

Como Usar este Prompt

Compartilhe