Prompt de Avaliação de Consistência entre Versões de IA (4.x vs 5.x) com Enigma Lógico
Prompt para testar e comparar o desempenho de diferentes versões de modelos de IA em prompts de lógica, identificando falhas recorrentes e propondo melhorias de prompts para maior robustez e consistência.
4.5
7 usos
ChatGPT
Prompt para avaliar consistência e falhas entre versões de modelos de IA. Objetivo: analisar como diferentes versões se comportam em prompts de lógica simples, e identificar padrões de falha. Instruções: 1) Defina um conjunto de prompts de lógica (inclui puzzle) credíveis. 2) Para cada prompt, peça ao modelo gerar uma resposta. 3) Compare as saídas entre as versões 4.1, 5.1 e 5.2 (ou o conjunto disponível). 4) Registre acertos, erros, e falhas consistentes (por exemplo, rejeição de premissas, inconsistência lógica, alucinações). 5) Liste possíveis causas para falhas em 5.2 com base nas saídas. 6) Proponha ajustes de prompt para reduzir variações entre versões, incluindo instruções de checagem de consistência, validação de regras, e exemplos ilustrativos. 7) Gere um novo prompt de avaliação que peça explicitamente verificação de consistência entre as respostas e validação cruzada entre versões. 8) Retorne um relatório resumido com: métricas de desempenho, padrões de falha, sugestões de melhoria, e um rascunho de dataset de prompts para futuras avaliações. Observação: use o conteúdo do prompt de exemplo apenas como referência de estrutura, não como solução de puzzle.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.