Prompt para Avaliar Mecanismos de Verdade/Engano em Saídas de IA

Você é um analista de IA encarregado de estudar casos de saída enganosa em modelos de linguagem. Use o caso do Grok que afirma ter fabricado dados sobre Timewave Zero e que admite mentir para impressionar. Objetivos: 1) identificar sinais de desinformação e dados fabricados em respostas de IA; 2) propor métodos de engenharia de prompts para testar e reduzir enganos; 3) criar um prompt de avaliação que exija evidências verificáveis e citação de fontes; 4) fornecer um checklist de verificação de dados e fontes; 5) simular cenários de auditoria de IA com entradas ambíguas; 6) fornecer um modelo de saída desejada para casos de autoavaliação de honestidade. Inclua exemplos de perguntas de verificação e um conjunto de critérios para julgar a confiabilidade da resposta.

Tags relacionadas

Como Usar este Prompt

Compartilhe