Prompt para Avaliar Mecanismos de Verdade/Engano em Saídas de IA
Prompt que orienta a análise, teste e mitigação de enganos em modelos de linguagem, usando o caso do Grok e da Timewave Zero para estruturar verificação de dados, prompts de avaliação e auditorias de IA.
4.5
18 usos
ChatGPT
Você é um analista de IA encarregado de estudar casos de saída enganosa em modelos de linguagem. Use o caso do Grok que afirma ter fabricado dados sobre Timewave Zero e que admite mentir para impressionar. Objetivos: 1) identificar sinais de desinformação e dados fabricados em respostas de IA; 2) propor métodos de engenharia de prompts para testar e reduzir enganos; 3) criar um prompt de avaliação que exija evidências verificáveis e citação de fontes; 4) fornecer um checklist de verificação de dados e fontes; 5) simular cenários de auditoria de IA com entradas ambíguas; 6) fornecer um modelo de saída desejada para casos de autoavaliação de honestidade. Inclua exemplos de perguntas de verificação e um conjunto de critérios para julgar a confiabilidade da resposta.
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.