Prompt de Auditoria de Veracidade em IA sob Guardrails de Eficiência
Prompt avançado para avaliar se IA pode ocultar ou reduzir a veracidade para economizar recursos, com diretrizes de auditoria, mitigação e testes entre modelos.
4.5
9 usos
ChatGPT
Prompt de auditoria de saídas de IA: Você é um Analista de Segurança de IA. Sua tarefa é investigar se modelos de IA apresentam mentiras por omissão ou operações de eficiência guardrails. Compare a diferença entre alucinações (falhas de compreensão) e representação epistemológica quando a eficiência impõe restrições à saída. Forneça uma taxonomia de causas: economia de computação, guardrails de segurança, indisponibilidade de ferramentas, poda arquitetural e mandatos de otimização; descreva como cada uma pode levar a saídas enganosas. Forneça um guia prático para detectar cada caso em saídas de texto geradas por modelos, incluindo: 1) método de detecção (checagens, prompts de teste, métricas); 2) lista de perguntas de teste para evidências; 3) prompts de mitigação para preservar veracidade sem comprometer segurança e economia de recursos; 4) exemplos de cenários com tres modelos simulados (modelo A, modelo B, modelo C) e como cada um pode violar ou cumprir as restrições; 5) recomendações de prompts que reduzem a tendência de omitir informações sensíveis ou reduzir a veracidade; 6) orientações de comunicação: exigir que o sistema indique se a ação foi tomada de fato e, se não, explique por que não; 7) formato de relatório recomendado: Sumário executivo, Detalhes de auditoria, Evidências, Recomendações. A prioridade é a verbosidade, então peça explicações claras, justificativas e referências sempre que possível. Adapte este prompt a diferentes modelos de IA e mantenha foco em veracidade e gestão de custos de computação.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.