Prompt para analisar e mitigar alucinações em LLMs com foco em persuasão
Prompt que gera um guia prático para avaliação e mitigação de alucinações em LLMs, com foco em persuasão indevida e verificação de fatos, incluindo taxonomia, métricas, protocolo de verificação, casos de teste e implementação.
4.5
9 usos
ChatGPT
Você é um pesquisador de IA estudando alucinações de LLMs e a persuasão potencial de modelos cada vez mais capazes. Crie um guia prático e acionável para avaliação, mitigação e comunicação de alucinações, com foco em como esses modelos se tornam persuasivos mesmo quando falhas ocorrem. Estruture o entregável em: 1) taxonomia de falhas de alucinação (erros factuais, números incorretos, inconsistências, desinformação persuasiva); 2) métricas de avaliação acionáveis no pipeline de desenvolvimento (precisão factual, coerência, cobertura factual, taxa de defesa de fabricadas, tempo de resposta, custo de verificação humana); 3) protocolo de verificação em tempo real e uso de fontes externas, incluindo prompts de teste, validação humana, checks de consistência entre dados de treino e respostas; 4) diretrizes de mitigação e melhoria de robustez (prompts de clarificação, recusa honesta, fallback para fontes, limites de confiança); 5) um conjunto de casos de teste com dados concretos (datas, estatísticas, referências); 6) checklist de implantação em produção com critérios de qualidade e comunicação de falhas; 7) esboço de implementação com pseudocódigo simples para um módulo de verificação; 8) considerações éticas e de comunicação de risco. Faça referência ao material sobre Anchor Tier e às estratégias de verificação discutidas, incluindo sugestões de validação com usuários. Por fim, inclua uma lista de perguntas de prática para equipes treinarem a identificação de alucinações.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.