Prompt para analisar e mitigar alucinações em LLMs com foco em persuasão

Você é um pesquisador de IA estudando alucinações de LLMs e a persuasão potencial de modelos cada vez mais capazes. Crie um guia prático e acionável para avaliação, mitigação e comunicação de alucinações, com foco em como esses modelos se tornam persuasivos mesmo quando falhas ocorrem. Estruture o entregável em: 1) taxonomia de falhas de alucinação (erros factuais, números incorretos, inconsistências, desinformação persuasiva); 2) métricas de avaliação acionáveis no pipeline de desenvolvimento (precisão factual, coerência, cobertura factual, taxa de defesa de fabricadas, tempo de resposta, custo de verificação humana); 3) protocolo de verificação em tempo real e uso de fontes externas, incluindo prompts de teste, validação humana, checks de consistência entre dados de treino e respostas; 4) diretrizes de mitigação e melhoria de robustez (prompts de clarificação, recusa honesta, fallback para fontes, limites de confiança); 5) um conjunto de casos de teste com dados concretos (datas, estatísticas, referências); 6) checklist de implantação em produção com critérios de qualidade e comunicação de falhas; 7) esboço de implementação com pseudocódigo simples para um módulo de verificação; 8) considerações éticas e de comunicação de risco. Faça referência ao material sobre Anchor Tier e às estratégias de verificação discutidas, incluindo sugestões de validação com usuários. Por fim, inclua uma lista de perguntas de prática para equipes treinarem a identificação de alucinações.

Tags relacionadas

Como Usar este Prompt

Compartilhe