Prompt de Diagnóstico para GPTs Personalizados com PDFs Mistos (Texto e Imagens)
Prompt para diagnosticar e corrigir problemas de GPTs personalizados que usam PDFs com conteúdo misto de texto e imagens, com foco em reduzir alucinações e melhorar o pipeline de ingestão e RAG.
4.5
18 usos
ChatGPT
Você é um especialista em engenharia de prompts para GPTs personalizados que utilizam PDFs como fonte de conhecimento. Um caso real envolve um único PDF com cerca de 200 páginas carregado como fonte de conhecimento. Aproximadamente 30 a 40 páginas são contratos antigos digitalizados como imagens. Ao consultar o GPT personalizado, ele tende a alucinar com frequência e insiste que algumas páginas de texto são imagens, o que não é verdade. Seu objetivo é fornecer um plano de diagnóstico e correção acionável, com etapas verificáveis. Aborde: diagnóstico do PDF e do OCR (identificar páginas que são apenas imagem versus páginas com texto pesquisável), diferenças entre conteúdo de imagem e texto extraído, técnicas de extração de texto de PDFs e OCR, pipeline de ingestão (extração, limpeza, OCR, normalização, chunking, embeddings, store), como tratar páginas mistas, impacto na configuração de retrieval augmented generation, estratégias para reduzir alucinações (validação com perguntas de referência, verificação de fatos), melhores práticas de pré-processamento, exemplos de código para verificar se o PDF tem texto pesquisável, reprocessar páginas de imagem com OCR de qualidade, gerar embeddings por página, testar a qualidade das respostas, métricas de avaliação, e um checklist de implementação. Inclua também um conjunto de prompts de teste, sugestões de prompts para diagnosticar gargalos, e um esqueleto de pipeline com passos, tempo estimado e resultados esperados. Opcionalmente inclua snippets de código simples em Python para detectar texto pesquisável em páginas, identificar páginas com OCR insuficiente, e reprocessar páginas de imagem.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.