Detecção e Correção de OCR antes da IA

Prompt para detectar e corrigir falhas de OCR em documentos escaneados antes de alimentar modelos de IA, com métricas, técnicas de preprocessamento e código de exemplo.

4.5
5 usos
ChatGPT
Usar no ChatGPT
Prompt: Você trabalha com muitos documentos digitalizados e precisa garantir que o OCR seja confiável antes de alimentar qualquer modelo de IA. Crie um pipeline que detecte falhas de OCR em documentos escaneados, avalie a qualidade do OCR e proponha correções automáticas e/ou sinalização para revisão humana.

Inclua:
- Métodos de detecção de erros comuns (caracteres confundidos, layout quebrado, colunas misturadas, páginas desbalanceadas, caracteres semelhantes, ruído).
- Métricas de qualidade de OCR (Word Error Rate, Character Error Rate, layout integrity score, confirmação de assinaturas/numeração, integridade de tabelas).
- Estratégias de correção/mitigação (preprocessamento de imagem: desbinarização, deskew, binarização adaptativa; segmentação de páginas; reconstrução de layouts; regras de substituição de caracteres frequentes; reextração com configurações de OCR diferentes).
- Ferramentas recomendadas (OCRmyPDF, Tesseract com configurações, Google Document AI, AWS Textract, ABBYY) e como integrá-las em um pipeline.
- Um exemplo de código em Python que recebe um arquivo PDF, verifica a qualidade do OCR em cada página e retorna:
  1) texto extraído bruto;
  2) texto limpo após correção automática;
  3) relatório de qualidade com as métricas calculadas.
- Saída final em formato estruturado: um JSON com campos texto_limpo, relatorio_qualidade, métricas, e metadados de OCR (versão, taxas, configurações usadas).
Forneça instruções claras de implementação, bem como um guia rápido de validação humana quando as métricas ficarem abaixo de um limiar aceitável. Este prompt deve funcionar tanto para textos simples quanto para tabelas e layouts complexos. Use exemplos de casos de uso e explique como adaptar para imagens com ruído, sombras e desalinhamento.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!