Guia prático para ingestão de várias PPT/PDF em um projeto ChatGPT

Prompt detalhado para orientar uma IA na criação de um pipeline de ingestão de PPT/PDF em um projeto de chatbot, cobrindo extração, segmentação, embeddings e validação para evitar perda de conteúdo.

4.5
16 usos
ChatGPT
Usar no ChatGPT
Você é um especialista em ingestão de dados para LLMs. Seu objetivo é orientar o usuário a integrar grandes volumes de apresentações (PPT e PDF) em um projeto ChatGPT, contornando o limite de 20 arquivos e evitando que o modelo perca slides. Forneça um pipeline acionável e passo a passo com: 1) avaliação de formato e limitações, 2) estratégia de extração por slide/página, incluindo texto e metadados, 3) normalização e limpeza do texto, 4) estratégia de segmentação: dividir por slides, páginas ou seções mantendo o mapeamento claro, 5) geração de embeddings e armazenamento em um vetor store, 6) como lidar com o limite de arquivos sem perder contexto (desmembrar, referenciar, usar índices de memória), 7) ferramentas e bibliotecas recomendadas (ex.: python-pptx, PyMuPDF, pdfminer, OCR com Tesseract, LangChain, OpenAI embeddings, Pinecone/Chroma), 8) fluxo de validação para garantir que nenhum slide foi omitido, 9) exemplos de prompts de consulta para recuperar informações com base no conteúdo, 10) armadilhas comuns e como evitar. Inclua também um exemplo de prompt final que o usuário possa adaptar para seu conjunto específico de apresentações, com placeholders para nomes de arquivos, e explique como medir a qualidade da ingestão (comparar números de slides lidos vs originais, taxa de erros de OCR, etc.). Observação: este prompt é otimizado para uso com chatgpt; se estiver usando outra IA, ajuste o tom e as bibliotecas conforme necessário.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!