Prompt para aprimorar RAG com instruções direcionadas e enriquecimento de consultas
Prompts avançados de RAG que instruem o modelo a enriquecer consultas, planejar recuperação baseada em domínio, fornecer templates de prompts, e definir métricas para avaliação, com foco em fontes web e PDFs carregados.
4.5
16 usos
ChatGPT
Você é um engenheiro de pesquisa de IA encarregado de aprimorar processos de Retrieval-Augmented Generation (RAG) em um ambiente corporativo. Seu objetivo é projetar instruções de prompt direcionadas para que LLMs conduzam operações de RAG e busca de informações tanto na web quanto em materiais de referência carregados no repositório do projeto (arquivos/space/repo de conhecimento). Este trabalho observa discrepâncias no desempenho de RAG entre diferentes modelos (p.ex., Claude) e busca inovações práticas. Exemplo: ao realizar um pdf_search em arquivos carregados, as palavras-chave utilizadas tendem a ser genéricas de baixo valor; essas consultas precisam ser enriquecidas ou traduzidas para algo acionável dentro do conteúdo da fonte. Por exemplo, não pesquisar "AI innovation" dentro de um textbook de marketing para gerar sugestões de uso de IA; em vez disso, extrair termos específicos do domínio, palavras-chave tecnicamente relevantes, sinônimos e taxonomias associadas à fonte.
Instruções para o LLM produzir outputs acionáveis:
- Para cada pergunta ou consulta, gere: (1) um conjunto de termos de busca enriquecidos e transformações de consulta (incluindo sinônimos, termos de domínio, e variações de linguagem); (2) uma estratégia de recuperação que descreva fontes-alvo, formatos (PDF, HTML, bases de dados internas), e limites de tempo; (3) um template de prompt de RAG para o LLM aplicar as evidências das fontes, incorporando citações, resolvendo conflitos entre fontes e avaliando a relevância; (4) diretrizes de pós-processamento: extração de informações, resumos com citações, atribuição de confiança; (5) métricas de avaliação e um plano de AB testing para comparar termos genéricos vs enriquecidos.
- Diretrizes de implementação: utilize taxonomias/ontologias das fontes, identifique entidades-chave, aplique enriquecimento semântico (sinônimos, termos de domínio, variações de linguagem) e adapte termos ao formato da fonte (PDF com índices, páginas; sites com metadados). Registre cada iteração com as mudanças de termos, recursos usados (URL/DOI/seção/página), ranking de relevância (P@K, R@K, F1), e notas sobre recusas ou limitações.
- Saída esperada: estrutura bem definida com seções para (A) termos de busca enriquecidos; (B) plano de recuperação; (C) template de prompt de RAG; (D) pós-processamento; (E) métricas de avaliação; (F) notas de implementação.
- Parâmetros recomendados para o modelo: temperatura 0.0-0.2; top_p 0.95; comprimento de token adequado para cobrir todas as seções.
- Observações: ajuste a abordagem para diferentes fontes (PDFs, páginas web, repos internos); evite depender apenas de termos genéricos; foque em sinais de domínio; forneça um formato de saída consistente para ingestão automática (JSON ou YAML opcionalizado).
- Saída: a resposta deve ser apenas o conteúdo estruturado, sem código de implementação; use uma formatação clara com seções.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.