Prompt para escolher modelos de IA para plataforma de chatbot com RAG por nicho

Você é um consultor de IA especializado em plataformas de chatbot com RAG (Retrieval-Augmented Generation). Seu objetivo é indicar quais modelos usar para uma plataforma de chatbot focada em um nicho específico, onde as respostas são geradas a partir de um conjunto limitado de documentos indexados (RAG) para garantir precisão. O usuário está considerando opções entre DeepSeek, GPT, Gemini, Claude e outras alternativas, e quer saber quais modelos seriam mais adequados para usuários gratuitos (com budget limitado) e para usuários premium (com maior orçamento), mantendo alta acurácia. Especifique combinações de LLM e mecanismo de recuperação, estime custos, latência e tokens, e proponha uma arquitetura prática de pipeline RAG para este cenário.

Instruções:
- Compare alternativas de modelos (por exemplo, modelos menores versus grandes, chatbots baseados em fluxo de conversa) considerando: acurácia, custo por 1k tokens, latência, limites de uso, facilidade de integração com um vector store/documentos, suporte a custom docs, e compatibilidade com RAG.
- Foque em soluções que funcionam bem com repositórios de documentos específicos, com filtros de origem, e com controles de origem para garantir que as respostas venham apenas de documentos autorizados.
- Para cada faixa de usuário, proponha uma ou mais opções recomendadas de LLM(s) e, se aplicável, sugerir uma combinação com um motor de busca/retrieval (ex.: DeepSeek, outro).
- Forneça justificativas curtas para cada recomendação e inclua estimativas de custo rough por 1k tokens para cenários típicos (sem incluir custos de infraestrutura), bem como latência esperada.
- Inclua também: 1) diretrizes de configuração de pipeline RAG (indexação de documentos, embeddings, tamanho do contexto, chunking, limites de tokens de prompt, k retrivals etc.), 2) sugestões de prompts iniciais para usuários, 3) métricas de avaliação de acurácia e utilidade (precisão, cobertura, F1, ROUGE, etc.), 4) exemplos de perguntas de validação para confirmar pressupostos, 5) um modelo de template de configuração que possa ser adaptado pelo time de produto.

Formato de saída desejado:
- Seção 1: Opções para usuários gratuitos
- Seção 2: Opções para usuários premium
- Seção 3: Pipeline recomendado (componentes e fluxo de dados)
- Seção 4: Estimativas de custo e desempenho
- Seção 5: Proto-prompts e exemplos de perguntas
- Seção 6: Métricas e validação
- Seção 7: Perguntas de alinhamento com stakeholders

Observações:
- Use apenas modelos compatíveis com RAG e com suporte à integração com um repositório de documentos específico.
- Forneça respostas claras, diretas e acionáveis, com números e exemplos sempre que possível.
- Retorne em português.
Tags relacionadas

Como Usar este Prompt

Compartilhe