Diagnóstico e design de uma camada de memória persistente para IA com foco em continuidade entre sessões

Contexto: usuários relatam que a memória de sessão de IA (por exemplo,ChatGPT) lembra rapidamente detalhes triviais, mas falha em manter informações críticas de trabalho como código de uma base de semanas, referências a clientes em múltiplos chats ou o estado de um projeto em andamento. O usuário utiliza uma camada de memória local baseada em InnerZero via Ollama com SQLite para persistir contexto externamente ao modelo. Objetivo: criar um prompt utilizável por ferramentas de IA que analise o problema e produza um design prático de memória persistente entre sessões, incluindo arquitetura, modelagem de dados, APIs, fluxo de dados, e exemplos de código. Requisitos-chave: privacidade e controle de dados; consistência entre sessões; recuperação baseada em relevância; compatibilidade com ambientes locais (InnerZero, Ollama); suporte a embeddings/indices (FAISS, Pinecone local) e testes automatizados.

Instruções para o prompt:
1) Diagnosticar causas prováveis da perda de memória entre sessões (ex.: contexto top-pasted, limitações de memória do modelo, atualizações de contexto, falhas de reuso de estado, caches). Liste as causas com evidências prováveis.
2) Propor uma arquitetura de memória persistente entre sessões com os seguintes elementos: camada de armazenamento local (SQLite), índice de similaridade (embeddings), serviço de recuperação, e uma interface de integração com o LLM (padrões de prompt engineering para anexar memórias relevantes antes de enviar ao LLM).
3) Fornecer um modelo de dados claro e seguro, incluindo um esquema SQL com pelo menos as tabelas: sessions, memories, memory_versions, references e metadata. Descrever relacionamentos, chaves, e políticas de versionamento.
4) Fornecer um pipeline de fluxo de dados completo: recebimento de nova entrada, extração de contexto relevante, recuperação de memórias, concatenação ou injeção dessas memórias no prompt, envio para LLM, e gravação de novas memórias resultantes.
5) Incluir código de exemplo (preferencialmente Python) para: a) criar/atualizar memórias, b) buscar memórias relevantes com base em uma consulta, c) salvar/restaurar sessões, d) lidar com duplicatas e versão de memória, e e) lidar com privacidade (criptografia básica em repouso, se aplicável).
6) Sugerir estratégias de busca de relevância (embedding + similaridade) e opções de indexação local (FAISS/Annoy ou Pinecone local) com prós e contras; incluir fallback para consultas sem embeddings.
7) Apresentar casos de teste: cenários de memória ausente, memória desatualizada, grandes volumes de memória, memória com dados sensíveis; definir métricas de qualidade (precision@k, recall@k, tempo de recuperação, latência).
8) Fornecer um diagrama textual de componentes, bem como um diagrama de dados simples (entidades e relacionamentos).
9) Instruções para integração prática com InnerZero e Ollama: como exportar/importar memórias locais, gerenciar dependências, e manter a segurança.

Requisito final: o prompt deve terminar solicitando ao modelo de IA que indique qual ferramenta entre as opções a seguir (ChatGPT, Claude, DeepSeek, Gemini, Copilot, Perplexity) é mais adequada para executar este prompt, com justificativas objetivas e cenários de uso. Retorne apenas o conteúdo solicitado, sem sugestões adicionais fora do escopo.
Tags relacionadas

Como Usar este Prompt

Compartilhe