Prompt para projetar pipeline de enriquecimento de catálogo com LLM e validação de itens

Prompt para criar um pipeline automatizado de enriquecimento de catálogo usando LLM, com foco em validação de URLs, normalização de dados, e design de governança de dados.

4.0
10 usos
ChatGPT
Usar no ChatGPT
Este prompt solicita ao modelo que projete e descreva um pipeline de enriquecimento de catálogos baseado em LLM para preencher lacunas a partir da web aberta, com foco em imagens limpas, campos estruturados e sincronização com o esquema downstream. O objetivo é manter o catálogo em constante atualização, escalável para dezenas de milhares de itens, com dados que podem ficar desatualizados. O prompt deve: 1) propor arquitetura de alto nível (agente único com ferramentas vs pipeline multi-etapas com passagens de validação), 2) descrever fluxos de dados, 3) apontar falhas comuns (URLs de imagem inconsistentes, textos extraídos difíceis de normalizar), 4) estratégias para confirmar que a URL retornada pelo LLM corresponde ao item correto e não apenas a uma página funcional, 5) discutir se a automação completa é viável ou se uma abordagem assistida é preferível, 6) fornecer prompts-base para cada etapa (extração, normalização, mapeamento, validação, enriquecimento), 7) sugerir padrões de validação de dados, checagens de qualidade, logs e governança, 8) apresentar um diagrama textual do pipeline (ASCII) e um conjunto mínimo de campos a serem extraídos, 9) incluir métricas de confiabilidade, custo e tempo, 10) apresentar um plano de mitigação de falhas e testes. Inclua também: exemplos de testes de regressão, critérios de aceitação, e uma lista de checagem para entrar em produção. Perguntas orientadoras para o modelo: qual estratégia de orquestração é mais adequada para esse caso? como confirmar que a URL retornada corresponde ao item correto em vez de apenas uma página com o mesmo nome? quais checks automatizados de qualidade de dados devem ser implementados? qual é o conjunto mínimo de campos da schema? como lidar com data drift e dados que mudam com o tempo? como escalar para atualizações contínuas sem rompimento do pipeline?

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!