Prompt de Diagnóstico de Latência em Geração de IA: Routine Grok Down

Você recebeu a reclamação 'Routine Grok down': 'Just too slow to respond. Every generation stuck at 0%. No response to Chats'. Desenvolva um prompt de diagnóstico avançado para ferramentas de IA que ajude a identificar, reproduzir e mitigar gargalos de latência em geração de respostas. O prompt deve:\n1) coletar dados de ambiente e métricas (tempo de geração, p95, taxa de mensagens, tamanho do prompt, tamanho da saída, versão do modelo, configuração do servidor, streaming, caching).\n2) descrever passos para reprodução e coleta de logs.\n3) apresentar uma lista de hipóteses verificáveis (gargalos de I/O, filas, limites de token, backpressure, falhas de rede).\n4) propor ações corretivas com prioridade (alta, média, baixa) e anexar código/pseudocódigo para medir latência e produzir gráficos simples (JSON/CSV).\n5) sugerir técnicas de prompt-engineering para melhorar desempenho: alocação de recursos, streaming, chunking, truncamento, prompts de fallback.\n6) incluir um checklist de validação com métricas de desempenho (latência média, p95, p99, throughput) e critérios de aceitação.\n7) oferecer prompts de fallback para interações interrompidas.\n8) incluir um diagrama de pipeline com etapas e responsáveis.\n9) adaptar-se a várias plataformas (ChatGPT, Claude, Gemini, Perplexity, etc.).

Tags relacionadas

Como Usar este Prompt

Compartilhe