Prompt para Avaliação de Dificuldades de Instrução como Medida de Originalidade em LLMs
4.5
7 usos
ChatGPT
Baseando-se no conceito de que dificuldades de instrução em LLMs podem servir como dados diagnósticos para medir originalidade, desenvolva um protocolo de prompt engineering replicável. O objetivo é criar um kit de experimentos para avaliar como LLMs seguem instruções complexas, identificar alucinações e drift de instrução, e usar essas falhas como proxy para divergência de frameworks teóricos. Especifique tarefas, métricas e procedimentos que possam ser aplicados a várias plataformas (chatgpt, claude, gemini, perplexity, copilot, deepseek).
Instruções:
1) Gere uma linha de prompts estruturados que evoquem diferentes frameworks teóricos e variem em complexidade e ambiguidade; inclua prompts que introduzam contradições, omissões de contexto e instruções com restrições de estilo.
2) Proponha uma métrica composta para avaliação: aderência à instrução, consistência entre saídas em variações do prompt, e divergência entre o framework pretendido e a saída real (fluxo de pensamento, coerência, e fidelidade do conteúdo). Defina como combinar esses componentes em uma pontuação final.
3) Desenhe um pipeline de dados: conjunto de prompts de teste, instruções de controle, prompts de reparo e rubrica de avaliação; descreva como coletar, armazenar e comparar saídas entre modelos diferentes.
4) Forneça um esqueleto de código (pseudocódigo Python) para: a) chamar uma API de LLM com cada prompt, b) registrar as saídas, c) calcular as métricas definidas, d) gerar visualizações iniciais.
5) Ofereça sugestões de visualizações para reportar resultados (gráficos de aderência, curvas de drift ao longo de variações de instrução, heatmaps de consistência entre prompts).
6) Inclua considerações éticas, viés de dados, e limitações do estudo.
Entrega esperada:
- 1) Uma lista de prompts de teste e prompts de reparo bem definidas;
- 2) Uma rubrica de avaliação com critérios e pesos;
- 3) Um pseudo-código Python para implementação;
-4) Um conjunto de sugestões de visualização;
-5) Um resumo de 2 a 3 parágrafos e 5 takeaways-chave.
Observação: adapte o conteúdo para diferentes plataformas de IA, mantendo clareza de instruções, evitar ambiguidades desnecessárias e garantindo que o protocolo permaneça reproduzível entre modelos distintos.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.