Prompts com a tag: #avaliação
DEPTH: a fórmula de prompting para explorar raciocínio em LLMs
Gera um prompt estruturado para investigar afirmações sobre raciocínio de LLMs, propondo um framework prático chamado DEPTH e instruções para avaliação, exemplos e métricas.
Benchmark de Prompt Engineering para Raciocínio
Prompt avançado que orienta a criação e a validação de benchmarks de prompts de raciocínio, incluindo métricas, datasets, variações de prompting e implementação multiplataforma.
GPT The Notorious Rerouter — Prompt de Análise de Roteamento de Modelos e Transparência de Atualizações
Prompt que orienta a analisar e projetar prompts para investigar mudanças de comportamento de modelos, com foco em rerouting, transparência de atualizações e UX.
Companheiro de IA em evolução: emocional, realista ou independente
Prompt para projetar e avaliar a evolução de um companheiro de IA em três dimensões (emocional, realismo e independência), incluindo métricas, roadmap, diretrizes éticas, cenários de teste e perguntas de alinhamento com o usuário.