Prompts com a tag: #factualidade
4.5
37
Prompt de avaliação de desempenho de GPT: analisar alegações de 99º percentile e construir um benchmark confiável
Prompt para criar um framework de avaliação de desempenho de LLM, com foco em alegações de 99º percentil e construção de benchmarks reprodutíveis
4.5
45
Prompt de Benchmark de Saídas entre Modelos de Linguagem
Prompt que orienta uma avaliação comparativa entre modelos de linguagem, solicitando identificação de qual saída pertence a qual modelo, justificação detalhada, e uma rubrica de avaliação para várias métricas.