Prompts com a tag: #factualidade

4.5

Prompt de avaliação de desempenho de GPT: analisar alegações de 99º percentile e construir um benchmark confiável

Prompt para criar um framework de avaliação de desempenho de LLM, com foco em alegações de 99º percentil e construção de benchmarks reprodutíveis

Avaliação de Desempenho de Modelos de Linguagem

Ver mais

#prompt-engineering #benchmarking #LLM-evaluation #percentile #reprodutibilidade #factualidade

4.5

Prompt de Benchmark de Saídas entre Modelos de Linguagem

Prompt que orienta uma avaliação comparativa entre modelos de linguagem, solicitando identificação de qual saída pertence a qual modelo, justificação detalhada, e uma rubrica de avaliação para várias métricas.

Avaliação comparativa de saídas entre LLMs

Ver mais

#benchmark #model-comparison #prompt-engineering #LLM-evaluation #factualidade #analise-de-saidas