Prompts com a tag: #multi-model benchmarking
4.5
2
Harness de Benchmark de Consistência de Prompts entre Modelos (Cross-Model)
Prompt para orientar a avaliação de consistência entre prompts em múltiplos modelos de linguagem, coletando, comparando e analisando discordâncias para orientar prompts mais robustos.