Prompts com a tag: #LLM-evaluation
4.5
27
Prompt de Benchmark de Saídas entre Modelos de Linguagem
Prompt que orienta uma avaliação comparativa entre modelos de linguagem, solicitando identificação de qual saída pertence a qual modelo, justificação detalhada, e uma rubrica de avaliação para várias métricas.
4.5
25
Prompt de avaliação comparativa de Grok 4 vs Grok 4.1 com referências a Gemini 3 Pro
Prompt avançado para avaliar e comparar Grok 4 e Grok 4.1, incluindo considerações sobre o Gemini 3 Pro, com foco em raciocínio, coerência e precisão, e com saída estruturada para uso em dashboards de IA.