Prompts com a tag: #LLM-evaluation

4.5
27

Prompt de Benchmark de Saídas entre Modelos de Linguagem

Prompt que orienta uma avaliação comparativa entre modelos de linguagem, solicitando identificação de qual saída pertence a qual modelo, justificação detalhada, e uma rubrica de avaliação para várias métricas.

4.5
25

Prompt de avaliação comparativa de Grok 4 vs Grok 4.1 com referências a Gemini 3 Pro

Prompt avançado para avaliar e comparar Grok 4 e Grok 4.1, incluindo considerações sobre o Gemini 3 Pro, com foco em raciocínio, coerência e precisão, e com saída estruturada para uso em dashboards de IA.