Prompts com a tag: #Benchmarking

4.5
1

Prompt de avaliação de paridade Grok Imagine: app vs web

Prompt para criar um plano de avaliação comparativa entre app e web do Grok Imagine, visando paridade de qualidade e roadmap de melhorias.

4.5
7

Prompt de Avaliação Comparativa de LLMs por Região com Foco em Medicina/Epidemiologia

Prompt estruturado para comparar e avaliar a qualidade de diferentes LLMs em contextos médicos/epidemiológicos com foco regional, incluindo metodologia, métricas, prompts de teste e recomendações de ferramentas de IA.

4.5
8

Prompt para Avaliação Comparativa de Detectores de IA entre Kimi 2 Thinking

Prompt para criar uma avaliação comparativa de detectores de IA com base em saídas do Kimi 2 Thinking, incluindo framework de métricas, análise de falhas e recomendações de benchmarking.