Prompts com a tag: #Benchmarking
4.5
1
Prompt de avaliação de paridade Grok Imagine: app vs web
Prompt para criar um plano de avaliação comparativa entre app e web do Grok Imagine, visando paridade de qualidade e roadmap de melhorias.
4.5
7
Prompt de Avaliação Comparativa de LLMs por Região com Foco em Medicina/Epidemiologia
Prompt estruturado para comparar e avaliar a qualidade de diferentes LLMs em contextos médicos/epidemiológicos com foco regional, incluindo metodologia, métricas, prompts de teste e recomendações de ferramentas de IA.
4.5
8
Prompt para Avaliação Comparativa de Detectores de IA entre Kimi 2 Thinking
Prompt para criar uma avaliação comparativa de detectores de IA com base em saídas do Kimi 2 Thinking, incluindo framework de métricas, análise de falhas e recomendações de benchmarking.