Prompts com a tag: #Benchmarking

4.5
7

Prompt para diagnóstico de queda de desempenho de modelos de IA e estratégia de migração

Prompt abrangente para diagnosticar deterioração de desempenho de modelos de linguagem e estruturar um plano de migração entre plataformas, com métricas, benchmarking, governança e relatório.

4.5
13

Prompt de avaliação de paridade Grok Imagine: app vs web

Prompt para criar um plano de avaliação comparativa entre app e web do Grok Imagine, visando paridade de qualidade e roadmap de melhorias.

4.5
16

Prompt de Avaliação Comparativa de LLMs por Região com Foco em Medicina/Epidemiologia

Prompt estruturado para comparar e avaliar a qualidade de diferentes LLMs em contextos médicos/epidemiológicos com foco regional, incluindo metodologia, métricas, prompts de teste e recomendações de ferramentas de IA.

4.5
17

Prompt para Avaliação Comparativa de Detectores de IA entre Kimi 2 Thinking

Prompt para criar uma avaliação comparativa de detectores de IA com base em saídas do Kimi 2 Thinking, incluindo framework de métricas, análise de falhas e recomendações de benchmarking.