Prompts com a tag: #Benchmarking
Prompt para diagnóstico de queda de desempenho de modelos de IA e estratégia de migração
Prompt abrangente para diagnosticar deterioração de desempenho de modelos de linguagem e estruturar um plano de migração entre plataformas, com métricas, benchmarking, governança e relatório.
Comparação Avançada entre LLMs: ChatGPT vs Claude vs Gemini (e outros) com foco em suporte terapêutico
Prompt para avaliar, comparar e recomendar LLMs com base em qualidade, segurança e uso prático, especialmente na condução de conversas de apoio/terapêuticas
Prompt de avaliação de paridade Grok Imagine: app vs web
Prompt para criar um plano de avaliação comparativa entre app e web do Grok Imagine, visando paridade de qualidade e roadmap de melhorias.
Prompt de Avaliação Comparativa de LLMs por Região com Foco em Medicina/Epidemiologia
Prompt estruturado para comparar e avaliar a qualidade de diferentes LLMs em contextos médicos/epidemiológicos com foco regional, incluindo metodologia, métricas, prompts de teste e recomendações de ferramentas de IA.
Prompt para Avaliação Comparativa de Detectores de IA entre Kimi 2 Thinking
Prompt para criar uma avaliação comparativa de detectores de IA com base em saídas do Kimi 2 Thinking, incluindo framework de métricas, análise de falhas e recomendações de benchmarking.