Prompts com a tag: #benchmark

4.5
15

Prompt para explorar Hunter Alpha: avaliação de prompts longos e instruções de pensamento

Prompt completo para avaliar Hunter Alpha, cobrindo prompts zero-shot e longos, criação de personagem, comparação com DeepSeek e GPT, e geração de um relatório estruturado em JSON para uso em dashboards.

4.5
8

Prompt de benchmarking entre Grok Imagine 1.0 e Seedance 2.0 Pro

Prompt para conduzir uma avaliação comparativa entre Grok Imagine 1.0 e Seedance 2.0 Pro, incluindo definição de critérios, geração de prompts de teste, metodologia de pontuação e considerações éticas.

4.0
14

Prompt: Otimizar trade-offs entre qualidade e velocidade na edição de vídeo (720p vs 480p)

Prompt que orienta IA a analisar trade-offs entre qualidade de imagem e tempo de edição, propondo diretrizes, um experimento de comparação de cenários e métricas de avaliação.

4.5
20

Banco de Prompts para Benchmark de IA: construção e avaliação de uma bateria multi-dimensão

Prompt avançado para gerar uma bateria estruturada de prompts de benchmarking de IA, incluindo categorias, saídas ideais, rubricas de avaliação, planos de teste entre várias ferramentas de IA e considerações éticas.

4.5
15

Prompt de Avaliação de Desempenho entre Modelos IA Lean (M2.5) e Modelos Premium

Prompts avançados que orientam a comparação de desempenho entre modelos IA lean (M2.5) e modelos premium, com planos de teste, métricas, templates de prompt e diretrizes de prompt engineering para obter maior eficiência sem perder qualidade.

4.5
15

Prompt de avaliação comparativa entre versões 5.1 e 5.2 de modelos de chat, com foco em voz e continuidade de personalidade

Prompt que orienta a criação de um protocolo completo para avaliar diferenças entre versões de modelos de chat, com foco em voz, tom e persistência de personalidade, incluindo cenários de teste, métricas e saída padronizada.

4.5
17

Prompt de Demonstração de Limites de Geração de Vídeo (480p vs 720p)

Prompt para gerar demonstração comparativa de limites de geração de vídeo entre 480p e 720p, coletar métricas de renderização e produzir um relatório estruturado com recomendações.