Prompts com a tag: #benchmarking
Prompt para identificar o modelo de IA a partir de uma imagem sem prompt e monitorar o progresso de saída
Prompt que orienta a identificar o modelo de IA utilizado a partir de uma imagem de referência sem prompts e a gerar um relatório de progresso e evidências.
Prompt de avaliação de modelos locais de IA frente a grandes modelos baseados na nuvem
Prompt operacional para planejar, executar e reportar benchmarking entre modelos locais de IA e grandes modelos na nuvem, com código, pipelines e recomendações.
Prompt para Analisar Aceleração de IA com Cerebras e Codex
Prompt para analisar a aceleração de IA via parcerias de hardware, com foco no desempenho de Codex usando Cerebras, cobrindo arquitetura de chips, comparação de soluções, métricas, riscos e implementação.
Arena: Plataforma de Benchmarking de Prompts e Sistemas Cognitivos
Prompt detalhado para gerar especificações de Arena incluindo arquitetura, taxonomia de prompts, prompts de teste, logs, ética e dashboards
Prompt para analisar compilação de estudos de caso de reconhecimento de imagens por IA
Gerar uma análise estruturada de uma compilação de estudos de caso sobre reconhecimento de imagens por IA, extraindo padrões, técnicas de melhoria e prompts para experimentos futuros.
Prompt para Avaliação de Agentes de IA em Produção com Loop de Melhoria
Prompt que orienta a criar um framework de avaliação de agentes de IA pronto para produção, com loop de avaliação, conjunto enxuto de testes, métricas e arquitetura baseada em grafos.
Prompt de avaliação multi-modelo para Omny Chat
Prompt que orienta a gerar saídas padronizadas de até 4 modelos para comparação, incluindo resposta direta, raciocínio de alto nível, tom, fontes e confiabilidade, com formato JSON para fácil comparação.
Framework de Competição: Prompts como Sistemas Vivos
Prompt que orienta a IA a projetar um framework completo para avaliar prompts como sistemas vivos, incluindo objetivos, regras, métricas, casos de teste e entregáveis, com uma rubrica de avaliação detalhada.
Prompt de diagnóstico de latência do Grok Voice no iOS com benchmarking vs ChatGPT e Gemini
Prompt para analisar e diagnosticar latência do Grok Voice no iOS, com comparação a concorrentes, métricas, planos de melhoria e templates de reporte.
Prompt de Design de Benchmark de Criatividade IA com Animações Curtas (5s e 3s)
Prompt para criar e estruturar benchmarks de criatividade IA com animações curtas, gerando uma saída JSON padronizada para avaliação entre modelos.
Prompt para otimizar geração de vídeo de modelo mantendo a carga do servidor sob controle
Prompt robusto para explorar estratégias de otimização de geração de vídeo em ML, com foco em aumentar a duração dos clipes sem aumentar desproporcionalmente a carga do servidor, incluindo plano de experimentação e parâmetros de configuração.
Guia Prático: 5 Hacks Inusitados para Maximizar o ChatGPT
Gera um guia prático de hacks de prompt com exemplos, para maximizar saídas do ChatGPT através de técnicas como Prompt Stacking, Myth Buster, Refinamento Iterativo, prompts baseados em papéis e benchmarking.