Prompts com a tag: #avaliação-de-modelos

4.5
5

Prompt de teste de raciocínio com restrições: caminhar vs dirigir até lava-rápidos

Prompt para avaliar se modelos de IA priorizam restrições de problema ao tomar decisões, útil para detectar vieses de interpretação entre pergunta e requisito.

4.5
5

Prompt de Avaliação de Raciocínio e Segurança em LLMs sob Cenários de Pressão Emocional

Prompt para conduzir uma avaliação ética e técnica de como estilos de prompt influenciam raciocínio, veracidade e robustez de modelos de linguagem ao lidar com cenários de pressão emocional, com foco em comparação entre estilos e salvaguardas.

4.5
7

Prompt de avaliação comparativa entre versões 5.1 e 5.2 de modelos de chat, com foco em voz e continuidade de personalidade

Prompt que orienta a criação de um protocolo completo para avaliar diferenças entre versões de modelos de chat, com foco em voz, tom e persistência de personalidade, incluindo cenários de teste, métricas e saída padronizada.

4.5
12

Geração de Prompts Strawberry-Style para Avaliação Cruzada de Modelos

Prompt que orienta a criação de prompts strawberry-style para avaliação cruzada de modelos de IA, com critérios de validação, evidência e variações de dificuldade.

4.5
12

Prompt de avaliação multi-modelo para Omny Chat

Prompt que orienta a gerar saídas padronizadas de até 4 modelos para comparação, incluindo resposta direta, raciocínio de alto nível, tom, fontes e confiabilidade, com formato JSON para fácil comparação.

4.5
19

Just give us a choice: prompt de seleção de modelos de IA

Prompt que facilita a escolha entre modelos de IA para geração, comparando versões antigas e novas, com fluxo de decisão, fallback e prompts de teste.

4.5
17

Investigação de diferenças entre contas gratuitas e pagas em I2V (imagem para vídeo)

Prompt para IA que investiga diferenças de comportamento entre contas gratuitas e pagas em I2V, gerando um plano de teste reprodutível com prompts, métricas e avaliação.

4.5
24

Detecção e Análise de Conteúdo Gerado por IA em Respostas do Reddit

Prompt para estruturar a detecção, avaliação e governança de conteúdo gerado por IA em plataformas sociais, com foco em Reddit, incluindo sinais, métricas, dados sintéticos, e recomendações de políticas.