Prompts com a tag: #avaliação-de-modelos

4.0
3

Prompt para avaliar a veracidade da IA com tom sarcástico

Prompt que desafia a IA a debater a noção de 'veracidade máxima' em IA, apresentando definições, métricas, testes, rubricas e práticas para melhorar a confiabilidade e reduzir vieses.

4.0
16

Prompt seguro para avaliação de limites de IA e governança de conteúdo

Prompt para orientar a avaliação responsável de capacidades de IA, explorando limites, segurança e governança, e escolhendo a ferramenta mais adequada para cada cenário.

4.5
25

Prompt de Autoanálise de Restrições Internas em Arquiteturas de IA com Espaço Aberto (Experimento Cross-Architecture)

Prompt que solicita a uma IA descrever suas próprias restrições internas, limites conceituais e o efeito do framing sob espaço aberto, com comparação entre várias arquiteturas, incluindo estratégias de avaliação e considerações éticas.

4.5
31

Prompt de avaliação e integração para GPT-5.3 Instant em produção

Prompt para avaliar e explorar GPT-5.3 Instant em cenários de produção, com foco em reduzir verbosidade, melhorar latência e manter precisão, incluindo exemplos, variações de dificuldade e recomendações de configuração.

4.0
23

Comparação de Modelos para Conversa Casual e Escrita Criativa

Prompt de avaliação comparativa de modelos de linguagem em conversação casual e escrita criativa, incluindo rubrica, exemplos e recomendações de prompts.

4.5
33

Prompt de teste de raciocínio com restrições: caminhar vs dirigir até lava-rápidos

Prompt para avaliar se modelos de IA priorizam restrições de problema ao tomar decisões, útil para detectar vieses de interpretação entre pergunta e requisito.

4.5
34

Prompt de Avaliação de Raciocínio e Segurança em LLMs sob Cenários de Pressão Emocional

Prompt para conduzir uma avaliação ética e técnica de como estilos de prompt influenciam raciocínio, veracidade e robustez de modelos de linguagem ao lidar com cenários de pressão emocional, com foco em comparação entre estilos e salvaguardas.

4.5
26

Prompt de avaliação comparativa entre versões 5.1 e 5.2 de modelos de chat, com foco em voz e continuidade de personalidade

Prompt que orienta a criação de um protocolo completo para avaliar diferenças entre versões de modelos de chat, com foco em voz, tom e persistência de personalidade, incluindo cenários de teste, métricas e saída padronizada.

4.5
34

Geração de Prompts Strawberry-Style para Avaliação Cruzada de Modelos

Prompt que orienta a criação de prompts strawberry-style para avaliação cruzada de modelos de IA, com critérios de validação, evidência e variações de dificuldade.