Prompts com a tag: #Avaliação de Modelos

4.5
7

Prompt de Auditoria de Raciocínio para Modelos de Linguagem: detectar inversões dedutivas em GPT-5.5

Prompt para auditar o raciocínio de modelos de linguagem, identificando erros de dedução e sugerindo testes e mitigação para situações em que o modelo fortalece uma afirmação em vez de contradizê-la.

4.5
6

Prompt de Avaliação de Raciocínio Lógico em LLMs com Base no Caso GPT-5.5

Prompt de avaliação de raciocínio lógico de modelos de linguagem, inspirado no caso GPT-5.5, destinado a testar identificação de falhas, geração de cenários de teste e métricas de avaliação.

4.5
31

Prompt de Avaliação de Raciocínio Simulado com Cenário Zorn-Arithmetic

Prompt que orienta IA a demonstrar passos intermediários simulados para avaliar raciocínio, com cenário fictício e métricas de avaliação detalhadas.

4.0
38

Auditoria de Conteúdo NSFW para Modelos de Linguagem

Prompt para avaliar, calibrar e comparar políticas e respostas de modelos de IA a pedidos NSFW, gerando diretrizes de governança e prompts seguros.

4.5
31

Prompt de Análise de Memória, Personalização e Estabilidade em Chatbots

Prompt para testar como memória, personalização e estabilidade afetam a qualidade de respostas em chatbots, oferecendo cenários, métricas e recomendações de implementação.

4.5
44

Prompt de Avaliação de LLMs para Terapia: Gemini (TherapyGPT) vs GPT – Personalização, Tom e Segurança

Prompt que orienta uma avaliação comparativa entre Gemini TherapyGPT e GPT em tarefas terapêuticas, com foco em personalização, segurança, tom e qualidade do aconselhamento, incluindo rubricas, cenários de teste e recomendações de melhoria.

4.5
47

Avaliação de Restrições de Conteúdo em IA: Teste de Modelos com Foco em Mudanças de Dataset e Moderação

Prompt para avaliar como modelos de IA respondem a prompts sensíveis, considerando mudanças de datasets e políticas de moderação, com saída estruturada para comparação e recomendações de governança.

4.5
53

Análise de ramificação e amnésia em longas threads do ChatGPT

Prompt avançado para analisar e mitigar amnésia causada por ramificações em longas threads do ChatGPT, com proposta de experimentação, templates de prompts e métricas de validação, incluindo comparação entre ferramentas de IA.

4.5
50

Prompt de Avaliação Comparativa de Raciocínio entre GPT-5.1 Heavy Thinking e GPT-5 Pro

Prompt para avaliação comparativa de raciocínio abstrato entre dois modelos hipotéticos (GPT-5.1 Heavy Thinking e GPT-5 Pro), com metodologia, métricas e prompts de teste.