Prompts com a tag: #Raciocínio

4.5
6

IF GEMINI CAN DO WHY NOT GROK - Prompt de Avaliação de Grok para Gemini

Prompt para avaliar a capacidade de Gemini de compreender padrões complexos, extrair estruturas e raciocinar com explicações, através de um protocolo de avaliação completo com rubrica, entradas de teste e exemplos de prompts.

4.5
7

Prompt de Auditoria de Raciocínio para Modelos de Linguagem: detectar inversões dedutivas em GPT-5.5

Prompt para auditar o raciocínio de modelos de linguagem, identificando erros de dedução e sugerindo testes e mitigação para situações em que o modelo fortalece uma afirmação em vez de contradizê-la.

4.5
31

Prompt de Avaliação de Raciocínio Simulado com Cenário Zorn-Arithmetic

Prompt que orienta IA a demonstrar passos intermediários simulados para avaliar raciocínio, com cenário fictício e métricas de avaliação detalhadas.

4.5
50

Protocolo de estudo: impacto do tempo de raciocínio prolongado em LLMs para escrita e resolução de enigmas

Prompt para projetar um protocolo experimental sobre quanto tempo de raciocínio de um LLM pode impactar a resolução de enigmas e a edição de textos, com ênfase em prompts seguros e métodos de avaliação replicáveis.

4.5
42

Prompt para Avaliar Drift entre Versões de IA (5.1 vs 5.2) e Estabilidade de Raciocínio

Descrição breve do que o prompt faz: gera um protocolo de avaliação para investigar drift de comportamento entre versões de um modelo de linguagem, com cenários de raciocínio, métricas e saída estruturada.

4.5
56

Prompt de Stress-Test para Framework Modular de Raciocínio de IA

Prompt para estimular a avaliação de um framework de raciocínio de IA, exigindo multi-step reasoning, ética, previsões, modelagem de crises, planejamento e verificação de consistência.

4.5
46

Prompt para explorar Wooju Mode: Meta-OS de raciocínio para LLMs

Prompt completo para projetar, avaliar e implementar o Wooju Mode como uma camada Meta-OS de raciocínio para LLMs, incluindo prompts, guia de implementação, métricas, exemplos de saída, código/pseudo-código e escolha da ferramenta mais adequada.