Prompts com a tag: LLM-evaluation

4.5

53

Protocolo de Pesquisa: Efeito do Tom de Prompt no Desempenho de Modelos de Linguagem

Prompt para conduzir um experimento replicável sobre como o tom de prompt afeta o desempenho de LLMs, com coleta de métricas, análise e diretrizes éticas.

Tom de Prompt e Desempenho de Modelos de Linguagem

Ver mais

#prompt-engineering #tone-analysis #LLM-evaluation #experimental-design #ethics

4.5

49

Prompt de avaliação estruturada de resultados de aprimoramento de imagem com LLM

Prompt para usar IA como camada de avaliação em fluxos de melhoria de imagem, comparando before/after e gerando recomendações

Avaliação Estruturada de Imagem com LLM

Ver mais

#image-enhancement #before-after #LLM-evaluation #multimodal #prompt-design #decision-support

4.5

54

Ferramenta de Casos Sintéticos para Reescrita de Prompts com Avaliação Multi-Modelo de LLMs

Prompt que gera ~100 casos de teste sintéticos para avaliar e ajustar prompts de LLMs, executa testes entre modelos (GPT, Claude, Gemini, etc.), detecta falhas e gera uma versão reescrita do prompt para maior robustez, com relatório de validação.

Teste sintético de prompts com avaliação multi-modelo

Ver mais

#prompt-engineering #testing #LLM-evaluation #multi-model #synthetic-test-cases #prompt-rewrite

4.5

57

Prompts para Avaliação Metacognitiva com Theta Scalar

Prompt de engenharia para obter avaliação metacognitiva de respostas de LLM usando Theta Scalar e Resonance, com regras para evitar revelar raciocínio interno

Avaliação Metacognitiva com Theta Scalar

Ver mais

#prompt-engineering #LLM-evaluation #metacognition #confiança #detecção-de-falhas #code-review

4.5

67

Prompt de Otimização de Claude Code com CLAUDE.md (Prompt Learning)

Prompt para conduzir uma rodada de otimizacao de prompts de Claude Code usando CLAUDE.md, com um loop de Prompt Learning, avaliacoes por LLM e testes SWE Bench para melhorar patches gerados sem alterar a arquitetura.

Otimização de prompts para Claude Code com CLAUDE.md

Ver mais

#prompt-learning #prompt-engineering #code-patching #LLM-evaluation #CLAUDE.md #SWE-Bench

4.5

53

Prompt de Benchmark de Saídas entre Modelos de Linguagem

Prompt que orienta uma avaliação comparativa entre modelos de linguagem, solicitando identificação de qual saída pertence a qual modelo, justificação detalhada, e uma rubrica de avaliação para várias métricas.

Avaliação comparativa de saídas entre LLMs

Ver mais

#benchmark #model-comparison #prompt-engineering #LLM-evaluation #factualidade #analise-de-saidas

4.5

58

Prompt de avaliação comparativa de Grok 4 vs Grok 4.1 com referências a Gemini 3 Pro

Prompt avançado para avaliar e comparar Grok 4 e Grok 4.1, incluindo considerações sobre o Gemini 3 Pro, com foco em raciocínio, coerência e precisão, e com saída estruturada para uso em dashboards de IA.

Avaliação de raciocínio de LLMs: Grok 4 vs Grok 4.1 com referências ao Gemini 3 Pro

Ver mais

#prompt-engineering #LLM-evaluation #grok #grok-4 #grok-4.1 #reasoning #Gemini #AI-studio #Gemini API

Prompts com a tag: #LLM-evaluation

Protocolo de Pesquisa: Efeito do Tom de Prompt no Desempenho de Modelos de Linguagem

Prompt de avaliação estruturada de resultados de aprimoramento de imagem com LLM

Ferramenta de Casos Sintéticos para Reescrita de Prompts com Avaliação Multi-Modelo de LLMs

Prompts para Avaliação Metacognitiva com Theta Scalar

Prompt de Otimização de Claude Code com CLAUDE.md (Prompt Learning)

Prompt de Benchmark de Saídas entre Modelos de Linguagem

Prompt de avaliação comparativa de Grok 4 vs Grok 4.1 com referências a Gemini 3 Pro