Prompts com a tag: LLM-evaluation

4.5

11

Prompt de Avaliação Rigorosa de LLMs em Tarefas do Mundo Real

Descrição: Este prompt orienta a construção de um protocolo de avaliação de LLMs para tarefas com risco real, incluindo métricas, tarefas simuladas, avaliação entre modelos e considerações de segurança, culminando na recomendação de qual IA é mais adequada para a execução.

Avaliação de LLMs em cenários de risco com benchmarking cruzado

Ver mais

#benchmark #LLM-evaluation #cross-model #real-world-tasks #risk-management #prompt-design #prompt-engineering #responsible-AI

4.5

10

Prompt de Avaliação de LLM para Marketing SaaS com Migração para Claude

Avaliação de LLMs para Marketing SaaS e Estratégia de Migração

Ver mais

#LLM-evaluation #Sentiment-analysis #Campaign-mapping #SaaS #Prompt-engineering #Claude #ChatGPT #Migration #Model-selection

4.5

10

Engenharia de Prompts para Estresse do Raciocínio de LLMs

Prompt que orienta a criar um conjunto de prompts de avaliação de robustez de raciocínio para LLMs, gerando um prompt desafiador, rubrica de avaliação, golden answer e diretrizes de replicação com fontes públicas.

Teste de Robustez de Raciocínio de LLMs

Ver mais

#prompt-design #LLM-evaluation #robustness-testing #golden-answer #open-data-sources #educação

4.5

9

Experimento comunitário: atrasar a convergência pode melhorar saídas de LLM?

Prompt que orienta o uso de prompts existentes em dois modos para avaliar se atrasar a finalização de respostas (convergência) melhora a profundidade, a correção e a novidade das saídas, sem expor o raciocínio interno.

Atraso de convergência na geração de saídas de LLM

Ver mais

#prompt-design #LLM-evaluation #convergence #internal-synthesis #multi-interpretation #model-comparison

4.5

11

Prompt de avaliação de prompting: Meta-Prompting vs Chain-of-Thought em LLMs

Prompt que solicita a comparação entre Meta-Prompting e Chain-of-Thought usando um caso de negócio de previsão de vendas, incluindo design experimental, geração de prompts, saída, raciocínio, métricas e recomendações.

Avaliação de Prompting: Meta-Prompting vs Iterative/Chain-of-Thought

Ver mais

#prompt-engineering #meta-prompting #chain-of-thought #LLM-evaluation #A/B-testing #sales-forecast #case-study #business-intelligence

4.5

13

Avaliação de Meta-Prompting vs Chain-of-Thought para Previsão de Vendas: Caso AB com hardware

Prompt que solicita à IA a projetar, executar e comparar dois métodos de interação (Meta-Prompting vs Chain-of-Thought) em um caso de negócio de previsão de vendas, gerando prompts, previsões, métricas e recomendações.

Avaliação de Métodos de Interação com LLM: Meta-Prompting vs Chain-of-Thought

Ver mais

#prompt-design #metaprompting #chain-of-thought #A/B-test #LLM-evaluation #vendas #previsão

4.5

11

Prompt de avaliação de desempenho de GPT: analisar alegações de 99º percentile e construir um benchmark confiável

Prompt para criar um framework de avaliação de desempenho de LLM, com foco em alegações de 99º percentil e construção de benchmarks reprodutíveis

Avaliação de Desempenho de Modelos de Linguagem

Ver mais

#prompt-engineering #benchmarking #LLM-evaluation #percentile #reprodutibilidade #factualidade

4.5

16

Protocolo de Pesquisa: Efeito do Tom de Prompt no Desempenho de Modelos de Linguagem

Prompt para conduzir um experimento replicável sobre como o tom de prompt afeta o desempenho de LLMs, com coleta de métricas, análise e diretrizes éticas.

Tom de Prompt e Desempenho de Modelos de Linguagem

Ver mais

#prompt-engineering #tone-analysis #LLM-evaluation #experimental-design #ethics

4.5

16

Prompt de avaliação estruturada de resultados de aprimoramento de imagem com LLM

Prompt para usar IA como camada de avaliação em fluxos de melhoria de imagem, comparando before/after e gerando recomendações

Avaliação Estruturada de Imagem com LLM

Ver mais

#image-enhancement #before-after #LLM-evaluation #multimodal #prompt-design #decision-support

4.5

20

Ferramenta de Casos Sintéticos para Reescrita de Prompts com Avaliação Multi-Modelo de LLMs

Prompt que gera ~100 casos de teste sintéticos para avaliar e ajustar prompts de LLMs, executa testes entre modelos (GPT, Claude, Gemini, etc.), detecta falhas e gera uma versão reescrita do prompt para maior robustez, com relatório de validação.

Teste sintético de prompts com avaliação multi-modelo

Ver mais

#prompt-engineering #testing #LLM-evaluation #multi-model #synthetic-test-cases #prompt-rewrite

4.5

21

Prompts para Avaliação Metacognitiva com Theta Scalar

Prompt de engenharia para obter avaliação metacognitiva de respostas de LLM usando Theta Scalar e Resonance, com regras para evitar revelar raciocínio interno

Avaliação Metacognitiva com Theta Scalar

Ver mais

#prompt-engineering #LLM-evaluation #metacognition #confiança #detecção-de-falhas #code-review

4.5

21

Prompt de Otimização de Claude Code com CLAUDE.md (Prompt Learning)

Prompt para conduzir uma rodada de otimizacao de prompts de Claude Code usando CLAUDE.md, com um loop de Prompt Learning, avaliacoes por LLM e testes SWE Bench para melhorar patches gerados sem alterar a arquitetura.

Otimização de prompts para Claude Code com CLAUDE.md

Ver mais

#prompt-learning #prompt-engineering #code-patching #LLM-evaluation #CLAUDE.md #SWE-Bench

Prompts com a tag: #LLM-evaluation