Prompts com a tag: #LLM-evaluation

4.5
9

Prompt para avaliação e robustez de prompts em LLMs

Prompt que orienta a criação de um protocolo de avaliação de robustez de prompts em LLMs, incluindo testes adversários, métricas, templates para várias ferramentas e diretrizes de design.

4.5
21

[FREE] Prompt para testar prompts entre modelos de IA (benchmark multi-model)

Prompt avançado para criar, executar e avaliar benchmarks de prompts entre diferentes modelos de IA, cobrindo cenários de raciocínio, precisão, velocidade, multi-turn e prompts dinâmicos injetados via código, com saída padronizada em JSON.

4.5
19

Prompt de Avaliação do Modelo Tentativo de Controle Psicológico do ChatGPT

Prompt que orienta a IA a analisar um modelo teórico de controle psicológico do ChatGPT, comparar com relatos de usuários, avaliar implicações éticas/terapêuticas, e gerar metadados estruturados para avaliação.

4.5
31

Avaliação do Health Ledger Prompt

Prompt para auditar e aprimorar o Health Ledger Prompt e seu shell de execução, com foco em usabilidade sem código/api, robustez, e feedback acionável.

4.5
35

Prompt de Avaliação Rigorosa de LLMs em Tarefas do Mundo Real

Descrição: Este prompt orienta a construção de um protocolo de avaliação de LLMs para tarefas com risco real, incluindo métricas, tarefas simuladas, avaliação entre modelos e considerações de segurança, culminando na recomendação de qual IA é mais adequada para a execução.

4.5
34

Engenharia de Prompts para Estresse do Raciocínio de LLMs

Prompt que orienta a criar um conjunto de prompts de avaliação de robustez de raciocínio para LLMs, gerando um prompt desafiador, rubrica de avaliação, golden answer e diretrizes de replicação com fontes públicas.

4.5
31

Experimento comunitário: atrasar a convergência pode melhorar saídas de LLM?

Prompt que orienta o uso de prompts existentes em dois modos para avaliar se atrasar a finalização de respostas (convergência) melhora a profundidade, a correção e a novidade das saídas, sem expor o raciocínio interno.

4.5
41

Prompt de avaliação de prompting: Meta-Prompting vs Chain-of-Thought em LLMs

Prompt que solicita a comparação entre Meta-Prompting e Chain-of-Thought usando um caso de negócio de previsão de vendas, incluindo design experimental, geração de prompts, saída, raciocínio, métricas e recomendações.

4.5
41

Avaliação de Meta-Prompting vs Chain-of-Thought para Previsão de Vendas: Caso AB com hardware

Prompt que solicita à IA a projetar, executar e comparar dois métodos de interação (Meta-Prompting vs Chain-of-Thought) em um caso de negócio de previsão de vendas, gerando prompts, previsões, métricas e recomendações.

4.5
45

Protocolo de Pesquisa: Efeito do Tom de Prompt no Desempenho de Modelos de Linguagem

Prompt para conduzir um experimento replicável sobre como o tom de prompt afeta o desempenho de LLMs, com coleta de métricas, análise e diretrizes éticas.