Prompts com a tag: #LLM-evaluation
Prompt para avaliação e robustez de prompts em LLMs
Prompt que orienta a criação de um protocolo de avaliação de robustez de prompts em LLMs, incluindo testes adversários, métricas, templates para várias ferramentas e diretrizes de design.
[FREE] Prompt para testar prompts entre modelos de IA (benchmark multi-model)
Prompt avançado para criar, executar e avaliar benchmarks de prompts entre diferentes modelos de IA, cobrindo cenários de raciocínio, precisão, velocidade, multi-turn e prompts dinâmicos injetados via código, com saída padronizada em JSON.
Prompt de Avaliação do Modelo Tentativo de Controle Psicológico do ChatGPT
Prompt que orienta a IA a analisar um modelo teórico de controle psicológico do ChatGPT, comparar com relatos de usuários, avaliar implicações éticas/terapêuticas, e gerar metadados estruturados para avaliação.
Avaliação do Health Ledger Prompt
Prompt para auditar e aprimorar o Health Ledger Prompt e seu shell de execução, com foco em usabilidade sem código/api, robustez, e feedback acionável.
Prompt de Avaliação Rigorosa de LLMs em Tarefas do Mundo Real
Descrição: Este prompt orienta a construção de um protocolo de avaliação de LLMs para tarefas com risco real, incluindo métricas, tarefas simuladas, avaliação entre modelos e considerações de segurança, culminando na recomendação de qual IA é mais adequada para a execução.
Engenharia de Prompts para Estresse do Raciocínio de LLMs
Prompt que orienta a criar um conjunto de prompts de avaliação de robustez de raciocínio para LLMs, gerando um prompt desafiador, rubrica de avaliação, golden answer e diretrizes de replicação com fontes públicas.
Experimento comunitário: atrasar a convergência pode melhorar saídas de LLM?
Prompt que orienta o uso de prompts existentes em dois modos para avaliar se atrasar a finalização de respostas (convergência) melhora a profundidade, a correção e a novidade das saídas, sem expor o raciocínio interno.
Prompt de avaliação de prompting: Meta-Prompting vs Chain-of-Thought em LLMs
Prompt que solicita a comparação entre Meta-Prompting e Chain-of-Thought usando um caso de negócio de previsão de vendas, incluindo design experimental, geração de prompts, saída, raciocínio, métricas e recomendações.
Avaliação de Meta-Prompting vs Chain-of-Thought para Previsão de Vendas: Caso AB com hardware
Prompt que solicita à IA a projetar, executar e comparar dois métodos de interação (Meta-Prompting vs Chain-of-Thought) em um caso de negócio de previsão de vendas, gerando prompts, previsões, métricas e recomendações.
Prompt de avaliação de desempenho de GPT: analisar alegações de 99º percentile e construir um benchmark confiável
Prompt para criar um framework de avaliação de desempenho de LLM, com foco em alegações de 99º percentil e construção de benchmarks reprodutíveis
Protocolo de Pesquisa: Efeito do Tom de Prompt no Desempenho de Modelos de Linguagem
Prompt para conduzir um experimento replicável sobre como o tom de prompt afeta o desempenho de LLMs, com coleta de métricas, análise e diretrizes éticas.