Prompts com a tag: #LLM evaluation

4.5
7

Prompt para avaliação de LLMs como juízes com harness de falhas

Prompt para construir e analisar um estudo de avaliação de LLMs atuando como juízes, com seeds de falhas, 4 condições experimentais e comparação entre família de modelos versus contexto de sessão.

4.5
13

Auditoria de Limites e Alucinações em LLMs Premium (ChatGPT/Gemini)

Prompt avançado para auditar e validar limites declarados de plataformas LLM premium (ChatGPT e Gemini), identificando potenciais alucinações e fornecendo evidências verificáveis.

4.5
40

Prompt Versioning: Guia de Teste e Versionamento de Prompts

Prompt que gera uma estrutura JSON com detalhes de um prompt de versionamento e teste de prompts, incluindo a recomendação de ferramenta de IA, dificuldade, rating, e tags.