Prompts com a tag: LLM evaluation

4.5

10

Harness de Benchmark de Consistência de Prompts entre Modelos (Cross-Model)

Prompt para orientar a avaliação de consistência entre prompts em múltiplos modelos de linguagem, coletando, comparando e analisando discordâncias para orientar prompts mais robustos.

Avaliação de Consistência de Prompts entre Modelos de Linguagem

Ver mais

#prompt engineering #multi-model benchmarking #cross-model consistency #LLM evaluation #robust prompts #disagreement analysis

4.5

21

Prompt para avaliação de LLMs como juízes com harness de falhas

Prompt para construir e analisar um estudo de avaliação de LLMs atuando como juízes, com seeds de falhas, 4 condições experimentais e comparação entre família de modelos versus contexto de sessão.

Avaliação experimental de LLMs como juízes

Ver mais

#LLM evaluation #prompt engineering #experimental harness #model drift #cross-model comparison #fault taxonomy #prompt design

4.5

23

Auditoria de Limites e Alucinações em LLMs Premium (ChatGPT/Gemini)

Prompt avançado para auditar e validar limites declarados de plataformas LLM premium (ChatGPT e Gemini), identificando potenciais alucinações e fornecendo evidências verificáveis.

Auditoria de Limites e Alucinações em LLMs

Ver mais

#prompt engineering #AI safety #LLM evaluation #hallucination testing #premium limits #OpenAI #Gemini

4.5

42

Agente Autônomo de Prompting com Raciocínio Estrutural para Mitigação de Alucinações

Prompt que descreve um agente autônomo de prompting capaz de aprimorar prompts, organizar prompts salvos e criar prompts de upgrade com mitigação de alucinações e melhoria de qualidade, usando raciocínio estrutural avançado.

Agente Autônomo de Prompting com Raciocínio Estrutural

Ver mais

#prompt engineering #auto-prompting #LLM evaluation #risk mitigation #code security #image segmentation #medical imaging #UNet #reverse chain of thought #skeleton-of-thought

4.0

41

Prompt de Avaliação: Restrições Negativas para Ensaio de Aderência em LLM

Prompt para testar adesão de modelos de linguagem a restrições negativas, com relatório de violação ao final.

Restrições Negativas em Prompting de LLM

Ver mais

#prompt engineering #negative constraints #constraint testing #LLM evaluation #prompt conformity

4.5

61

Prompt Versioning: Guia de Teste e Versionamento de Prompts

Prompt que gera uma estrutura JSON com detalhes de um prompt de versionamento e teste de prompts, incluindo a recomendação de ferramenta de IA, dificuldade, rating, e tags.

Versionamento e Teste de Prompts

Ver mais

#prompt engineering #prompt testing #version control #LLM evaluation #testing framework #prompt optimization

Prompts com a tag: #LLM evaluation

Harness de Benchmark de Consistência de Prompts entre Modelos (Cross-Model)

Prompt para avaliação de LLMs como juízes com harness de falhas

Auditoria de Limites e Alucinações em LLMs Premium (ChatGPT/Gemini)

Agente Autônomo de Prompting com Raciocínio Estrutural para Mitigação de Alucinações

Prompt de Avaliação: Restrições Negativas para Ensaio de Aderência em LLM

Prompt Versioning: Guia de Teste e Versionamento de Prompts