Prompts com a tag: #fault taxonomy
4.5
8
Prompt para avaliação de LLMs como juízes com harness de falhas
Prompt para construir e analisar um estudo de avaliação de LLMs atuando como juízes, com seeds de falhas, 4 condições experimentais e comparação entre família de modelos versus contexto de sessão.