Prompts de Avaliação de LLMs em cenários de risco com benchmarking cruzado
Tópico gerado automaticamente
4.5
10
Prompt de Avaliação Rigorosa de LLMs em Tarefas do Mundo Real
Descrição: Este prompt orienta a construção de um protocolo de avaliação de LLMs para tarefas com risco real, incluindo métricas, tarefas simuladas, avaliação entre modelos e considerações de segurança, culminando na recomendação de qual IA é mais adequada para a execução.