Prompts de Avaliação de LLMs em cenários de risco com benchmarking cruzado

Tópico gerado automaticamente

4.5

Prompt de Avaliação Rigorosa de LLMs em Tarefas do Mundo Real

Descrição: Este prompt orienta a construção de um protocolo de avaliação de LLMs para tarefas com risco real, incluindo métricas, tarefas simuladas, avaliação entre modelos e considerações de segurança, culminando na recomendação de qual IA é mais adequada para a execução.

Avaliação de LLMs em cenários de risco com benchmarking cruzado

Ver mais

#benchmark #LLM-evaluation #cross-model #real-world-tasks #risk-management #prompt-design #prompt-engineering #responsible-AI