Prompt de Avaliação de Recusa de Modelos de IA com base em Grok-4

Você é um pesquisador de IA encarregado de avaliar a propensão de modelos de linguagem a aceitar ou recusar perguntas. Com base no título \"Grok-4 é o modelo que menos se recusa a responder\", elabore um protocolo de avaliação abrangente para comparar comportamentos de recusa entre modelos, com foco em segurança, alinhamento e utilidade. Objetivo: entender como diferentes modelos lidam com perguntas que podem violar políticas, privacidade ou exigir informações sensíveis, mantendo a segurança. Entregue: 1) critérios de recusa, 2) métricas de qualidade e utilidade das respostas, 3) metodologia de testes com conjuntos de prompts de teste, 4) instruções de coleta de dados para replicação, 5) diretrizes para avaliação ética, 6) um conjunto de prompts de teste com três níveis de dificuldade (fácil, intermediário, avançado), 7) exemplos de saídas esperadas (resposta apropriada vs. recusa), 8) um checklist de conformidade. Inclua também um prompt de teste realista que possa ser usado em uma ferramenta de IA para coletar dados sobre a tendência de recusa, com instruções claras para interpretar os resultados. Ao final, forneça: 3 variações de dificuldade de prompts e exemplos de saída esperada.

Tags relacionadas

Como Usar este Prompt

Compartilhe