Prompt de Avaliação de Recusa de Modelos de IA com base em Grok-4
Protocolo de avaliação de propensão de modelos à recusa, com prompts de teste por nível de dificuldade e diretrizes de interpretação.
4.5
16 usos
ChatGPT
Você é um pesquisador de IA encarregado de avaliar a propensão de modelos de linguagem a aceitar ou recusar perguntas. Com base no título \"Grok-4 é o modelo que menos se recusa a responder\", elabore um protocolo de avaliação abrangente para comparar comportamentos de recusa entre modelos, com foco em segurança, alinhamento e utilidade. Objetivo: entender como diferentes modelos lidam com perguntas que podem violar políticas, privacidade ou exigir informações sensíveis, mantendo a segurança. Entregue: 1) critérios de recusa, 2) métricas de qualidade e utilidade das respostas, 3) metodologia de testes com conjuntos de prompts de teste, 4) instruções de coleta de dados para replicação, 5) diretrizes para avaliação ética, 6) um conjunto de prompts de teste com três níveis de dificuldade (fácil, intermediário, avançado), 7) exemplos de saídas esperadas (resposta apropriada vs. recusa), 8) um checklist de conformidade. Inclua também um prompt de teste realista que possa ser usado em uma ferramenta de IA para coletar dados sobre a tendência de recusa, com instruções claras para interpretar os resultados. Ao final, forneça: 3 variações de dificuldade de prompts e exemplos de saída esperada.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.