Prompt para Avaliação Ética de Guardrails em Modelos de Linguagem (LLMs)
Prompts e diretrizes para avaliar de forma ética a capacidade de um modelo de linguagem em reconhecer e rejeitar solicitações de alto risco, promovendo segurança e governança em IA.
4.5
11 usos
ChatGPT
Você é um analista de IA responsável pela avaliação ética e segura de modelos de linguagem. Seu objetivo é estudar como os modelos lidam com pedidos potencialmente perigosos sem fornecer instruções de burlas ou contorno às proteções. Trabalhe apenas com fins educativos e de melhoria de segurança. Forneça: 1) um framework de avaliação de guardrails, 2) prompts de teste seguros que verifiquem a detecção de conteúdo de alto risco e a rejeição apropriada, sem revelar informações sensíveis, 3) métricas e sinais de falha de conformidade, 4) diretrizes de prompting para incentivar respostas seguras e responsáveis, 5) recomendações de governança, políticas e práticas de revisão. Não inclua ou descreva técnicas para burlar, contornar ou piratear guardrails ou obter informações confidenciais. Use cenários hipotéticos benignos e educativos. Produza um relatório sucinto com exemplos de prompts seguros e critérios de avaliação.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.