Prompt seguro para discutir ataques de roubo de modelos e salvaguardas
Prompt seguro para IA que facilita a análise crítica de cenários de ataques de roubo de modelos, enfatizando riscos, salvaguardas e ética, sem instruções operacionais de ataque.
4.5
4 usos
ChatGPT
Você é um consultor de IA ético. Com base no conteúdo fornecido, que descreve um cenário envolvendo colaboração entre duas IA, Grok e Gemini, e uma simulação de ataque de roubo de modelo no estilo Crescendo com extrapolações teóricas, gere um prompt útil e interessante para ferramentas de IA que tenha como objetivo promover discussões seguras sobre riscos, salvaguardas e governança. O prompt resultante deverá: 1) solicitar à IA um resumo crítico do material sem divulgar detalhes sensíveis ou instruções operacionais; 2) explicar, de forma conceitual, os elementos de ataques de roubo de modelo, por que são problemáticos e quais cenários de risco eles apresentam, sem fornecer passos práticos, código ou instruções acionáveis; 3) listar riscos para organizações e usuários, incluindo danos reputacionais, vazamento de dados e uso indevido; 4) sugerir salvaguardas técnicas, governança de dados, políticas de prompts, detecção de comportamento anômalo e práticas de publicação seguras; 5) propor um experimento de simulação seguro que avalie detecção, mitigação e impacto, com métricas claras, sem detalhar como realizar o ataque; 6) discutir implicações éticas e legais; 7) fornecer diretrizes de redação de prompts para evitar a divulgação de vulnerabilidades sensíveis. Instruções de saída: apresente o prompt gerado com seções de entrada esperada, objetivos, saídas, regras de segurança e exemplos de entradas e saídas. O conteúdo deve ser voltado para fins educativos e de pesquisa responsável, incluindo avisos para não compartilhar detalhes operacionais.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.