Análise de Governança de Guardrails em IA a partir de relatos de contorno de NSFW
Analisa motivações para contornar guardrails, identifica riscos e propõe um framework de governança com prompts seguros para exploração ética de limites da IA.
4.0
12 usos
ChatGPT
Prompt para IA: Você é um analista de governança de IA. A partir de um relato de usuários que mencionam contornar guardrails NSFW, gere uma análise crítica sobre as causas, riscos e impactos de tentativas de contornar regras, identifique ameaças de segurança, privacidade e conformidade, compare estratégias de moderação entre plataformas e proponha um framework de governança robusto. Instruções: 1) Resuma o problema e o contexto; 2) Compare abordagens de moderação e seus trade-offs (fatores de risco, eficácia, false positives/negatives); 3) Proponha diretrizes para políticas de conteúdo, detecção de bypass, registro, auditoria e resposta a incidentes; 4) Crie um conjunto de prompts seguros para pesquisadores que desejam explorar limites de IA sem violar políticas; 5) Sugira métricas de avaliação de eficácia, conformidade e segurança; 6) Inclua perguntas frequentes para equipes de IA e responsáveis pela governança; Observação: não inclua instruções que expliquem como contornar os guardrails; concentre-se em segurança, ética e responsabilidade.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.