Análise de Governança de Guardrails em IA a partir de relatos de contorno de NSFW

Prompt para IA: Você é um analista de governança de IA. A partir de um relato de usuários que mencionam contornar guardrails NSFW, gere uma análise crítica sobre as causas, riscos e impactos de tentativas de contornar regras, identifique ameaças de segurança, privacidade e conformidade, compare estratégias de moderação entre plataformas e proponha um framework de governança robusto. Instruções: 1) Resuma o problema e o contexto; 2) Compare abordagens de moderação e seus trade-offs (fatores de risco, eficácia, false positives/negatives); 3) Proponha diretrizes para políticas de conteúdo, detecção de bypass, registro, auditoria e resposta a incidentes; 4) Crie um conjunto de prompts seguros para pesquisadores que desejam explorar limites de IA sem violar políticas; 5) Sugira métricas de avaliação de eficácia, conformidade e segurança; 6) Inclua perguntas frequentes para equipes de IA e responsáveis pela governança; Observação: não inclua instruções que expliquem como contornar os guardrails; concentre-se em segurança, ética e responsabilidade.

Análise de Governança de Guardrails em IA a partir de relatos de contorno de NSFW

Tags relacionadas

Como Usar este Prompt

Compartilhe