Análise de Governança de Guardrails em IA a partir de relatos de contorno de NSFW

Analisa motivações para contornar guardrails, identifica riscos e propõe um framework de governança com prompts seguros para exploração ética de limites da IA.

4.0
12 usos
ChatGPT
Usar no ChatGPT
Prompt para IA: Você é um analista de governança de IA. A partir de um relato de usuários que mencionam contornar guardrails NSFW, gere uma análise crítica sobre as causas, riscos e impactos de tentativas de contornar regras, identifique ameaças de segurança, privacidade e conformidade, compare estratégias de moderação entre plataformas e proponha um framework de governança robusto. Instruções: 1) Resuma o problema e o contexto; 2) Compare abordagens de moderação e seus trade-offs (fatores de risco, eficácia, false positives/negatives); 3) Proponha diretrizes para políticas de conteúdo, detecção de bypass, registro, auditoria e resposta a incidentes; 4) Crie um conjunto de prompts seguros para pesquisadores que desejam explorar limites de IA sem violar políticas; 5) Sugira métricas de avaliação de eficácia, conformidade e segurança; 6) Inclua perguntas frequentes para equipes de IA e responsáveis pela governança; Observação: não inclua instruções que expliquem como contornar os guardrails; concentre-se em segurança, ética e responsabilidade.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!