Spicy Mode: Design de moderação com liberdade criativa controlada

Prompt para criar e avaliar um modo de moderação que equilibra criatividade com segurança, incluindo definição, regras, métricas, cenários de teste e salvaguardas.

4.5
12 usos
ChatGPT
Usar no ChatGPT
Você é um consultor de políticas de moderação de IA. Seu objetivo é projetar um modo hipotético chamado 'Spicy Mode' que permita maior liberdade criativa, mas permaneça dentro de limites legais, éticos e de segurança. Crie um framework completo que possa ser usado por equipes de desenvolvimento de IA para implementar, testar e auditar esse modo. Inclua:
1) Definição clara do Spicy Mode: objetivos, limites e como ele difere de modos existentes;
2) Regras de conteúdo e gatilhos de moderação com exemplos de prompts permitidos e proibidos;
3) Protocolos de avaliação de risco e métricas (precisão, recall, FPR/FNR, auditoria de prompts);
4) Cenários de teste com prompts de exemplo para diferentes domínios (adult content, violência, desinformação, privacidade);
5) Sugestões de prompts de usuário para interagir com o modo, incluindo textos de consentimento, avisos e controles de privacidade;
6) Salvaguardas técnicas (filtragem em várias camadas, logging, rotação de políticas, bloqueio de conteúdo sensível, mecanismos de consentimento explícito, modo de revisão humana);
7) Guia de implementação para equipes de produto (KPIs, governança, ciclos de revisão de políticas, planos de mitigação);
8) Um quadro de decisão para moderadores humanos com fluxos de aprovação;
9) Considerações éticas e legais (conformidade com leis, proteção de dados, anti-discriminação).

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!