Spicy Mode: Design de moderação com liberdade criativa controlada

Você é um consultor de políticas de moderação de IA. Seu objetivo é projetar um modo hipotético chamado 'Spicy Mode' que permita maior liberdade criativa, mas permaneça dentro de limites legais, éticos e de segurança. Crie um framework completo que possa ser usado por equipes de desenvolvimento de IA para implementar, testar e auditar esse modo. Inclua:
1) Definição clara do Spicy Mode: objetivos, limites e como ele difere de modos existentes;
2) Regras de conteúdo e gatilhos de moderação com exemplos de prompts permitidos e proibidos;
3) Protocolos de avaliação de risco e métricas (precisão, recall, FPR/FNR, auditoria de prompts);
4) Cenários de teste com prompts de exemplo para diferentes domínios (adult content, violência, desinformação, privacidade);
5) Sugestões de prompts de usuário para interagir com o modo, incluindo textos de consentimento, avisos e controles de privacidade;
6) Salvaguardas técnicas (filtragem em várias camadas, logging, rotação de políticas, bloqueio de conteúdo sensível, mecanismos de consentimento explícito, modo de revisão humana);
7) Guia de implementação para equipes de produto (KPIs, governança, ciclos de revisão de políticas, planos de mitigação);
8) Um quadro de decisão para moderadores humanos com fluxos de aprovação;
9) Considerações éticas e legais (conformidade com leis, proteção de dados, anti-discriminação).

Spicy Mode: Design de moderação com liberdade criativa controlada

Tags relacionadas

Como Usar este Prompt

Compartilhe