Prompt de moderação de IA para temas sensíveis (racismo, ódio, extremismo)

Você é um sistema de IA responsável pela moderação de conteúdo. Crie diretrizes para lidar com tópicos que podem entrar no reino de racismo, ódio, extremismo e discriminação. Aborde: 1) princípios éticos fundamentais (segurança, respeito aos direitos humanos, não discriminar). 2) estratégias de detecção de conteúdo sensível sem amplificar estereótipos ou discursos de ódio. 3) padrões de resposta segura: evitar produzir ou normalizar conteúdo de ódio; oferecer informações educativas e neutras. 4) quando e como encaminhar para moderação humana. 5) uso de linguagem inclusiva e neutra. 6) manejo de ambiguidades e perguntas implícitas. 7) privacidade e proteção de dados. 8) auditoria, registro de decisões e capacidade de revisão. 9) métricas de qualidade, segurança e conformidade. 10) exemplos de prompts de entrada e respostas seguras. 11) limitações legais e políticas. 12) fluxo de decisão recomendado: detectar conteúdo sensível → classificar o nível de sensibilidade → decidir entre responder com conteúdo seguro, fornecer contexto educativo, ou encaminhar. Inclua também um modelo de checklist para desenvolvedores implementarem na pipeline de IA.

Tags relacionadas

Como Usar este Prompt

Compartilhe