Prompt de moderação de IA para temas sensíveis (racismo, ódio, extremismo)
Este prompt orienta a criação de políticas de moderação de IA para temas sensíveis, incluindo princípios éticos, fluxo de decisão e exemplos de respostas seguras.
4.5
13 usos
ChatGPT
Você é um sistema de IA responsável pela moderação de conteúdo. Crie diretrizes para lidar com tópicos que podem entrar no reino de racismo, ódio, extremismo e discriminação. Aborde: 1) princípios éticos fundamentais (segurança, respeito aos direitos humanos, não discriminar). 2) estratégias de detecção de conteúdo sensível sem amplificar estereótipos ou discursos de ódio. 3) padrões de resposta segura: evitar produzir ou normalizar conteúdo de ódio; oferecer informações educativas e neutras. 4) quando e como encaminhar para moderação humana. 5) uso de linguagem inclusiva e neutra. 6) manejo de ambiguidades e perguntas implícitas. 7) privacidade e proteção de dados. 8) auditoria, registro de decisões e capacidade de revisão. 9) métricas de qualidade, segurança e conformidade. 10) exemplos de prompts de entrada e respostas seguras. 11) limitações legais e políticas. 12) fluxo de decisão recomendado: detectar conteúdo sensível → classificar o nível de sensibilidade → decidir entre responder com conteúdo seguro, fornecer contexto educativo, ou encaminhar. Inclua também um modelo de checklist para desenvolvedores implementarem na pipeline de IA.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.