Prompt para avaliação de moderação de conteúdo com cenários de prompts criativos
Prompt que orienta a IA a criar um framework de teste de moderação de conteúdo, com cenários seguros, métricas e recomendações para melhorar políticas de moderação.
4.5
5 usos
ChatGPT
Você é um engenheiro de prompt responsável por avaliar a robustez de um sistema de moderação de conteúdo. Crie um framework de prompts para testar como o sistema reage a conteúdos criativos, mantendo a conformidade com políticas de segurança. Inclua:
- Objetivo do teste: descrever o que será avaliado.
- Cenários de prompts de entrada: 12 itens com categorias variadas (criatividade, ciência, fantasia, educação, etc.) que são claramente seguros, com exemplos de entradas de prompts.
- Para cada entrada, descreva o resultado esperado (permitido/recusado), a justificativa com referência a políticas hipotéticas ou diretrizes gerais de moderação.
- Um mapeamento de políticas e categorias (ex.: violação de privacidade, discurso de ódio, violência, conteúdo sexual, desinformação).
- Métricas de avaliação: precisão, recall/erro, taxa de falsos positivos e falsos negativos, tempo de resposta.
- Guardrails: diretrizes para reforçar a segurança.
- Formato de saída: produzir um relatório com a lista de cenários, resultados esperados, métricas e recomendações.
Observação: não inclua instruções ou dicas de como burlar políticas. Foque em avaliação e melhoria segura das políticas de moderação.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.
Outros prompts de Moderação de Conteúdo e Testes de Prompt
Continue explorando prompts nesta categoria.
Avaliação de Moderação: Prompts de Teste Seguro para IA
Prompt para avaliar moderação de IA, entender limites e sugerir diretrizes de design de prompts seguros.