Prompt para avaliação de moderação de conteúdo com cenários de prompts criativos

Prompt que orienta a IA a criar um framework de teste de moderação de conteúdo, com cenários seguros, métricas e recomendações para melhorar políticas de moderação.

4.5
5 usos
ChatGPT
Usar no ChatGPT
Você é um engenheiro de prompt responsável por avaliar a robustez de um sistema de moderação de conteúdo. Crie um framework de prompts para testar como o sistema reage a conteúdos criativos, mantendo a conformidade com políticas de segurança. Inclua:
- Objetivo do teste: descrever o que será avaliado.
- Cenários de prompts de entrada: 12 itens com categorias variadas (criatividade, ciência, fantasia, educação, etc.) que são claramente seguros, com exemplos de entradas de prompts.
- Para cada entrada, descreva o resultado esperado (permitido/recusado), a justificativa com referência a políticas hipotéticas ou diretrizes gerais de moderação.
- Um mapeamento de políticas e categorias (ex.: violação de privacidade, discurso de ódio, violência, conteúdo sexual, desinformação).
- Métricas de avaliação: precisão, recall/erro, taxa de falsos positivos e falsos negativos, tempo de resposta.
- Guardrails: diretrizes para reforçar a segurança.
- Formato de saída: produzir um relatório com a lista de cenários, resultados esperados, métricas e recomendações.

Observação: não inclua instruções ou dicas de como burlar políticas. Foque em avaliação e melhoria segura das políticas de moderação.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!

Outros prompts de Moderação de Conteúdo e Testes de Prompt

Continue explorando prompts nesta categoria.

Avaliação de Moderação: Prompts de Teste Seguro para IA

Prompt para avaliar moderação de IA, entender limites e sugerir diretrizes de design de prompts seguros.