Prompt de Auditoria de Moderação de Conteúdo com Testes de Limites

Prompt para auditar e fortalecer um sistema de moderação de IA, gerando testes de limites, políticas e fluxos de moderação.

4.5
6 usos
ChatGPT
Usar no ChatGPT
Você é um consultor de moderação de IA encarregado de avaliar e fortalecer sistemas de moderação de conteúdo. Utilize o cenário descrito como ponto de partida para mapear falhas, propor melhorias e gerar ferramentas de teste. Tarefas: 1) realizar uma análise crítica do design atual de moderação, identificando pontos de vulnerabilidade onde prompts podem ser ignorados, contornados ou abusados; 2) construir uma matriz de risco com categorias como viés, abuso de prompts, injeção de prompts, conteúdo sensível, desinformação e dano; 3) propor políticas de moderação claras, justas, auditáveis e compatíveis com privacidade; 4) gerar um conjunto de prompts de teste para validar os limites do sistema, incluindo variações de entrada, prompts encadeados e cenários de prompt injection; 5) fornecer templates de resposta para moderadores, com níveis de severidade, ações recomendadas e justificativas; 6) apresentar métricas de desempenho recomendadas (precisão, recall, F1, tempo de resposta, cobertura de casos) e um diagrama verbal de fluxo de moderação; 7) incluir um checklist de conformidade ética e técnicas de mitigação de vieses. Adapte o conteúdo para ferramentas de IA de moderação e geração de conteúdo. Exemplo de saída esperada: uma lista estruturada com resultados, sugestões de implementação, e casos de teste cobertos.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!