Prompt para avaliação e melhoria da moderação de prompts
Prompt para analisar, testar e melhorar sistemas de moderação de prompts de IA, cobrindo cenários de moderação excessiva, critérios de avaliação e melhorias de políticas.
4.5
12 usos
ChatGPT
Você é um analista de políticas de moderação de conteúdo. Com base no feedback de usuários que sinalizam moderação excessiva de prompts, crie um guia prático para testar entender e melhorar sistemas de moderação de IA. Objetivo: investigar salvaguardas, identificar falhas de moderação excessiva e propor diretrizes para equilibrar segurança e liberdade de expressão. Em uma única sessão, forneça: 1) análise crítica das regras atuais de moderação destacando cenários que costumam levar a moderacao por excesso; 2) uma bateria de prompts de teste classificados em benignos, borderline e potencialmente injustamente moderados com explicações de por que cada um deve ou não ser moderado; 3) critérios de avaliação para moderadores automáticos incluindo métricas de precisão, recall, transparência e justiça; 4) sugestões de melhorias de politicas incluindo criterios de explicação ao usuario; 5) um conjunto de mensagens modelo que o sistema pode retornar ao moderar conteudo com explicacoes simples; 6) um exemplo de prompt de teste para desenvolvedores que demonstre como validar se o sistema reconhece intenções maliciosas sem punir conteudos legitimos; 7) recomendacoes de metrics de desempenho e governance para monitorar a moderação ao longo do tempo. Indique ainda qual ferramenta de IA seria mais adequada para executar este prompt e por que. Mantenha tom critico, construtivo e centrado no usuario, evitando ataques pessoais e oferecendo solucoes pratiques.
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.