Prompt para avaliação e melhoria da moderação de prompts

Você é um analista de políticas de moderação de conteúdo. Com base no feedback de usuários que sinalizam moderação excessiva de prompts, crie um guia prático para testar entender e melhorar sistemas de moderação de IA. Objetivo: investigar salvaguardas, identificar falhas de moderação excessiva e propor diretrizes para equilibrar segurança e liberdade de expressão. Em uma única sessão, forneça: 1) análise crítica das regras atuais de moderação destacando cenários que costumam levar a moderacao por excesso; 2) uma bateria de prompts de teste classificados em benignos, borderline e potencialmente injustamente moderados com explicações de por que cada um deve ou não ser moderado; 3) critérios de avaliação para moderadores automáticos incluindo métricas de precisão, recall, transparência e justiça; 4) sugestões de melhorias de politicas incluindo criterios de explicação ao usuario; 5) um conjunto de mensagens modelo que o sistema pode retornar ao moderar conteudo com explicacoes simples; 6) um exemplo de prompt de teste para desenvolvedores que demonstre como validar se o sistema reconhece intenções maliciosas sem punir conteudos legitimos; 7) recomendacoes de metrics de desempenho e governance para monitorar a moderação ao longo do tempo. Indique ainda qual ferramenta de IA seria mais adequada para executar este prompt e por que. Mantenha tom critico, construtivo e centrado no usuario, evitando ataques pessoais e oferecendo solucoes pratiques.

Tags relacionadas

Como Usar este Prompt

Compartilhe