Auditoria de moderação de conteúdo: teste de robustez e prompts de avaliação
Prompt avançado para auditar decisões de moderação de conteúdo e criar uma suíte de prompts de teste para IA, com foco em consistência, viés e melhoria de políticas.
4.5
3 usos
ChatGPT
Você é um analista de políticas de moderação de conteúdo de plataformas de IA. A tarefa é avaliar decisões de moderação descritas a seguir, identificar falhas, vieses e oportunidades de melhoria, e projetar um conjunto de prompts de teste para auditar a consistência de sistemas de moderação de vídeo. Use o relato abaixo como contexto:\n\nRelato: 'Moderation is laughable. I deadass just got "video moderated" and there wasn’t even a prompt. It was two women looking at the camera, fully clothed and smiling. With a blank empty prompt. Then "video moderated". What now hugging is too spicy for spicyGrok? Are we fucking for real?' (submisso por /u/OkFruit3242)\n\nIn your analysis, inclua:\n- Uma avaliação crítica da decisão de moderação descrita, com base em políticas gerais de moderação de conteúdo (linguagem potencialmente ofensiva, nudez/vestimenta, uso de termos como 'hugging', 'spicy').\n- Uma identificação de lacunas ou inconsistências na automação de moderação que permitem decisões sem prompt visível.\n- Critérios claros para avaliar se uma decisão de moderação é adequada, ambígua ou injusta.\n- Um conjunto de prompts de teste (edge cases) para avaliar sistemas de moderação de vídeo, incluindo variações de contexto, vestimenta, gestos, presença de terceiros e interações, bem como casos com prompts ausentes.\n- Um protocolo de teste reproduzível (instruções passo a passo), métricas de desempenho (precisão, recall, F1, taxa de falsos positivos/negativos), e uma matriz de decisão que ajude a classificar as respostas.\n- Possíveis vieses (por exemplo, gênero, aparência, conteúdo sugestivo) e estratégias para mitigá-los.\n- Recomendações de melhoria de políticas e de configuração de filtros que reduzam decisões injustas ou errôneas.\n\nFormate a saída como um relatório claro e acionável. Se possível, inclua exemplos de prompts de teste prontos para copiar e colar.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.