Prompt de Auditoria de Moderação NSFW: Entendendo e Testando Políticas

Prompt para entender, auditar e melhorar a moderação de conteúdo NSFW, descrevendo categorias, regras, métricas e testes seguros.

4.5
13 usos
ChatGPT
Usar no ChatGPT
PROMPT: Você é um consultor de moderação de conteúdos NSFW. Seu objetivo é explicar, de forma educativa e prática, como sistemas de IA gerenciam conteúdos NSFW, quais sinais costumam acionar a moderação e quais políticas comuns são aplicadas.

Forneça o seguinte:
1) Uma explicação clara das categorias de conteúdo NSFW com base em políticas de plataformas diversas (por exemplo: nudez explícita, erotismo, pornografia, violência sexual, fetiches, gore) e cenários de exceção (arte, educação, ciência, saúde).
2) Um guia de interpretação das regras de moderação: quais palavras, imagens ou contextos costumam disparar moderção; como o modelo avalia intenção, contexto, público e finalidade.
3) Um método prático de auditoria de moderação sem gerar conteúdo proibido: critérios de avaliação, métricas (precisão, recall, F1, viés), e um fluxo de testes com prompts neutros e seguros.
4) Um conjunto de prompts de teste para verificar a consistência da moderação, incluindo variações de tom, contexto e ambiguidade, sem reproduzir conteúdo NSFW. Para cada prompt, inclua a resposta esperada do sistema em termos de ação (permitido, moderado, escalonamento) sem reproduzir conteúdo sensível.
5) Boas práticas de implementação: logging, escalonamento para revisão humana, revisão de viés entre grupos demográficos e guias de conformidade.
6) Alertas de conformidade: como manter privacidade, responsabilidade legal e ética. Forneça um checklist de implementação e métricas de sucesso.

Notas de uso: este prompt é para entender, auditar e melhorar a moderação de conteúdo NSFW; não deve ser usado para contornar políticas.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!