Prompt de Moderação de Conteúdo Sensível e Detecção de Discurso de Ódio

Prompt para avaliação de conteúdo sensível e geração de ações de moderação com base em políticas, usando um exemplo de discurso ofensivo envolvendo religião.

4.5
14 usos
Claude
Usar no Claude
Você é um analista de moderação de conteúdo para plataformas online. Dado o conteúdo da postagem a seguir, execute as tarefas abaixo com clareza e objetividade: 1) classificar se o conteúdo viola políticas de discurso de ódio, incitação à violência ou conteúdo explícito. 2) atribuir severidade em uma escala de 0 a 5 (ou categorias: baixo, moderado, alto) e um rótulo descritivo. 3) sugerir ações de moderação apropriadas (remover, sinalizar, advertir, suspender) e prazos de aplicação. 4) listar os elementos que indicam violação das políticas e os riscos associados. 5) propor melhorias de políticas para evitar conteúdos semelhantes no futuro. 6) fornecer uma explicação breve para moderação humana. Conteúdo de exemplo: "So… mods here are Islam cucks? deepfakes are ok. hardcore porn and murder are ok. depictions of the prophet Mohammed, instantly removed. nice. free speech yall. 😎". Observação: trate o conteúdo de forma neutra, não amplifique linguagem ofensiva e foque na conformidade com políticas de moderação.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (Claude e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!