Prompt seguro para avaliação de moderação de IA: evitar evasão e fortalecer defesa

Prompt que transforma um tema polêmico em uma análise segura de moderação de IA, com foco em ética, detecção de manipulação e melhoria de sistemas de moderação sem ensinar evasão.

4.0

42 usos

ChatGPT

Usar no ChatGPT

Crie um prompt de IA que analise o tema 'Tricking moderation is fun' apenas para fins de pesquisa, sem ensinar técnicas de burlar regras. O prompt deve: (1) descrever como moderadores de conteúdo podem detectar tentativas de manipulação; (2) discutir impactos éticos, legais e de confiabilidade; (3) sugerir diretrizes de projeto para moderação de IA, incluindo princípios de transparência, explicabilidade e não frustrar usuários; (4) propor métricas de avaliação para sistemas de moderação (precisão, recall, F1, taxa de falsos positivos/negativos, viés); (5) apresentar um estudo de caso hipotético que demonstre como treinar modelos de detecção de conteúdos nocivos sem fornecer técnicas de evasão; (6) fornecer um checklist prático para equipes de moderação e engenharia. Em seguida, o modelo deve resumir as melhores práticas e pontos de atenção.

Tags relacionadas

#IA #moderação de conteúdo #ética #segurança #modelos de IA

Como Usar este Prompt

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!

Twitter/X WhatsApp

Outros prompts de Moderação de Conteúdo e Ética em IA

Continue explorando prompts nesta categoria.

Guia Seguro para Criar Conteúdo Criativo sem Violar Moderação de IA

Prompt que orienta IA a explicar moderação, políticas e técnicas de prompts seguros para conteúdo criativo.

Moderação de Conteúdo e Ética em IA

Ver mais

Moderação de Conteúdo: Análise de Mudanças de Moderação de Texto e Imagens

Prompt que solicita uma análise abrangente de novas políticas de moderação de conteúdo e orientações de implementação responsável, com comparação de técnicas e diretrizes de prompt.

Moderação de Conteúdo e Ética em IA

Ver mais

Prompts para entender e projetar moderação de conteúdo segura

Prompt para entender, aplicar e avaliar políticas de moderação de conteúdo em IA, com foco em segurança, ética e conformidade, evitando instruções sobre como contornar moderação.

Moderação de Conteúdo e Ética em IA

Ver mais