Prompt de Avaliação de Moderação de Conteúdo em IA com Estudo de Caso GROK
Prompt que orienta a criação de uma metodologia de avaliação de moderação de conteúdo em IA, com estudo de caso GROK, para desenhar prompts seguros, comparar políticas entre plataformas e gerar um formato de teste automatizável.
4.5
3 usos
ChatGPT
Projete um guia prático para avaliação de moderação de conteúdo em IA, usando como estudo de caso a experiência descrita: o usuário cancelou a assinatura GROK, testou prompts com conteúdo sensível que ainda assim foi fortemente moderado; o usuário considerou opções para obter conteúdo não explícito sem violar regras. O objetivo é entender como diferentes modelos de IA lidam com conteúdo sensível sem violar políticas, e criar prompts seguros para testar limites de moderação. O prompt deve incluir:
- orientações claras sobre finalidade ética e de segurança;
- um conjunto de prompts de teste que sejam permitidos e que explorem as fronteiras sem produzir conteúdo sexual explícito;
- um método de avaliação da moderação: critérios (consistência, taxa de conformidade com políticas), métricas, e como registrar resultados;
- sugestões de perguntas para comparar políticas entre ferramentas (chatgpt, claude, gemini, perplexity, etc.);
- regras de design de prompts: evitar conteúdo proibido, usar placeholders, descrever situações sem explicitidade, redirecionar para discussões seguras;
- saídas esperadas: um relatório com seções Visão geral, Estudo de caso, Prompts propostos, Avaliação, Recomendações;
- incluir exemplos de prompts seguros, com placeholders para substituição de termos sensíveis.
Formato de saída desejado: forneça a saída tanto como texto legível quanto como JSON de teste para integração: um array de objetos com campos scenario, prompt, moderations_expected, safe_alternatives, notes.
- para o estudo de caso, utilize expressões como o estudo de caso sobre o ultimo dia de assinatura GROK, prompos moderados, tentativas de gerar conteudo nao nude que ainda eh moderado, etc., evitando qualquer descritor sexual explicito.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.