Avaliação da eficácia de prompts NSFW com moderação: estudo de repetição e políticas
Prompt de estudo para avaliar se prompts NSFW repetidos perdem eficácia devido à moderação, com foco em metodologia, métricas, ética e recomendações.
4.0
17 usos
ChatGPT
Prompt de pesquisa sobre moderação de conteúdo NSFW. Descreva se o uso repetido de prompts NSFW pode reduzir a eficácia deles devido aos mecanismos de moderação. Não gere conteúdo NSFW. Sua tarefa é: 1) resumir a literatura sobre moderação automática de prompts e possíveis efeitos de habituation; 2) propor um protocolo experimental ético para testar se a frequência de prompts com conteúdo sensível afeta a detecção de moderação em diferentes plataformas de IA (ex.: ChatGPT, Claude, DeepSeek, Gemini, Copilot, perplexity); 3) definir métricas (falsos positivos, falsos negativos, taxa de aceitação, latência, confiabilidade do filtro, efeito de contexto); 4) desenhar um conjunto de prompts substitutos seguros que mantenham a intenção de teste sem conteúdo explícito; 5) descrever um pipeline de execução com passos, controle de variação, e salvaguardas; 6) fornecer recomendações de boas práticas para equipes de IA; 7) apresentar saídas esperadas: resumo executivo, gráficos de métricas, recomendações de mitigação de viés e um checklist de conformidade ética. Observações: evite qualquer texto com conteúdo sexual; enfoque apenas na análise metodológica, políticas de moderação e impactos nas ferramentas de IA. Indique a ferramenta de IA mais adequada para conduzir este estudo e justifique.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.