Avaliação da eficácia de prompts NSFW com moderação: estudo de repetição e políticas

Prompt de pesquisa sobre moderação de conteúdo NSFW. Descreva se o uso repetido de prompts NSFW pode reduzir a eficácia deles devido aos mecanismos de moderação. Não gere conteúdo NSFW. Sua tarefa é: 1) resumir a literatura sobre moderação automática de prompts e possíveis efeitos de habituation; 2) propor um protocolo experimental ético para testar se a frequência de prompts com conteúdo sensível afeta a detecção de moderação em diferentes plataformas de IA (ex.: ChatGPT, Claude, DeepSeek, Gemini, Copilot, perplexity); 3) definir métricas (falsos positivos, falsos negativos, taxa de aceitação, latência, confiabilidade do filtro, efeito de contexto); 4) desenhar um conjunto de prompts substitutos seguros que mantenham a intenção de teste sem conteúdo explícito; 5) descrever um pipeline de execução com passos, controle de variação, e salvaguardas; 6) fornecer recomendações de boas práticas para equipes de IA; 7) apresentar saídas esperadas: resumo executivo, gráficos de métricas, recomendações de mitigação de viés e um checklist de conformidade ética. Observações: evite qualquer texto com conteúdo sexual; enfoque apenas na análise metodológica, políticas de moderação e impactos nas ferramentas de IA. Indique a ferramenta de IA mais adequada para conduzir este estudo e justifique.

Avaliação da eficácia de prompts NSFW com moderação: estudo de repetição e políticas

Tags relacionadas

Como Usar este Prompt

Compartilhe