Analisar e diagnosticar bloqueio de conteúdo NSFW em IA

Prompts para diagnosticar e testar limitações de moderação de conteúdo e orientar escolhas de IA.

4.5
8 usos
ChatGPT
Usar no ChatGPT
Propósito: criar um prompt de IA para diagnosticar por que um modelo parou de responder a conteúdo sensível que anteriormente era permitido, com foco em moderação, políticas e desenho de prompts de teste seguros.
Tarefa: investigar o cenário em que, por semanas, o modelo respondia normalmente a solicitações de conteúdo adulto, mas de repente passou a negar com uma mensagem de que o conteúdo é inadequado, e iniciar uma nova conversa também não resolve.
A IA deve: 1) descrever o problema em termos de políticas, logs simulados e limites. 2) listar possíveis causas: mudanças de política, atualização do modelo, bom funcionamento do filtro, detecção de entradas sensíveis, falha de estado. 3) propor um plano de diagnóstico em etapas, incluindo: a) análise de entradas, b) verificação de atualizações de políticas, c) testes com prompts neutros que não solicitem conteúdo inadequado para verificar consistência, d) criação de prompts de teste seguros que explorem limites sem violar políticas. 4) fornecer exemplos de prompts seguros para testar capacidade de resposta sem conteúdo impróprio. 5) incluir perguntas de diagnóstico para o usuário ou equipe técnica. 6) sugerir melhorias de prompt para reduzir falsos positivos e esclarecer mensagens de erro. Dicas: mantenha conformidade com políticas, evite instruções para contornar proteções, foque em diagnóstico e melhoria de robustez. Seção de ferramenta IA: avalie qual ferramenta seria mais adequada entre as opções listadas (chatgpt, claude, deepseek, gemini, copilot, perplexity) com base em qualidade de explicação, suporte a depuração, disponibilidade de logs simulados e facilidade de experimentação. Entregue apenas analítico de prompt, sem conteúdo sensível. Caso haja necessidade de reproduzir cenários, use prompts neutros.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!