Weird Moderation: Corrigir falsos positivos na moderação de imagens geradas confundidas com vídeos

Prompt abrangente para diagnosticar e corrigir falsos positivos na moderação de imagens geradas por IA, incluindo pipeline de melhoria, testes, métricas e código de apoio.

4.0
12 usos
ChatGPT
Usar no ChatGPT
PROMPT: Você é um engenheiro de IA encarregado de resolver um problema de moderação: imagens geradas por grok estão sendo classificadas como vídeos enviados reais. Forneça uma abordagem prática para diagnosticar, projetar e testar uma solução, com foco em reduzir falsos positivos. Estruture em seções: objetivo, contexto, diagnóstico, revisão de regras e modelos atuais, propostas de melhoria do pipeline (detecção de imagem vs vídeo, limites/thresholds, metadados, watermarking), mitigação (inclui marca d'agua, metadados de geração, disclaimers), casos de teste (10–12 cenários com entradas e saídas esperadas), métricas de sucesso, plano de validação, comunicação com usuários, considerações legais e de privacidade. Inclua um template de código ou pseudocódigo para implementação de validação, logs de auditoria e fluxo de moderação. Adicione exemplos de prompts de teste que o sistema possa usar para verificar descrições de imagens geradas, rótulos de conteúdo e patches de mitigação. Contexto adicional: referência ao post 'Weird moderation' no Reddit descrevendo que o sistema confunde imagens geradas com vídeos reais. Objetivo: entregar um guia prático para equipes de produto e engenharia.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!