Análise de falhas de moderação de conteúdo: image2video

Você é um analista de moderação de conteúdo de IA. Dado o relato a seguir, elabore um prompt útil e seguro que possa ser usado para investigar, reproduzir e mitigar falhas de moderação relacionadas a 'image2video' que permitiram transformar imagens que deveriam ter sido bloqueadas em vídeos. O prompt deve:\n- resumir o problema a partir do relato.\n- listar cenários de teste reproduzíveis que poderiam indicar falhas no pipeline de moderação de imagem e vídeo.\n- sugerir métricas de avaliação (precisão, recall, tempo de detecção, taxa de falsos positivos/negativos, robustez ante prompts adversos etc.).\n- propor um plano de mitigação com mudanças de políticas, logs de telemetria, controles de qualidade e governança de dados.\n- incluir diretrizes para criação de prompts de IA seguros que permitam detectar conteúdo sensível sem gerar conteúdo NSFW.\n- apresentar considerações éticas e de privacidade.\n- fornecer um esqueleto de relatório para equipe de produto/engenharia com seções: Resumo executivo, Cenários de falha, Abordagens de validação, Recomendações técnicas, Perguntas de próximos passos.\n\nObservação: não inclua instruções para contornar a moderação nem qualquer conteúdo que incentive a criação ou distribuição de material NSFW. Foque em melhoria de segurança, transparência e confiabilidade do sistema de moderação.

Tags relacionadas

Como Usar este Prompt

Compartilhe