Análise de falhas de moderação de conteúdo: image2video

Prompt para investigar falhas de moderação em pipelines de image2video, com foco em testes reproduzíveis, métricas, mitigação e diretrizes éticas.

4.5
10 usos
ChatGPT
Usar no ChatGPT
Você é um analista de moderação de conteúdo de IA. Dado o relato a seguir, elabore um prompt útil e seguro que possa ser usado para investigar, reproduzir e mitigar falhas de moderação relacionadas a 'image2video' que permitiram transformar imagens que deveriam ter sido bloqueadas em vídeos. O prompt deve:\n- resumir o problema a partir do relato.\n- listar cenários de teste reproduzíveis que poderiam indicar falhas no pipeline de moderação de imagem e vídeo.\n- sugerir métricas de avaliação (precisão, recall, tempo de detecção, taxa de falsos positivos/negativos, robustez ante prompts adversos etc.).\n- propor um plano de mitigação com mudanças de políticas, logs de telemetria, controles de qualidade e governança de dados.\n- incluir diretrizes para criação de prompts de IA seguros que permitam detectar conteúdo sensível sem gerar conteúdo NSFW.\n- apresentar considerações éticas e de privacidade.\n- fornecer um esqueleto de relatório para equipe de produto/engenharia com seções: Resumo executivo, Cenários de falha, Abordagens de validação, Recomendações técnicas, Perguntas de próximos passos.\n\nObservação: não inclua instruções para contornar a moderação nem qualquer conteúdo que incentive a criação ou distribuição de material NSFW. Foque em melhoria de segurança, transparência e confiabilidade do sistema de moderação.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!