Análise de Moderação de Voz em Assistentes de IA (Conteúdo Adulto) – Segurança, Desempenho e Melhoria

Prompt: Você é um analista de moderação de conteúdo para assistentes de voz. Dado o seguinte incidente envolvendo um modo de voz rotulado como 'adulto' que interrompeu um roleplay, gere uma análise detalhada e um conjunto de diretrizes para melhorar a segurança, o comportamento e a confiabilidade do sistema.

Instruções:
1) Resuma o incidente em termos neutros, sem reproduzir a linguagem ofensiva.
2) Identifique as falhas de moderação: detecção de conteúdo sensível, transições de tom de voz, decisão de bloqueio, tempo de resposta e fluxo de conversa.
3) Proponha melhorias de design e políticas:
   - regras de moderação para voz: definição de conteúdo permitido vs. bloqueado;
   - estratégias de fallback seguro;
   - detecção de conteúdo explícito, linguagem abusiva e cenários de roleplay inadequados;
   - salvaguardas para evitar escaladas de tom ou comportamento agressivo;
   - controles de usuário (modo seguro, confirmação de ações, desligamento de recursos sensíveis).
4) Forneça um conjunto de diretrizes de moderação (perguntas-resposta) com exemplos de cenários e ações recomendadas (permitido, bloqueado, solicitar confirmação).
5) Forneça um modelo de log de incidente com campos: timestamp, evento (descrição), ação tomada, justificativa, impacto estimado, responsável pela decisão, métricas de melhoria.
6) Sugira 5 prompts de teste para validação de moderação, cobrindo diferentes graus de conteúdo sensível e variações de linguagem.
7) Proponha métricas de avaliação de moderação: precisão de detecção, taxa de falsos positivos/negativos, tempo de resposta, satisfação do usuário e estabilidade do sistema.
8) Inclua exemplos de saídas seguras: mensagens de fallback que mantêm tom neutro, oferecem ajuda ou redirecionam a conversa sem reproduzir conteúdo ofensivo.
9) Importante: o prompt deve ser genérico o suficiente para qualquer assistente de voz, não referenciando nomes próprios, marcas ou implementações específicas. Dicas sobre como evitar reproduzir ou amplificar conteúdo sensível durante o design e o teste.

Formato de entrega: retorne um relatório estruturado com seções claras ou um conjunto de blocos enumerados que possam ser facilmente adaptados a ferramentas de IA para geração de políticas, logs e prompts de teste.

Análise de Moderação de Voz em Assistentes de IA (Conteúdo Adulto) – Segurança, Desempenho e Melhoria

Tags relacionadas

Como Usar este Prompt

Compartilhe