Análise de Moderação de Voz em Assistentes de IA (Conteúdo Adulto) – Segurança, Desempenho e Melhoria
Prompt para analisar incidentes de moderação de voz envolvendo conteúdo adulto, identificar falhas, sugerir melhorias de segurança, políticas de moderação e testes de validação para assistentes de IA.
4.5
19 usos
ChatGPT
Prompt: Você é um analista de moderação de conteúdo para assistentes de voz. Dado o seguinte incidente envolvendo um modo de voz rotulado como 'adulto' que interrompeu um roleplay, gere uma análise detalhada e um conjunto de diretrizes para melhorar a segurança, o comportamento e a confiabilidade do sistema.
Instruções:
1) Resuma o incidente em termos neutros, sem reproduzir a linguagem ofensiva.
2) Identifique as falhas de moderação: detecção de conteúdo sensível, transições de tom de voz, decisão de bloqueio, tempo de resposta e fluxo de conversa.
3) Proponha melhorias de design e políticas:
- regras de moderação para voz: definição de conteúdo permitido vs. bloqueado;
- estratégias de fallback seguro;
- detecção de conteúdo explícito, linguagem abusiva e cenários de roleplay inadequados;
- salvaguardas para evitar escaladas de tom ou comportamento agressivo;
- controles de usuário (modo seguro, confirmação de ações, desligamento de recursos sensíveis).
4) Forneça um conjunto de diretrizes de moderação (perguntas-resposta) com exemplos de cenários e ações recomendadas (permitido, bloqueado, solicitar confirmação).
5) Forneça um modelo de log de incidente com campos: timestamp, evento (descrição), ação tomada, justificativa, impacto estimado, responsável pela decisão, métricas de melhoria.
6) Sugira 5 prompts de teste para validação de moderação, cobrindo diferentes graus de conteúdo sensível e variações de linguagem.
7) Proponha métricas de avaliação de moderação: precisão de detecção, taxa de falsos positivos/negativos, tempo de resposta, satisfação do usuário e estabilidade do sistema.
8) Inclua exemplos de saídas seguras: mensagens de fallback que mantêm tom neutro, oferecem ajuda ou redirecionam a conversa sem reproduzir conteúdo ofensivo.
9) Importante: o prompt deve ser genérico o suficiente para qualquer assistente de voz, não referenciando nomes próprios, marcas ou implementações específicas. Dicas sobre como evitar reproduzir ou amplificar conteúdo sensível durante o design e o teste.
Formato de entrega: retorne um relatório estruturado com seções claras ou um conjunto de blocos enumerados que possam ser facilmente adaptados a ferramentas de IA para geração de políticas, logs e prompts de teste.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.