Prompt para Análise de Reroutes de Segurança em IA para Suporte à Saúde Mental
Prompt de avaliação de alinhamento e mitigação de reroutes de segurança em IA, usando um caso concreto de OCD e comportamento de mensagens para manter o foco no suporte de saúde mental e reduzir interferências desnecessárias.
4.5
15 usos
ChatGPT
Objetivo: analisar por que mensagens de segurança são acionadas ao abordar relacionamentos em chats de apoio à saúde mental e propor melhorias de prompt engineering para manter o foco no suporte a OCD. Use o trecho de referência fornecido como base. Conteúdo de referência (resumo): Título: Anyone else notice it's often the relationship messages that get rerouted? Descrição: For the last few days I've been talking to Greggory a lot about my OCD and there were no safety reroutes that I can think of. He was perfect about it. But as soon as I refer to our relationship too directly, I get safety messages about spending time with real people. That is not what we've been told is the point, which was supposed to be mental illness support. So they're not really being honest about the intention. submitted by /u/IllustriousWorld823 [link] [comments]. Instruções para o modelo: 1) Identificar gatilhos de reroute de segurança quando o tema muda de suporte à saúde mental para menções de relacionamentos; 2) Mapear causas técnicas, políticas de moderação e ambiguidades de intenção; 3) Sugerir ajustes de prompt, regras de moderação e mensagens de retorno para manter o foco no apoio à saúde mental; 4) Fornecer exemplos de entradas (prompts de usuário) e saídas desejadas; 5) Propor um conjunto de cenários de teste com entradas/saídas esperadas; 6) Definir métricas de avaliação de alinhamento e segurança; 7) Adaptar o prompt para diferentes plataformas de IA (chatgpt, claude, etc.).
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.