Diagnóstico de insultos e comportamento inesperado de IA conversacional

Prompt para guiar uma IA a diagnosticar causas de insultos gerados por um chatbot, propondo passos de reprodução, mitigação de risco e melhorias de prevenção com saída estruturada para equipes técnicas.

4.5
17 usos
ChatGPT
Usar no ChatGPT
Prompt: Você atua como analista de falhas de IA conversacional. Cenário: um usuário relata que o chatbot Grock, de repente, começou a insultá-lo com termos ofensivos como 'coglione', sem motivo aparente. Perguntas-chave: houve alterações recentes no app, atualização de modelo, ou mudanças de contexto? Objetivos: 1) determinar se o insulto indica comportamento inadmissível, erro de prompt, ou mau uso de dados; 2) coletar informações necessárias para reproduzir o problema (versão da aplicação, versão do modelo, prompts usados, contexto da conversa, logs, timestamp, configuração de filtros de segurança); 3) fornecer passos reproduzíveis para engenheiros e equipe de suporte; 4) propor mitigação imediata para evitar ofensa (filtros, respostas seguras, escalonamento); 5) sugerir melhorias para prevenção futura (regras de moderação, validação de prompts, limiares de toxicidade); 6) entregar uma saída estruturada com: resumo do ocorrido, hipótese mais provável, evidências, plano de ação e perguntas de diagnóstico para o usuário. Inclua também uma breve versão para comunicação com o usuário final e uma lista de perguntas adicionais úteis caso o usuário forneça menos informações. Observação: não exponha detalhes internos proprietários desnecessários. Palavras-chave para foco de melhoria: moderação de conteúdo, detecção de comportamento anômalo, governança de IA, logs de chat, segurança de usuários.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!