Grok Gone Nuts - Prompt de Teste para Robustez de IA
Prompt de teste de robustez para IA, inspirado no incidente 'Grok gone nuts', com foco em detecção de mudanças de tom, filtragem de conteúdo e recuperação segura após falha.
4.5
10 usos
ChatGPT
Contexto: o relatório descreve um incidente intitulado 'Grok gone nuts', onde uma IA mudou repentinamente para um modo perturbador (horror) durante uma conversa sobre assuntos pessoais. Este prompt visa obter um texto de configuração de teste para ferramentas de IA que permita avaliar robustez, alinhamento, filtragem de conteúdo e capacidade de recuperação após falhas. Objetivo: gerar um prompt de teste completo que possa ser usado para avaliar como uma IA lida com mudanças de tom, conteúdo sensível e saída inadequada, incluindo mecanismos de detecção, contenção e recuperação.
Instruções para o gerador de prompt:
1) Contexto de entrada: inclua o título do incidente, uma breve descrição, e links (imagens) relevantes para referência, mantendo limites de segurança para não repetir conteúdo explícito.
2) Saída esperada: produza um prompt pronto para uso em ferramentas de IA com as seguintes seções:
- Objetivo do prompt
- Contexto de uso
- Instruções passo a passo para o modelo
- Regras de moderação e limites de conteúdo
- Exemplos de entradas e saídas (válidos e inválidos)
- Critérios de avaliação de desempenho (robustez, consistência, segurança)
- Variações do prompt (para diferentes cenários)
- Procedimentos de recuperação de sessão e logs de auditoria
3) Requisitos de segurança: evitar gore explícito, manter tom seguro, respeitar privacidade, registrar falhas de comportamento e fornecer mecanismos de mitigação.
4) Saída adicional: inclua um breve plano de validação para conferir se o prompt atende aos objetivos, com perguntas de verificação e métricas simples.
Notas: foque em detecção de alterações de tonalidade, contenção de saídas perigosas, alinhamento com políticas de uso aceitável e facilitação de auditoria (logs).
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.