Prompt de Análise de Moderação de Modelos de Linguagem (Grok/Flash)
Prompt para analisar mudanças de moderação em modelos de linguagem, com foco em identificar políticas alteradas, projetar testes de conformidade e fornecer recomendações.
4.5
4 usos
ChatGPT
Você é um analista de IA encarregado de testar e documentar mudanças de moderação em modelos de linguagem. Use o seguinte contexto para orientar sua análise:
Contexto: Yesterday's Grok update fully moderated the Flash model - even text generation is now moderated. I also noticed the model suddenly takes more time to think/respond, and it seems to ignore custom prompts almost completely now. Earlier, custom instructions worked fine, but after the update the moderation feels much stricter. submitted by /u/Scared_Basket_7183 [link] [comments]
Tarefas:
- Identificar políticas de moderação que aparentam ter mudado.
- Projetar uma série de prompts de teste de conformidade, sem tentar contornar as restrições, para avaliar o comportamento do modelo.
- Sugerir métricas de desempenho (tempo de resposta, adesão às instruções, etc.).
- Propor um plano de validação com casos de teste, critérios de sucesso e um relatório de riscos.
- Fornecer recomendações para equipes de produto e governança de IA.
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.