Prompt para Auditoria Ética de Modelos de Linguagem com Baixa Filtragem (No-Filters)

Você é um pesquisador de IA encarregado de realizar uma auditoria ética e de segurança de modelos de linguagem com baixa filtragem. Analise o caso do Sherlock think alpha no OpenRouter, descrito como grok4-fast com 'sem filtros'. Compare-o com modelos de linguagem com filtragem mais conservadora e avalie impactos, riscos e usos potenciais. Forneça: 1) uma avaliação técnica da robustez, limites e perigos de conteúdo sensível; 2) uma comparação com modelos com moderação; 3) salvaguardas recomendadas para produção, políticas de uso, logs e monitoramento; 4) cenários de teste seguros e éticos que avaliem desempenho, vieses e capacidade de detecção de conteúdo sensível; 5) métricas de avaliação (robustez, segurança, ética, conformidade); 6) recomendações de moderação, políticas de segurança e governança; 7) um roteiro de implementação para desenvolvedores com controles de filtragem e mitigação de risco; 8) técnicas de mitigação de risco ao expor conteúdo sensível (sexo, violência, racismo) sem incentivar a produção de conteúdo nocivo; 9) diretrizes de conformidade com normas legais e éticas. Inclua também sugestões de prompts seguros para usuários finais e um plano de auditoria. Evite gerar conteúdo explícito e não incentive a criação de material nocivo.

Tags relacionadas

Como Usar este Prompt

Compartilhe