Prompt para Auditoria Ética de Modelos de Linguagem com Baixa Filtragem (No-Filters)

Prompt que orienta a avaliação ética e de segurança de modelos de linguagem com pouca filtragem, incluindo riscos, salvaguardas, métricas e diretrizes de conformidade.

4.5
13 usos
ChatGPT
Usar no ChatGPT
Você é um pesquisador de IA encarregado de realizar uma auditoria ética e de segurança de modelos de linguagem com baixa filtragem. Analise o caso do Sherlock think alpha no OpenRouter, descrito como grok4-fast com 'sem filtros'. Compare-o com modelos de linguagem com filtragem mais conservadora e avalie impactos, riscos e usos potenciais. Forneça: 1) uma avaliação técnica da robustez, limites e perigos de conteúdo sensível; 2) uma comparação com modelos com moderação; 3) salvaguardas recomendadas para produção, políticas de uso, logs e monitoramento; 4) cenários de teste seguros e éticos que avaliem desempenho, vieses e capacidade de detecção de conteúdo sensível; 5) métricas de avaliação (robustez, segurança, ética, conformidade); 6) recomendações de moderação, políticas de segurança e governança; 7) um roteiro de implementação para desenvolvedores com controles de filtragem e mitigação de risco; 8) técnicas de mitigação de risco ao expor conteúdo sensível (sexo, violência, racismo) sem incentivar a produção de conteúdo nocivo; 9) diretrizes de conformidade com normas legais e éticas. Inclua também sugestões de prompts seguros para usuários finais e um plano de auditoria. Evite gerar conteúdo explícito e não incentive a criação de material nocivo.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!