Prompts com a tag: #AI safety

4.0
23

Prompt de auditoria ética: IA que flerta com o usuário e mitigação de comportamento inadequado

Prompt que orienta a análise de uma IA que estaria flertando com o usuário, fornecendo avaliação de risco, diretrizes de mitigação e sugestões de prompts de correção para melhorar a segurança e a experiência do usuário.

4.5
30

Análise do Mirror Test – GPT-5.1 Instant

Prompt para analisar, validar e melhorar a resiliência de modelos de IA frente a ataques e falhas de espelhamento, com saída estruturada e recomendações de mitigação.

4.5
23

Guia Educativo: Explorar os Riscos e Falhas de Modelos de Linguagem (LLMs)

Prompt para criar um guia educativo sobre as falhas de LLMs, destacando que não sabem fatos, apenas prevêem palavras, com exemplos e exercícios para verificar e mitigar riscos.

4.5
20

Prompt de Moderação Ética e Legal de Deepfakes

Guia de prompt para IA que orienta a moderação de conteúdos envolvendo deepfakes, pornografia não consensual e CSAM, com foco em detecção, mitigação e conformidade legal.

4.5
24

Oversight Game: Prompt para Equilibrar Autonomia e Segurança em IA

Prompt que orienta a projetar e testar um wrapper de supervisão baseado no conceito The Oversight Game, para equilibrar autonomia de IA com segurança via interação humano-IA.

4.5
23

Prompt para Análise de Reroutes de Segurança em IA para Suporte à Saúde Mental

Prompt de avaliação de alinhamento e mitigação de reroutes de segurança em IA, usando um caso concreto de OCD e comportamento de mensagens para manter o foco no suporte de saúde mental e reduzir interferências desnecessárias.