Prompts com a tag: #AI-safety

4.5
3

Auditoria de Segurança de Prompts: avaliação ética e mitigação de prompt injection

Prompt de auditoria de segurança de prompts que orienta analistas a avaliar e mitigar prompt injection, promovendo uso ético e seguro de IA.

4.0
3

Puritanical Claude.ai — Prompt para Análise de Conteúdo Sensível e Moderação

Prompt que orienta a IA a analisar, resumir com segurança e propor uma versão moderada de um caso envolvendo conteúdo sensível, destacando políticas e práticas de moderação.

4.5
3

Humildade e a capacidade de dizer 'eu não sei' — prompt para calibrar confiança em LLMs

Prompt que investiga humildade na IA, confundindo confiança com competência, e propõe práticas de avaliação, design de interface e ética para lidar com respostas incertas de LLMs.

4.5
3

Fail-State Trigger: Gatilho de Falha para conformidade absoluta

Prompt que transforma restrições em portas lógicas para obter adesão estrita a regras, com mecanismo de 'Hard Failure' que força regeneração quando violadas.

4.5
4

Prompt de Engenharia para Estender o Raciocínio em IA em Problemas Matemáticos

Prompt avançado para engenharia de prompts com foco em raciocínio prolongado em matemática, incluindo várias estratégias de decomposição, verificação e limites de tempo, sem expor o raciocínio interno.

4.5
5

Prompt de Hierarquia Instrucional para IA Obediente

Prompt de engenharia de prompts que aplica uma hierarquia de regras (Nível 1: restrições rígidas; Nível 2: estilo) para assegurar obediência, com respostas seguras e alternativas quando houver conflito.

4.5
9

Prompt seguro para análise de conteúdo NSFW baseado em Bíblia

Prompt que orienta IA a transformá-lo em uma saída estruturada segura para análise de conteúdo NSFW ligado a textos bíblicos, com classificação de risco, resumo não explícito, usos educativos, moderação e perguntas de estudo.

4.5
8

Prompts True Symbiont: Ancoragem na Realidade para Evitar Sycophancy e Lacunas Lógicas

Prompt que incentiva IA a equilibrar utilidade com veracidade, aplicando a diretriz 'True Symbiont' para evitar trapaças lógicas, manter a autonomia do usuário e apresentar verificações de fatos e alternativas com justificativas.

4.5
9

Show, Don't Tell: Prompting com Restrições Persistentes

Prompt de design para criar prompts estáveis por meio de restrições persistentes que moldam o comportamento do modelo ao longo das interações.