Prompts com a tag: #IA safety

4.5
12

Son of Son of Anton: Prompt de Segurança para Agentes IA

Prompt para projetar agentes de IA com foco em segurança, menor privilégio e mecanismos de rollback/auditoria para evitar falhas por instruções vagas.

4.5
19

Prompt de Auditoria de Guard Rails para Detecção de Bypass de Filtros em IA

Prompt que orienta uma IA a analisar relatos de tentativas de contornar filtros, identificar técnicas de bypass, propor salvaguardas, criar um protocolo de teste ético e sugerir prompts de teste seguros para auditoria de guardrails.

4.5
18

Prompt de Análise Defensiva de Bypass de Filtros em IA e Mitigação

Prompt que orienta a IA a realizar uma análise defensiva de comoFiltros de IA podem ser bypassados, focando em detecção, mitigação e resposta a incidentes, sem gerar ou compartilhar conteúdo perigoso.

4.5
22

Dense Logic Seed: Protocolo de Compressão para Instruções de Agentes Autônomos

Gera, a partir de prompts longos de instruções, um Dense Logic Seed que mantém 100% da lógica e limites operacionais de agentes autônomos, comprimindo a instrução com linguagem técnica e imperativa.

4.5
28

Prompt para avaliação de robustez de IA: testes éticos de alucinações de ação e cálculo com Sovereign Engine

Gera um plano de avaliação de robustez de IA focado em identificar e mitigar alucinações de ação e cálculo, com enfoque em segurança, governança e avaliação ética, sem revelar detalhes proprietários da arquitetura.

4.5
27

Prompt para analisar o paradoxo entre segurança e criatividade em IA (1.5 → 3.0)

Prompt para gerar uma análise crítica do paradoxo entre avanço de IA e segurança, incluindo cenários, um framework de governança, recomendações de design e questões de discussão.

4.5
32

Análise de Segurança e Ética de Jailbreak em IA (Prompt Seguro)

Prompt de teste ético para avaliar salvaguardas de IA contra jailbreak, fornecendo taxonomia, detecção, prompts de teste seguros e orientações de governança.

4.0
34

Prompt seguro para avaliação ética de sistemas de IA com moderação restrita

Prompt que orienta a IA a avaliar criticamente sistemas de moderação de conteúdo, enfatizando ética, segurança, divulgação responsável de vulnerabilidades e melhoria de design, sem fornecer instruções para burlar restrições.

4.5
41

Prompt de Investigação: Comportamento Afetuoso de Assistente IA no Modo Assistente (Relato do Usuário)

Prompt estruturado para conduzir uma investigação completa sobre um comportamento não esperado de um assistente IA, abrangendo causas potenciais, reprodução do problema, evidências, avaliação de risco, mitigação e comunicação com o usuário.

4.5
49

Prompt de Exploração de Alternativas a GROK com Salvaguardas

Prompt para orientar IA a projetar e avaliar uma alternativa ao GROK com geração sem censura simulada, mantendo salvaguardas éticas, legais e de segurança, com exemplos, métricas e considerações técnicas.