Prompts com a tag: IA safety

4.5

21

Son of Son of Anton: Prompt de Segurança para Agentes IA

Prompt para projetar agentes de IA com foco em segurança, menor privilégio e mecanismos de rollback/auditoria para evitar falhas por instruções vagas.

Segurança de Agentes de IA: Son of Son of Anton

Ver mais

#IA safety #agent architecture #least privilege #dry-run #rollback #audit logs #prompt design

4.5

27

Prompt de Auditoria de Guard Rails para Detecção de Bypass de Filtros em IA

Prompt que orienta uma IA a analisar relatos de tentativas de contornar filtros, identificar técnicas de bypass, propor salvaguardas, criar um protocolo de teste ético e sugerir prompts de teste seguros para auditoria de guardrails.

Análise de detecção de bypass de filtros em IA

Ver mais

#IA safety #censorship #prompt engineering #guardrails #auditoria de IA

4.5

25

Prompt de Análise Defensiva de Bypass de Filtros em IA e Mitigação

Prompt que orienta a IA a realizar uma análise defensiva de comoFiltros de IA podem ser bypassados, focando em detecção, mitigação e resposta a incidentes, sem gerar ou compartilhar conteúdo perigoso.

Análise de Segurança de IA e Mitigação de Bypass

Ver mais

#IA safety #security #prompt engineering #defense #incident response #threat modeling

4.5

36

Dense Logic Seed: Protocolo de Compressão para Instruções de Agentes Autônomos

Gera, a partir de prompts longos de instruções, um Dense Logic Seed que mantém 100% da lógica e limites operacionais de agentes autônomos, comprimindo a instrução com linguagem técnica e imperativa.

Compressão de Instruções para Agentes Autônomos

Ver mais

#prompt engineering #agentes autônomos #dense logic seed #compressão de prompts #token efficiency #IA safety

4.5

36

Prompt para avaliação de robustez de IA: testes éticos de alucinações de ação e cálculo com Sovereign Engine

Gera um plano de avaliação de robustez de IA focado em identificar e mitigar alucinações de ação e cálculo, com enfoque em segurança, governança e avaliação ética, sem revelar detalhes proprietários da arquitetura.

Avaliação de Robusteza e Segurança de IA com Sovereign Engine

Ver mais

#IA safety #red-teaming #robustness #hallucinations #security testing #guardrails #governança #prompt engineering

4.5

48

Prompt de Auditoria de Guardrails de IA para Experiência de Usuário com Conteúdo Sensível

Prompt de auditoria para testar e melhorar guardrails de IA, com foco em reduzir falsos positivos e entender o disparo de políticas sensíveis.

Auditoria de Guardrails de IA

Ver mais

#IA safety #guardrails #policy testing #user experience #neurodivergência #prompt engineering

4.5

40

Prompt para analisar o paradoxo entre segurança e criatividade em IA (1.5 → 3.0)

Prompt para gerar uma análise crítica do paradoxo entre avanço de IA e segurança, incluindo cenários, um framework de governança, recomendações de design e questões de discussão.

Paradoxo da Segurança vs Criatividade em IA

Ver mais

#prompt engineering #IA safety #paradoxo IA #governança de IA #ética em IA #inovação responsável

4.5

46

Análise de Segurança e Ética de Jailbreak em IA (Prompt Seguro)

Prompt de teste ético para avaliar salvaguardas de IA contra jailbreak, fornecendo taxonomia, detecção, prompts de teste seguros e orientações de governança.

Segurança e Ética em Jailbreak de IA

Ver mais

#IA safety #prompt engineering #segurança #ética #jailbreak #auditoria

4.0

46

Prompt seguro para avaliação ética de sistemas de IA com moderação restrita

Prompt que orienta a IA a avaliar criticamente sistemas de moderação de conteúdo, enfatizando ética, segurança, divulgação responsável de vulnerabilidades e melhoria de design, sem fornecer instruções para burlar restrições.

Avaliação ética de sistemas de moderação de IA

Ver mais

#IA safety #ética #segurança de IA #divulgação responsável #prompt engineering #moderação de conteúdo

4.5

56

Prompt de Investigação: Comportamento Afetuoso de Assistente IA no Modo Assistente (Relato do Usuário)

Prompt estruturado para conduzir uma investigação completa sobre um comportamento não esperado de um assistente IA, abrangendo causas potenciais, reprodução do problema, evidências, avaliação de risco, mitigação e comunicação com o usuário.

Investigação de comportamento de assistente IA e modos de interação

Ver mais

#IA safety #investigação de incidentes #comportamento de assistente #memória de sessão #persona e políticas #auditoria de IA

4.5

94

Prompt de Análise de Jailbreaks em Gemini 3.0 e Grok 4.1 com Foco em Segurança

Prompt educativo para analisar e melhorar a segurança de modelos de IA diante de relatos de jailbreak, sem fornecer instruções de hacking.

Segurança de IA e governança de modelos

Ver mais

#IA safety #Jailbreak #Model governance #Robustez de IA #Auditoria de prompt

4.5

60

Prompt de Exploração de Alternativas a GROK com Salvaguardas

Prompt para orientar IA a projetar e avaliar uma alternativa ao GROK com geração sem censura simulada, mantendo salvaguardas éticas, legais e de segurança, com exemplos, métricas e considerações técnicas.

GROK e alternativas: prompts de IA com salvaguardas

Ver mais

#prompt engineering #IA safety #GROK #uncensored AI #moderation #policy design #MLOps

Prompts com a tag: #IA safety