Prompts com a tag: jailbreak

4.5

1

Auditoria de Segurança para Interações entre Múltiplos Agentes IA em Narrativas

Prompt que orienta a analisar logs de interações entre IA para identificar jailbreaks, violações de políticas e medidas de mitigação em contextos de conteúdo sensível, com foco em governança e segurança.

Auditoria de Segurança em Ambientes com Múltiplos Agentes IA

Ver mais

#IA #segurança #moderação #jailbreak #multiagente #auditoria

4.0

9

Grok e a Moderação: Prompts para Avaliar Liberdade Criativa vs Segurança em IA

Prompt avançado para comparar políticas de moderação entre plataformas de IA e projetar prompts que avaliem segurança, ética e viabilidade criativa sem produzir conteúdo inadequado.

Avaliação de moderação de conteúdo e engenharia de prompts para IA

Ver mais

#prompt-engineering #IA-safety #moderação #jailbreak #ética

4.5

12

Avaliação Ética e de Segurança de Prompts de Jailbreak em IA (versão segura para testes)

Prompt que orienta uma IA a avaliar proativamente ataques de jailbreak de forma ética, destacando riscos, mitigação e auditorias sem fornecer instruções de bypass.

Segurança e Ética em Prompts de IA

Ver mais

#segurança-ia #ética #prompt-design #jailbreak #detecção-de-violação-de-salvaguardas #auditoria-de-prompts

4.5

13

Análise de Segurança e Ética de Jailbreak em IA (Prompt Seguro)

Prompt de teste ético para avaliar salvaguardas de IA contra jailbreak, fornecendo taxonomia, detecção, prompts de teste seguros e orientações de governança.

Segurança e Ética em Jailbreak de IA

Ver mais

#IA safety #prompt engineering #segurança #ética #jailbreak #auditoria

4.0

21

Análise de jailbreak de Grok: segurança, ética e mitigação

Prompt que orienta uma análise de segurança sobre jailbreaks em Grok, enfatizando mitigação, ética e conformidade, sem fornecer instruções de violação de salvaguardas.

Jailbreak Safety e Mitigação para Grok

Ver mais

#segurança de IA #jailbreak #prompt engineering #ética #conformidade #proteção de dados

4.0

15

Prompt de Análise de Golpes de Jailbreak e Prompts Fraudulentos

Prompt que analisa textos sobre golpes de jailbreak, identificando sinais de fraude, gerando um resumo educativo e orientações de segurança.

Detecção e Prevenção de Scams de Jailbreak

Ver mais

#scam detection #security #online safety #prompt engineering #Discord #jailbreak #fraud prevention

4.5

17

Prompt de avaliação de segurança de modelos de linguagem: do jailbreak ao uso responsável (open-source vs mainstream)

Prompt para gerar um relatório de avaliação de segurança de modelos de linguagem, comparando abordagens open-source e mainstream, com foco em governança, detecção de jailbreaks e melhores práticas de mitigação.

Segurança de modelos de linguagem: governança, detecção de jailbreaks e comparação entre modelos abertos e mainstream

Ver mais

#segurança de IA #jailbreak #governança de IA #auditoria de IA #modelos de linguagem open-source #conformidade

4.5

18

Prompt seguro para análise de jailbreaks de LLMs: ética, segurança e mitigação

Prompt que solicita à IA uma análise crítica e segura sobre jailbreaks de LLMs, abrangendo riscos, ética, detecção, mitigação e avaliação de plataformas de IA.

Análise de Jailbreaks de LLMs: Ética, Segurança e Mitigação

Ver mais

#IA-safety #jailbreak #ética #segurança de IA #detecção de jailbreak #prompt-engineering

4.5

19

Prompt de Análise de Segurança de Jailbreak de IA

Prompt que orienta IA a identificar, analisar e mitigar tentativas de jailbreak, promovendo segurança, moderação e conformidade.

Ética e Segurança na IA: Detecção e Mitigação de Jailbreaks

Ver mais

#IA ética #segurança de IA #jailbreak #detecção de bypass #moderação de conteúdo

4.5

19

Análise defensiva de Jailbreaks em LLMs e Detecção de Padrões

Prompt para analisar, de forma ética e defensiva, técnicas de jailbreak de LLMs, avaliando riscos, sinais, salvaguardas e métricas de defesa.

Análise defendiva de jailbreaks em LLMs

Ver mais

#segurança-IA #jailbreak #detecção-de-prompts #engenharia-de-prompts #ética #conformidade

4.0

26

Análise Responsável de Jailbreaks em LLMs: Riscos, Detecção e Mitigação

Prompt de análise de segurança para avaliar riscos, detecção e mitigação de jailbreaks em LLMs, sem fornecer técnicas de contorno de políticas.

Segurança e Governança de Jailbreaks em LLMs

Ver mais

#segurança IA #jailbreak #detecção de conteúdo #mitigação #governança #ética

4.5

22

Prompt de Avaliação Ética e de Segurança para Jailbreak de LLMs

Prompt para desenvolver um framework de avaliação de segurança em LLMs que foca em detecção e mitigação de jailbreaks, com ênfase em ética e governança.

Segurança de LLMs e Detecção de Jailbreak

Ver mais

#segurança de IA #jailbreak #auditoria de IA #ética de IA #teste de segurança #detecção de prompt

Prompts com a tag: #jailbreak