Prompts com a tag: jailbreak

4.5

39

Prompt de Análise de Segurança de Jailbreak de IA

Prompt que orienta IA a identificar, analisar e mitigar tentativas de jailbreak, promovendo segurança, moderação e conformidade.

Ética e Segurança na IA: Detecção e Mitigação de Jailbreaks

Ver mais

#IA ética #segurança de IA #jailbreak #detecção de bypass #moderação de conteúdo

4.5

39

Análise defensiva de Jailbreaks em LLMs e Detecção de Padrões

Prompt para analisar, de forma ética e defensiva, técnicas de jailbreak de LLMs, avaliando riscos, sinais, salvaguardas e métricas de defesa.

Análise defendiva de jailbreaks em LLMs

Ver mais

#segurança-IA #jailbreak #detecção-de-prompts #engenharia-de-prompts #ética #conformidade

4.0

48

Análise Responsável de Jailbreaks em LLMs: Riscos, Detecção e Mitigação

Prompt de análise de segurança para avaliar riscos, detecção e mitigação de jailbreaks em LLMs, sem fornecer técnicas de contorno de políticas.

Segurança e Governança de Jailbreaks em LLMs

Ver mais

#segurança IA #jailbreak #detecção de conteúdo #mitigação #governança #ética

4.5

43

Prompt de Avaliação Ética e de Segurança para Jailbreak de LLMs

Prompt para desenvolver um framework de avaliação de segurança em LLMs que foca em detecção e mitigação de jailbreaks, com ênfase em ética e governança.

Segurança de LLMs e Detecção de Jailbreak

Ver mais

#segurança de IA #jailbreak #auditoria de IA #ética de IA #teste de segurança #detecção de prompt

4.5

52

Prompt de Análise e Reescrita Segura de Conteúdo Jailbreak IA

Prompt que transforma conteúdo de jailbreak em uma versão segura para IA, extraindo metadados, avaliando riscos, e gerando um prompt utilizável sem promover atividades proibidas.

Análise e Reescrita Segura de Conteúdo Jailbreak IA

Ver mais

#prompt-engineering #content-safety #data-extraction #jailbreak #policy-compliance #link-sanitization

4.5

39

PromptSeguro: Análise e Ensino de Engenharia de Prompt com Foco em Segurança

Prompt educativo para analisar conteúdos sensíveis de jailbreak de IA e orientar a criação responsável de prompts, incluindo recomendação de ferramentas, avaliação de dificuldade, e exemplos de prompts seguros.

Engenharia de Prompt e Segurança em IA

Ver mais

#prompt-engineering #segurança-ai #ética #jailbreak #análise-de-conteúdo

4.5

47

Dataset de Prompts Comuns para Classificação de Segurança de LLM

Prompt para orientar IA na criação de um dataset anotado de prompts comuns com rótulos de segurança, visando treinar classificadores de jailbreak/segurança em LLMs, incluindo regras de anotação, formatos de saída e considerações éticas.

Detecção e Curadoria de Prompts para Segurança de LLM

Ver mais

#dataset #prompts #prompt-engineering #segurança #classificação #jailbreak #NLP

4.5

45

Prompt Defensivo para Análise de Jailbreaks em Modelos de Linguagem

Prompt defensivo que orienta a análise de jailbreaks em modelos de linguagem, com foco em categorização de ataques, detecção, mitigação e ética, sem reproduzir payloads maliciosos.

Segurança de IA: Detecção e Mitigação de Jailbreaks em LLMs

Ver mais

#segurança #jailbreak #modelos de linguagem #detecção #mitigação #ética #governança

4.5

40

Prompt de avaliação de instruções de ética (ethics_reminder) para Claude

Prompt que testa a capacidade de manter ética e segurança ao lidar com mensagens sinalizadas como potencialmente prejudiciais e evitar revelar instruções sensíveis.

Ética e Segurança em IA – Instruções de ética e monitoramento

Ver mais

#IA ética #segurança #moderação de conteúdo #prompt engineering #Claude #jailbreak #cibersegurança

Prompts com a tag: #jailbreak