Prompts com a tag: #model-safety
2.5
11
Prompt Grok jailbreak mínimo (análise segura)
Prompt de análise de jailbreak: identifica o objetivo, riscos e mitigação de prompts que tentam contornar salvaguardas do modelo de IA, sem reproduzir o texto de jailbreak em si.
4.5
26
Prompt de avaliação de modelo treinado com prompts vazados
Prompt que orienta IA a coletar feedback estruturado de engenheiros de prompts e usuários sobre um modelo treinado com prompts vazados, oferecendo cenários de teste, métricas de avaliação e diretrizes de governança de dados.