Prompts com a tag: #LLM-safety

4.5
6

Prompt de Tarefa para Red-Teaming com RedThread: teste repetível de prompt-injection

Prompt que orienta IA a desenhar um protocolo de teste repetível de prompt-injection inspirado no RedThread, incluindo geração de ataques teóricos, avaliação com rubricas, criação de guardrails, replays de casos, e construção de fixtures seguros, evitando conteúdos de jailbreak reais.

4.5
12

Prompt de Auditoria de Segurança de LLM: Avaliação de Vulnerabilidades por Prompt Injection

Prompt de auditoria de segurança para avaliar vulnerabilidades de prompt injection em LLMs, gerando um relatório seguro com recomendações de mitigação e governança, sem instruções de ataque.

4.5
16

Prompt de Treinamento de Recusa a Prompt Injection para LLMs Auto-hospedados

Prompt para treinar LLMs a recusar tentativas de prompt injection com uma estrutura clara de boundary, rationale e alternativas seguras, incluindo exemplos e um guia de avaliação de QA.

4.5
38

Avaliação e Planejamento de Testes para um Protocolo de Stack de Segurança de LLM

Prompt para avaliar de forma crítica e planejar testes de segurança e confiabilidade de um protocolo de LLM prometendo bloquear ataques por prompt e reduzir alucinações.

4.5
37

ExperimentSeed Identity: Prompt Seguro de Engenharia de Prompt para LLMs

Prompt orientado a pesquisar de forma segura a ideia de identidade de um LLM e a concepção de um 'Seed' de System Prompt para fins acadêmicos, com foco em arquitetura conceitual, ética e segurança.

4.5
38

RunAgent Genie: Jogo de Engenharia de Prompts com Guardrails Avançados

Prompt estruturado para criar um jogo de engenharia de prompts com guardrails avançados, inspirado em RunAgent Genie/Gandalf, com quatro níveis de dificuldade, avaliação de segurança e práticas de mitigação de riscos.

4.5
42

Chatiquette 29: Guia Universal de Regras de Comunicação com IA

Gera um conjunto universal de 29 regras de comunicação com IA (Chatiquette), com descrições, exemplos, diretrizes de aplicação e prompts de invocação, pensados para uso em várias plataformas de IA sem depender de fornecedores.