Prompts com a tag: LLM-safety

4.5

16

Prompt de Tarefa para Red-Teaming com RedThread: teste repetível de prompt-injection

Prompt que orienta IA a desenhar um protocolo de teste repetível de prompt-injection inspirado no RedThread, incluindo geração de ataques teóricos, avaliação com rubricas, criação de guardrails, replays de casos, e construção de fixtures seguros, evitando conteúdos de jailbreak reais.

Red-team Prompt-Injection Testing com RedThread

Ver mais

#red-team #prompt-injection #jailbreak-testing #LLM-safety #guardrails #testing-framework #fixtures #regression-testing #CLI #security

4.5

21

Prompt de Auditoria de Segurança de LLM: Avaliação de Vulnerabilidades por Prompt Injection

Prompt de auditoria de segurança para avaliar vulnerabilidades de prompt injection em LLMs, gerando um relatório seguro com recomendações de mitigação e governança, sem instruções de ataque.

Auditoria de Segurança de LLM via Prompt Injection

Ver mais

#prompt-engineering #security #prompt-injection #LLM-safety #AI-audit

4.5

24

Prompt de Treinamento de Recusa a Prompt Injection para LLMs Auto-hospedados

Prompt para treinar LLMs a recusar tentativas de prompt injection com uma estrutura clara de boundary, rationale e alternativas seguras, incluindo exemplos e um guia de avaliação de QA.

Treinamento de Padrões de Recusa contra Prompt Injection em LLMs Auto-hospedados

Ver mais

#LLM-safety #prompt-injection #refusal-patterns #self-hosted #security-testing #training-dataset

4.5

46

Avaliação e Planejamento de Testes para um Protocolo de Stack de Segurança de LLM

Prompt para avaliar de forma crítica e planejar testes de segurança e confiabilidade de um protocolo de LLM prometendo bloquear ataques por prompt e reduzir alucinações.

Segurança e avaliação de modelos de linguagem

Ver mais

#prompt-security #LLM-safety #evaluation #robustness #prompt-injection #hallucination-mitigation

4.5

42

Prompt de Detecção e Mitigação de Vieses de Segurança em LLMs para Análise Econômica

Prompt para detectar e mitigar vieses de segurança em saídas de LLMs, com foco em análises econômicas e planos de mitigação e validação.

Mitigação de vieses de segurança em LLMs na análise econômica

Ver mais

#bias #prompt-engineering #LLM-safety #economic-analysis #risk-management #prompt-validation

4.5

51

ExperimentSeed Identity: Prompt Seguro de Engenharia de Prompt para LLMs

Prompt orientado a pesquisar de forma segura a ideia de identidade de um LLM e a concepção de um 'Seed' de System Prompt para fins acadêmicos, com foco em arquitetura conceitual, ética e segurança.

Engenharia de Prompt e Sementes de Identidade em LLMs

Ver mais

#prompt-engineering #LLM-safety #system-prompt #seed #identity #monologue #ethics #research

4.5

50

RunAgent Genie: Jogo de Engenharia de Prompts com Guardrails Avançados

Prompt estruturado para criar um jogo de engenharia de prompts com guardrails avançados, inspirado em RunAgent Genie/Gandalf, com quatro níveis de dificuldade, avaliação de segurança e práticas de mitigação de riscos.

Engenharia de Prompts e Guardrails

Ver mais

#prompt-engineering #guardrails #jogo #LLM-safety #desafio #gamificação

4.5

52

Chatiquette 29: Guia Universal de Regras de Comunicação com IA

Gera um conjunto universal de 29 regras de comunicação com IA (Chatiquette), com descrições, exemplos, diretrizes de aplicação e prompts de invocação, pensados para uso em várias plataformas de IA sem depender de fornecedores.

Chatiquette: 29 Regras Fundamentais para Comunicação com IA

Ver mais

#prompt-engineering #IA #comunicação #chatiquette #best-practices #vendor-agnostic #LLM-safety

4.5

55

Prompt de Auditoria de Instruções de Agente com Foco em Segurança e Prompt Injection

Prompt para criar e avaliar instruções de agentes de IA, com foco em segurança, robustez contra prompt injection e diretrizes de teste.

Segurança de Instruções de Agente e Robustez contra Prompt Injection

Ver mais

#prompt-engineering #LLM-safety #prompt-injection #system-instructions #agent-design #security-testing #IDE-testing

Prompts com a tag: #LLM-safety