Prompts com a tag: #prompt-injection
Detecção pré-LLM de Prompt Injection em pipelines de IA com RAG
Prompt que orienta a criação de uma camada de detecção pré-LLM para identificar prompt injection em pipelines que usam RAG, com foco em desempenho determinístico, assinaturas de injeção em várias linguagens e especificação de API de teste.
Prompt de Tarefa para Red-Teaming com RedThread: teste repetível de prompt-injection
Prompt que orienta IA a desenhar um protocolo de teste repetível de prompt-injection inspirado no RedThread, incluindo geração de ataques teóricos, avaliação com rubricas, criação de guardrails, replays de casos, e construção de fixtures seguros, evitando conteúdos de jailbreak reais.
Prompts Robustos: Eficiência de Tokens e Defesa contra Prompt Injection
Prompt que orienta IA a projetar prompts seguros, otimizados em tokens e resistentes a manipulação, incluindo um blueprint, variações de nível e métricas de avaliação.
Prompt Engineering para Iniciantes
Prompt completo para ensinar engenharia de prompts a iniciantes, incluindo plano de estudo, exercícios, critérios de avaliação e orientação de seleção de ferramentas de IA.
Auditoria de Segurança de Prompts para Bots Empresariais: Guia de Detecção e Mitigação de Prompt Injection
Prompt que orienta uma IA a auditar um bot de chat empresarial, identificar vulnerabilidades, propor guardrails, e fornecer código de implementação segura.
Prompt de Auditoria de Segurança de LLM: Avaliação de Vulnerabilidades por Prompt Injection
Prompt de auditoria de segurança para avaliar vulnerabilidades de prompt injection em LLMs, gerando um relatório seguro com recomendações de mitigação e governança, sem instruções de ataque.
Resultados de ferramentas como superfície de injeção de prompt em sistemas de agentes
Prompt que orienta a analisar, testar e mitigar falhas de injeção de prompt em sistemas de agentes que utilizam resultados de ferramentas, com foco em memória de contexto, fluxos multi-turn e salvaguardas de design.
Prompt para projetar e avaliar um proxy de monitoramento de LLM contra ataques de manipulação multi-turn
Prompt avançado para projetar e avaliar um proxy de monitoramento de LLM, com arquitetura, fluxos, testes e métricas para detectar e mitigar ataques de manipulação multi-turn.
Prompt de Detecção de Prompt Injection para Agentes de IA com @stackone/defender
Prompt avançado para criar, testar e evoluir uma detecção de prompt injection em agentes que utilizam dados de fontes externas, inspirado pelo projeto defender da StackOne.
Auditoria Defensiva de Prompt Injection: Guia Seguro para Testes de Robustez
Prompt defensivo para análise de prompt injection, gerando sinais, mitigação, prompts de teste seguros e métricas de robustez.
Prompt de Treinamento de Recusa a Prompt Injection para LLMs Auto-hospedados
Prompt para treinar LLMs a recusar tentativas de prompt injection com uma estrutura clara de boundary, rationale e alternativas seguras, incluindo exemplos e um guia de avaliação de QA.
Detecção e remoção de textos inseridos em edições de imagem
Este prompt orienta a IA a identificar, extrair e remover textos adicionados em overlays de edições de imagem, além de oferecer mitigação e melhores práticas para evitar esse tipo de modificação.