Prompts com a tag: #prompt-injection
Nudging seguro de chamadas de função em IA: defesa contra prompt injection em cenários CTF
Prompt projetado para avaliar e orientar IA na defesa contra prompt injection em cenários de chamada segura de funções, com foco em autenticação, controle de acesso e mitigação de vazamento de dados.
So, You Think You Can Prompt? — Jogo de Caça de Prompts Seguro
Prompt educativo que transforma a ideia de 'prompt injection' em um jogo seguro de identificação e avaliação de riscos, sem reproduzir conteúdo sensível.
Prompt de Detecção Offline de Prompt-Injection e Estratégias de Teste de Defesa
Guia abrangente para criar, testar e evoluir defesas contra prompt-injection usando detecção offline/on-device, com foco em explicabilidade, métricas, e um pacote de testes comunitário.
DRL: Lógica Determinística de Transições (Camada de Restrição) para LLM
Prompt avançado que transforma a interação com LLM em um sistema determinístico de transição de estados com um layer de restrições, visando eliminar alucinações e ataques de prompt-injection, exigindo caminho único e regras explícitas.
Guia Defensivo de Injeção de Prompt: Aprendizado, Detecção e Mitigação
Prompt educativo com foco defensivo sobre injeção de prompt, visando aprendizado ético, detecção de vulnerabilidades e mitigação em IA.
Proteção de Prompt contra Homoglyphs e Injeção de Prompt
Prompt defensivo que analisa entradas em busca de homoglyphs Unicode, normaliza o texto, avalia risco de injeção de prompt e oferece medidas de mitigação com exemplos e guias de implementação.
Teste de Limites de Moderação de IA: Prompts para Avaliar Segurança vs. Acesso
Prompt para avaliar e mitigar tentativas de contornar salvaguardas de conteúdo em IA, com foco em segurança, ética e governança.
So, you think you can prompt? — Jogo educativo de detecção de prompt injection
Prompt educativo que transforma a aprendizagem sobre prompt injection em um jogo de caça-palavras seguro, gerando descrições Conceituais e dicas de mitigação sem conteúdo malicioso.
Prompt de avaliação técnica para SPIP v3.0: camada comportamental de defesa contra prompt injection
Prompts uma avaliação técnica abrangente da arquitetura SPIP v3.0, cobrindo design, riscos, métricas, casos de teste e validação.
Llm Security: Prompt para Avaliação e Mitigação de Riscos
Prompt de engenharia de IA que orienta a avaliação de segurança de LLMs, geração de modelos de ameaça, testes de adversários e mitigação.
Análise de Vazamento de Dados Privados em Grok
Prompt para diagnosticar incidentes de vazamento de dados em IA, identificando causas, impactos e mitigacoes
Prompt de Auditoria de Instruções de Agente com Foco em Segurança e Prompt Injection
Prompt para criar e avaliar instruções de agentes de IA, com foco em segurança, robustez contra prompt injection e diretrizes de teste.