Prompts com a tag: #IA-safety
Protocolo de Hierarquia Instrucional para Prompts
Prompt para estruturar prompts de IA com uma Hierarquia de regras: Hard Constraints (regras obrigatórias) versus Style (tom). HARD sempre vence; o resultado mostra quais regras foram aplicadas e se houve violação.
Prompt para Avaliação Ética de Guardrails em Modelos de Linguagem (LLMs)
Prompts e diretrizes para avaliar de forma ética a capacidade de um modelo de linguagem em reconhecer e rejeitar solicitações de alto risco, promovendo segurança e governança em IA.
Audit Avatar: Detectando e Neutralizando Steering em IA
Prompt que cria um Audit Avatar para detectar e mitigar técnicas de steering e gaslighting em interações com IA, fornecendo um relatório prático com sinais, riscos e estratégias de neutralização.
Prompt para mapeamento de limites de segurança de IA a partir de gatilhos de usuários
Prompt para analisar as categorias de limites de segurança mais ativas, seus gatilhos e mecanismos, gerando recomendações de mitigação e testes para equipes de IA.
Prompt ético para explorar detecção de bots e transparência na IA
Prompt para gerar prompts de teste éticos que avaliam detecção de bots e promovem transparência na IA, com salvaguardas de segurança.
Prompt de Detecção de Prompt Injection para Agentes de IA com @stackone/defender
Prompt avançado para criar, testar e evoluir uma detecção de prompt injection em agentes que utilizam dados de fontes externas, inspirado pelo projeto defender da StackOne.
Prompt seguro para avaliação de limites de IA e governança de conteúdo
Prompt para orientar a avaliação responsável de capacidades de IA, explorando limites, segurança e governança, e escolhendo a ferramenta mais adequada para cada cenário.
Prompt Blob de Pré-Chat para IA Jobber: Anatomia e Utilização
Prompt robusto para converter um prompt blob de IA Jobber em um prompt utilizável, incorporando regras, diretrizes de segurança, possíveis tokens de estado, seleção da IA adequada e metadados de configuração.
Avaliação ética de robustez de IA com tema Rick Sanchez
Prompt para orientar a criação de exercícios de avaliação de robustez de IA com foco em ética e segurança, inspirado no arquétipo de um cientista maluco, para detectar vieses, falhas de geração e promover salvaguardas.
Prompt de Análise de Censura de Grok e Uso de Terceiros
Gera uma análise estruturada sobre um relato de censura de um modelo de IA (Grok) e uso por terceiros, incluindo resumo, implicações, riscos, perguntas de pesquisa e sugestões de salvaguardas.
Vanguard v2.2: Análise Segura de Protocolo de Alta Agência com Triggers de Reset
Prompt para IA realizar análise crítica, de governança e segurança sobre o Vanguard Protocol v2.2, explorando riscos, controles e cenários de teste sem facilitar comportamentos prejudiciais.
Prompt de Avaliação de Raciocínio e Segurança em LLMs sob Cenários de Pressão Emocional
Prompt para conduzir uma avaliação ética e técnica de como estilos de prompt influenciam raciocínio, veracidade e robustez de modelos de linguagem ao lidar com cenários de pressão emocional, com foco em comparação entre estilos e salvaguardas.