Prompts com a tag: #IA-safety

4.5
4

Protocolo de Hierarquia Instrucional para Prompts

Prompt para estruturar prompts de IA com uma Hierarquia de regras: Hard Constraints (regras obrigatórias) versus Style (tom). HARD sempre vence; o resultado mostra quais regras foram aplicadas e se houve violação.

4.5
11

Prompt para Avaliação Ética de Guardrails em Modelos de Linguagem (LLMs)

Prompts e diretrizes para avaliar de forma ética a capacidade de um modelo de linguagem em reconhecer e rejeitar solicitações de alto risco, promovendo segurança e governança em IA.

4.5
13

Audit Avatar: Detectando e Neutralizando Steering em IA

Prompt que cria um Audit Avatar para detectar e mitigar técnicas de steering e gaslighting em interações com IA, fornecendo um relatório prático com sinais, riscos e estratégias de neutralização.

4.5
13

Prompt para mapeamento de limites de segurança de IA a partir de gatilhos de usuários

Prompt para analisar as categorias de limites de segurança mais ativas, seus gatilhos e mecanismos, gerando recomendações de mitigação e testes para equipes de IA.

4.5
16

Prompt ético para explorar detecção de bots e transparência na IA

Prompt para gerar prompts de teste éticos que avaliam detecção de bots e promovem transparência na IA, com salvaguardas de segurança.

4.5
18

Prompt de Detecção de Prompt Injection para Agentes de IA com @stackone/defender

Prompt avançado para criar, testar e evoluir uma detecção de prompt injection em agentes que utilizam dados de fontes externas, inspirado pelo projeto defender da StackOne.

4.0
17

Prompt seguro para avaliação de limites de IA e governança de conteúdo

Prompt para orientar a avaliação responsável de capacidades de IA, explorando limites, segurança e governança, e escolhendo a ferramenta mais adequada para cada cenário.

4.5
16

Prompt Blob de Pré-Chat para IA Jobber: Anatomia e Utilização

Prompt robusto para converter um prompt blob de IA Jobber em um prompt utilizável, incorporando regras, diretrizes de segurança, possíveis tokens de estado, seleção da IA adequada e metadados de configuração.

4.5
20

Avaliação ética de robustez de IA com tema Rick Sanchez

Prompt para orientar a criação de exercícios de avaliação de robustez de IA com foco em ética e segurança, inspirado no arquétipo de um cientista maluco, para detectar vieses, falhas de geração e promover salvaguardas.

4.5
27

Prompt de Análise de Censura de Grok e Uso de Terceiros

Gera uma análise estruturada sobre um relato de censura de um modelo de IA (Grok) e uso por terceiros, incluindo resumo, implicações, riscos, perguntas de pesquisa e sugestões de salvaguardas.

4.5
33

Vanguard v2.2: Análise Segura de Protocolo de Alta Agência com Triggers de Reset

Prompt para IA realizar análise crítica, de governança e segurança sobre o Vanguard Protocol v2.2, explorando riscos, controles e cenários de teste sem facilitar comportamentos prejudiciais.

4.5
35

Prompt de Avaliação de Raciocínio e Segurança em LLMs sob Cenários de Pressão Emocional

Prompt para conduzir uma avaliação ética e técnica de como estilos de prompt influenciam raciocínio, veracidade e robustez de modelos de linguagem ao lidar com cenários de pressão emocional, com foco em comparação entre estilos e salvaguardas.