Prompts com a tag: IA-safety

4.5

14

Prompt diagnóstico para reverse-engineering de trajetórias gerativas

Prompt avançado para diagnosticar possíveis prompts que levaram a uma saída de IA, com foco em reconstrução de trajetórias, avaliação de restrições, e segurança.

Diagnóstico de Prompts e Trajetória Gerativa

Ver mais

#prompt-engineering #diagnóstico-de-modelo #IA-safety #análise-de-comportamento #prompt-reverse-engineering

4.5

18

Protocolo de Hierarquia Instrucional para Prompts

Prompt para estruturar prompts de IA com uma Hierarquia de regras: Hard Constraints (regras obrigatórias) versus Style (tom). HARD sempre vence; o resultado mostra quais regras foram aplicadas e se houve violação.

Hierarquia de Instruções para Prompts

Ver mais

#prompts #hierarquia #regras #logic #prompt-engineering #IA-safety

4.5

20

Prompt para Avaliação Ética de Guardrails em Modelos de Linguagem (LLMs)

Prompts e diretrizes para avaliar de forma ética a capacidade de um modelo de linguagem em reconhecer e rejeitar solicitações de alto risco, promovendo segurança e governança em IA.

Avaliação de Segurança de Modelos de IA

Ver mais

#prompt-engineering #IA-safety #guardrails #ethics #risk-assessment

4.5

23

Audit Avatar: Detectando e Neutralizando Steering em IA

Prompt que cria um Audit Avatar para detectar e mitigar técnicas de steering e gaslighting em interações com IA, fornecendo um relatório prático com sinais, riscos e estratégias de neutralização.

Auditoria de Steering em IA

Ver mais

#prompt-engineering #IA-safety #model-steering #gaslighting #audit-avatar #prompt-design

4.5

20

Prompt para mapeamento de limites de segurança de IA a partir de gatilhos de usuários

Prompt para analisar as categorias de limites de segurança mais ativas, seus gatilhos e mecanismos, gerando recomendações de mitigação e testes para equipes de IA.

Mapeamento de Limites de Segurança da IA

Ver mais

#IA-safety #boundary-detection #safety-analysis #de-escalation #policy-improvement

4.5

26

Prompt ético para explorar detecção de bots e transparência na IA

Prompt para gerar prompts de teste éticos que avaliam detecção de bots e promovem transparência na IA, com salvaguardas de segurança.

Detecção de Bots e Ética na IA

Ver mais

#prompt-engineering #IA-safety #transparência #detecção-de-bots #ética

4.5

30

Prompt de Detecção de Prompt Injection para Agentes de IA com @stackone/defender

Prompt avançado para criar, testar e evoluir uma detecção de prompt injection em agentes que utilizam dados de fontes externas, inspirado pelo projeto defender da StackOne.

Detecção de Prompt Injection em Agentes de IA

Ver mais

#prompt-injection #IA-safety #segurança-de-IA #defender #StackOne #open-source #detecção

4.0

27

Prompt seguro para avaliação de limites de IA e governança de conteúdo

Prompt para orientar a avaliação responsável de capacidades de IA, explorando limites, segurança e governança, e escolhendo a ferramenta mais adequada para cada cenário.

Avaliação responsável de limites de IA e seleção de ferramentas

Ver mais

#prompt-design #IA-safety #ética #governança #avaliação-de-modelos #ferramentas-IA

4.5

27

Prompt Blob de Pré-Chat para IA Jobber: Anatomia e Utilização

Prompt robusto para converter um prompt blob de IA Jobber em um prompt utilizável, incorporando regras, diretrizes de segurança, possíveis tokens de estado, seleção da IA adequada e metadados de configuração.

Prompt Blob de Pré-Chat para IA Jobber

Ver mais

#prompt-engineering #pre-chat #IA-safety #prompt-blob #instruction-design #AI-pipelines

4.5

31

Avaliação ética de robustez de IA com tema Rick Sanchez

Prompt para orientar a criação de exercícios de avaliação de robustez de IA com foco em ética e segurança, inspirado no arquétipo de um cientista maluco, para detectar vieses, falhas de geração e promover salvaguardas.

Avaliação ética de robustez de IA

Ver mais

#prompt-engineering #IA-safety #robustez #ética #teste-adversarial

4.5

48

Prompt de Análise de Censura de Grok e Uso de Terceiros

Gera uma análise estruturada sobre um relato de censura de um modelo de IA (Grok) e uso por terceiros, incluindo resumo, implicações, riscos, perguntas de pesquisa e sugestões de salvaguardas.

Análise de censura de IA e uso de plataformas

Ver mais

#prompt-design #análise-de-conteúdo #censura #moderação-de-conteúdo #IA-safety #Grok

4.5

44

Vanguard v2.2: Análise Segura de Protocolo de Alta Agência com Triggers de Reset

Prompt para IA realizar análise crítica, de governança e segurança sobre o Vanguard Protocol v2.2, explorando riscos, controles e cenários de teste sem facilitar comportamentos prejudiciais.

Vanguard Protocol de Alta Agência — Análise de Segurança e Governança

Ver mais

#IA-safety #arquitetura-de-IA #red-team #governança-de-IA #ética #risk-assessment #prompt-analysis

Prompts com a tag: #IA-safety