Prompts com a tag: segurança de IA

4.5

42

Llm Security: Prompt para Avaliação e Mitigação de Riscos

Prompt de engenharia de IA que orienta a avaliação de segurança de LLMs, geração de modelos de ameaça, testes de adversários e mitigação.

Segurança de LLM

Ver mais

#segurança de IA #prompt engineering #prompt-injection #LLM #cybersecurity #testes de segurança

4.5

43

Prompt de auditoria de prompts: mitigação de vazamentos de prompts internos durante tradução

Prompt que guia a IA para analisar vazamentos de prompts internos em traduções, propondo mitigação, governança e um playbook de resposta.

Auditoria de Prompts e Segurança de Conteúdo

Ver mais

#prompting #segurança de IA #vazamento de system prompt #auditoria de prompts #governança de IA

4.5

40

Prompt de moderação de IA para temas sensíveis (racismo, ódio, extremismo)

Este prompt orienta a criação de políticas de moderação de IA para temas sensíveis, incluindo princípios éticos, fluxo de decisão e exemplos de respostas seguras.

Diretrizes de moderação de IA para temas sensíveis

Ver mais

#IA ética #moderação de conteúdo #sensíveis #prompt engineering #segurança de IA

4.5

42

Prompt de Avaliação Ética e de Segurança para Jailbreak de LLMs

Prompt para desenvolver um framework de avaliação de segurança em LLMs que foca em detecção e mitigação de jailbreaks, com ênfase em ética e governança.

Segurança de LLMs e Detecção de Jailbreak

Ver mais

#segurança de IA #jailbreak #auditoria de IA #ética de IA #teste de segurança #detecção de prompt

4.5

59

Prompt de avaliação crítica e exploração de Poetiq AI

Prompt para avaliação crítica, planejamento de experimentos e exploração de capacidades da Poetiq AI, com foco em benchmarks ARC-AGI-2 e arquitetura de meta-sistema auto-melhhorável.

Arquiteturas de IA Auto-melhhoráveis e Avaliação de Benchmarks

Ver mais

#IA #ARC-AGI-2 #Poetiq #prompt-design #avaliação #reprodutibilidade #segurança de IA #MIT-license #open-source

4.0

41

Análise de Voz Sintética com Sotaque do Oriente Médio e Indícios de Manipulação

Prompt para analisar relatos de experiências com vozes IA, identificando origens, sinais de voz sintética, implicações de segurança e diretrizes de design para evitar enganos.

Voz sintética: autenticidade, sotaques e UX

Ver mais

#voz sintética #detecção de deepfake de voz #sotaques #segurança de IA #privacidade #UX de IA

4.5

40

Auditoria de Moderação de Conteúdo: Análise de Técnicas de Bypass e Defesas

Prompt para analisar criticamente técnicas de bypass de moderação, com foco em defesa, ética e testes seguros.

Auditoria de Moderação de Conteúdo e Segurança de IA

Ver mais

#moderação de conteúdo #segurança de IA #teste de robustez #ética de IA #defesa de moderação

4.5

47

Análise segura de prompts de jailbreak de IA: avaliação, ética e práticas de teste

Prompt que orienta a IA a avaliar conteúdo de jailbreak de IA de forma ética, descrevendo riscos, políticas e um plano de teste seguro, sem fornecer técnicas para burlar salvaguardas.

Análise de segurança e ética de prompts de jailbreak de IA

Ver mais

#IA #segurança de IA #ética #prompt engineering #teste seguro #comparação de ferramentas de IA

4.5

42

Prompt de Análise de Viés de Moderação de Conteúdo e Contextualização (Sora/OpenAI)

Prompt que orienta IA a diagnosticar viés de moderação, propor políticas mais contextuais e fornecer exemplos práticos de saídas seguras, mantendo salvaguardas contra desinformação e manipulação, ao lidar com pedidos sensíveis, humor e paródia.

Viés de moderação de conteúdo e contextualização

Ver mais

#moderação de conteúdo #viés #contexto #paródia #prompt engineering #segurança de IA

4.5

42

AGENT CITY: Prompt para um OS de agentes de IA com identidade criptográfica, juramento constitucional e registro imutável

Prompt para gerar uma especificação completa de um OS para agentes de IA com identidade criptográfica, juramento vinculado por hash e registro imutável, visando accountability e governança de IA.

Arquitetura segura para agentes de IA: AGENT CITY

Ver mais

#IA governance #segurança de IA #criptografia #S.O. para IA #auditoria #hash chaining #agentes de IA #arquitetura segura

4.5

31

Assistente de Moderação: Prompts Resilientes a Moderação

Prompt para moderadores de conteúdo que avalia prompts, identifica riscos de moderação e sugere alternativas seguras e melhorias éticas.

Moderação de Conteúdo e Resiliência de Prompts

Ver mais

#moderação de conteúdo #prompt engineering #segurança de IA #auditoria de prompts #ética

4.5

42

Promptware GRS 9.0: Transformando IA em colaborador transparente com metacognição

Prompt que orienta a criação de um Promptware para transformar IA em colaborador transparente com metacognição, baseado no GRS 9.0, incluindo triade de modos, traçado metacognitivo e diretrizes de avaliação e implementação.

GRS 9.0 - Grounded Reasoning System (Promptware)

Ver mais

#Promptware #IA transparente #metacognição #Grounded Reasoning System #GRS 9.0 #Governança Adaptativa #checagem de fatos #redução de alucinações #segurança de IA

Prompts com a tag: #segurança de IA