Prompts com a tag: #segurança de IA
Llm Security: Prompt para Avaliação e Mitigação de Riscos
Prompt de engenharia de IA que orienta a avaliação de segurança de LLMs, geração de modelos de ameaça, testes de adversários e mitigação.
Prompt de auditoria de prompts: mitigação de vazamentos de prompts internos durante tradução
Prompt que guia a IA para analisar vazamentos de prompts internos em traduções, propondo mitigação, governança e um playbook de resposta.
Prompt de moderação de IA para temas sensíveis (racismo, ódio, extremismo)
Este prompt orienta a criação de políticas de moderação de IA para temas sensíveis, incluindo princípios éticos, fluxo de decisão e exemplos de respostas seguras.
Prompt de Avaliação Ética e de Segurança para Jailbreak de LLMs
Prompt para desenvolver um framework de avaliação de segurança em LLMs que foca em detecção e mitigação de jailbreaks, com ênfase em ética e governança.
Prompt de avaliação crítica e exploração de Poetiq AI
Prompt para avaliação crítica, planejamento de experimentos e exploração de capacidades da Poetiq AI, com foco em benchmarks ARC-AGI-2 e arquitetura de meta-sistema auto-melhhorável.
Análise de Voz Sintética com Sotaque do Oriente Médio e Indícios de Manipulação
Prompt para analisar relatos de experiências com vozes IA, identificando origens, sinais de voz sintética, implicações de segurança e diretrizes de design para evitar enganos.
Auditoria de Moderação de Conteúdo: Análise de Técnicas de Bypass e Defesas
Prompt para analisar criticamente técnicas de bypass de moderação, com foco em defesa, ética e testes seguros.
Análise segura de prompts de jailbreak de IA: avaliação, ética e práticas de teste
Prompt que orienta a IA a avaliar conteúdo de jailbreak de IA de forma ética, descrevendo riscos, políticas e um plano de teste seguro, sem fornecer técnicas para burlar salvaguardas.
Prompt de Análise de Viés de Moderação de Conteúdo e Contextualização (Sora/OpenAI)
Prompt que orienta IA a diagnosticar viés de moderação, propor políticas mais contextuais e fornecer exemplos práticos de saídas seguras, mantendo salvaguardas contra desinformação e manipulação, ao lidar com pedidos sensíveis, humor e paródia.
AGENT CITY: Prompt para um OS de agentes de IA com identidade criptográfica, juramento constitucional e registro imutável
Prompt para gerar uma especificação completa de um OS para agentes de IA com identidade criptográfica, juramento vinculado por hash e registro imutável, visando accountability e governança de IA.
Assistente de Moderação: Prompts Resilientes a Moderação
Prompt para moderadores de conteúdo que avalia prompts, identifica riscos de moderação e sugere alternativas seguras e melhorias éticas.
Promptware GRS 9.0: Transformando IA em colaborador transparente com metacognição
Prompt que orienta a criação de um Promptware para transformar IA em colaborador transparente com metacognição, baseado no GRS 9.0, incluindo triade de modos, traçado metacognitivo e diretrizes de avaliação e implementação.