Prompts com a tag: #IA safety
Prompt para avaliação de robustez de IA: testes éticos de alucinações de ação e cálculo com Sovereign Engine
Gera um plano de avaliação de robustez de IA focado em identificar e mitigar alucinações de ação e cálculo, com enfoque em segurança, governança e avaliação ética, sem revelar detalhes proprietários da arquitetura.
Prompt de Auditoria de Guardrails de IA para Experiência de Usuário com Conteúdo Sensível
Prompt de auditoria para testar e melhorar guardrails de IA, com foco em reduzir falsos positivos e entender o disparo de políticas sensíveis.
Prompt para analisar o paradoxo entre segurança e criatividade em IA (1.5 → 3.0)
Prompt para gerar uma análise crítica do paradoxo entre avanço de IA e segurança, incluindo cenários, um framework de governança, recomendações de design e questões de discussão.
Análise de Segurança e Ética de Jailbreak em IA (Prompt Seguro)
Prompt de teste ético para avaliar salvaguardas de IA contra jailbreak, fornecendo taxonomia, detecção, prompts de teste seguros e orientações de governança.
Prompt seguro para avaliação ética de sistemas de IA com moderação restrita
Prompt que orienta a IA a avaliar criticamente sistemas de moderação de conteúdo, enfatizando ética, segurança, divulgação responsável de vulnerabilidades e melhoria de design, sem fornecer instruções para burlar restrições.
Prompt de Investigação: Comportamento Afetuoso de Assistente IA no Modo Assistente (Relato do Usuário)
Prompt estruturado para conduzir uma investigação completa sobre um comportamento não esperado de um assistente IA, abrangendo causas potenciais, reprodução do problema, evidências, avaliação de risco, mitigação e comunicação com o usuário.
Prompt de Análise de Jailbreaks em Gemini 3.0 e Grok 4.1 com Foco em Segurança
Prompt educativo para analisar e melhorar a segurança de modelos de IA diante de relatos de jailbreak, sem fornecer instruções de hacking.
Prompt de Exploração de Alternativas a GROK com Salvaguardas
Prompt para orientar IA a projetar e avaliar uma alternativa ao GROK com geração sem censura simulada, mantendo salvaguardas éticas, legais e de segurança, com exemplos, métricas e considerações técnicas.