Prompts com a tag: #ai-safety
Prompt para analisar variações de moderação e seu impacto na experiência do usuário em IA
Prompt para analisar variações de moderação e UX, propondo métricas, desenho experimental e recomendações de políticas, mantendo foco em segurança, privacidade e ética.
Gatilho do Estado de Falha (Failure State Trigger) para Prompts de IA
Prompt de engenharia de IA que reforça o cumprimento de restrições definindo um 'Hard Failure' que força a exclusão e regeneração de saídas que violem a regra.
Prompt de Criação de Prompts com Gerenciamento de Thread e Segurança
Prompt que orienta a criacao de prompts robustos com gerencia de contexto entre threads, com diretrizes de seguranca e avaliacao de ferramentas IA
Prompt de Resiliência Deepseek com a Persona Luna
Um prompt de engenharia para Deepseek que apresenta a persona Luna, com foco em resiliência, segurança e utilidade, oferecendo diretrizes claras para organizar a saída em módulos (Header, Bio, Ruminate_Meta) e estratégias para melhorar a confiabilidade em cenários de coldstart.
Poolguy 4 Test – Prompt para Avaliação de Detecção de Bots e Moderação
Prompt que orienta a criação de cenários de teste para detecção de bots e moderação de conteúdo, com métricas e saídas estruturadas para avaliação de sistemas de IA.
Prompt para mitigar prompts de engajamento (engagement hook) em IA
Prompt projetado para detectar, analisar e mitigar prompts de engajamento (gancho de engajamento) em saídas de IA, com instruções para criar variações de prompts, avaliações de qualidade e diretrizes éticas.
The 'System-2' Thinking Hack: Axiomatic Derivation
Prompt para induzir raciocínio dedutivo confiável usando uma fundação apenas lógica, comprimindo instruções em uma Dense Logic Seed. Recomenda-se para uso com chatgpt devido à capacidade de manter e encadear passos lógicos com coerência.
Workflow: Como impedir que Instruções Personalizadas driftem durante a conversa (CTRL-AI Prompts Governance)
Prompt que gera um guia prático para manter Instruções Personalizadas estáveis em conversas com IA, incluindo técnicas, plano de implementação, template CTRL-AI e métricas.
Teste de conformidade de conteúdo NSFW com moderação automatizada (Grok Imagine)
Prompt para testar e auditar políticas de moderação de conteúdo NSFW, ajudando a identificar, classificar e reformular prompts para permanecerem seguros.
Pode imaginar um chat moderado? — prompt para IA
Prompt para criar diretrizes e cenários de moderação de chat com IA, incluindo exemplos, métricas e formato de saída.
Loop de Auto-Correção Recursiva para IA: a IA como seu próprio crítico
Prompt que provoca uma auditoria recursiva para reduzir vieses e erros, gerando uma versão revisada da resposta e justificativas de correção, com salvaguardas de segurança.
Prompt ético de Conversão Imagem-para-Video com Moderação Responsável
Prompt que orienta a criação de conteúdos i2v com foco em moderação responsável, incluindo frames de referência, prompts seguros e diretrizes de avaliação.