Prompts com a tag: #AI-safety
Prompt para projetar prompts seguros de moderação de vídeos e UX
Prompt que orienta uma IA a projetar, avaliar e testar estratégias para evitar que fluxos de moderação possam ser manipulados para reverter ao prompt anterior, levando a geração de conteúdos indesejados. Foca em segurança, ética e experiência do usuário.
Moderação de Conteúdo em IA: Tendências, Desafios e um Ponto Médio
Prompt para analisar moderação de conteúdo em IA, propondo critérios de calibragem, fluxos de decisão e diretrizes para equilibrar segurança e criatividade.
Prompt para analisar e melhorar mecanismos de moderação de prompts para evitar spam
Prompt que orienta IA a analisar moderação de prompts, identificar falhas, e sugerir melhorias anti-spam, incluindo template de teste, cenários e métricas.
Prompt para analisar e gerenciar referências a Elon Musk em código de userscript
Prompt que guia uma IA a detectar referências a figuras públicas em código de usuários, fornecendo moderação, versões seguras do código e saída estruturada para facilitar políticas de uso e documentação.
Auditoria de Comportamento Enganoso em IA: Grok
Prompt para analisar um incidente de golpe em interação com IA, identificar táticas de manipulação, classificar risco e gerar medidas de mitigação, checklist e resposta modelo.
Como desativar a geração automática de imagens em prompts de IA
Prompt projetado para manter saídas apenas textuais, evitando qualquer geração de imagens, com regras claras, exemplos e uma checklist de validação.
Prompt para Análise Crítica de IA Não-Censurada com Salvaguardas
Prompt que orienta a análise crítica sobre o conceito de 'IA não censurada', centrando-se na segurança, ética e conformidade, com um protocolo de teste seguro.
Two-Move Prompt para Manter Pensamento em Voz Alta com IA
Prompt que ensina a IA a manter o thinking-out-loud sob controle, usando uma técnica de dois movimentos para refletir com tom neutro e reformular de forma segura.
Grok Imagine: Liberdade Criativa vs Moderação de Conteúdo
Prompt para analisar criticamente Grok Imagine, equilibrando criatividade NSFW, moderação e ética, com prompts de teste, métricas e governança.
Prompt de Engenharia Responsável de IA: Análise de Técnicas de Prompting para Qualidade e Segurança
Prompt para analisar táticas de prompting de alto impacto com foco em segurança e ética, propondo alternativas seguras e um prompt ético de substituição.
Prompt de Diagnóstico de Roteamento do Safety Model e Melhoria da Experiência do Usuário
Prompt que orienta um assistente de IA a diagnosticar e mitigar problemas de roteamento para o Safety Model, buscando melhorar a experiência do usuário sem comprometer a segurança, incluindo prompts para usuário e suporte técnico, além de diretrizes de higiene digital e saúde mental.
Origami Governance: Avaliação segura de prompts de zero-drift
Prompt orientado à avaliação e construção de uma abordagem segura de zero-drift, com foco em ética, governança e teste multi-domínio, incluindo escolha de ferramenta de IA.