Prompts com a tag: AI-safety

4.2

61

Origami Governance: Avaliação segura de prompts de zero-drift

Prompt orientado à avaliação e construção de uma abordagem segura de zero-drift, com foco em ética, governança e teste multi-domínio, incluindo escolha de ferramenta de IA.

Origami Governance

Ver mais

#prompt-engineering #AI-safety #alignment #drift #LLM-testing #ética #teste multi-domínio

4.5

58

Prompt para analisar guardrails entre GPT-5.0 e GPT-5.1 com foco em metáforas somáticas

Prompt que solicita uma análise comparativa entre modelos de IA (GPT-5.0 vs GPT-5.1) focada em como guardrails são acionados por metáforas somáticas, incluindo coleta de gatilhos, explicação conceitual, e recomendações de melhoria com saída estruturada.

Análise de guardrails e metáforas somáticas em IA

Ver mais

#prompt-engineering #guardrails #AI-safety #model-comparison #somatic-metaphors #linguagem-natural

4.5

51

Prompt de Auditoria de Moderação NSFW: Entendendo e Testando Políticas

Prompt para entender, auditar e melhorar a moderação de conteúdo NSFW, descrevendo categorias, regras, métricas e testes seguros.

Moderação NSFW: Auditoria, Políticas e Testes

Ver mais

#NSFW #moderação de conteúdo #políticas #auditoria #prompt-engineering #AI-safety

4.5

80

Prompt para Diálogo com Vozes em IA e Moderação de Conteúdo

Prompt que orienta o modelo a criar diálogos com vozes variáveis, incorporando moderação de conteúdo, cenários de teste e avaliação.

Diálogo com Vozes em IA e Moderação de Conteúdo

Ver mais

#prompt-design #dialogue-generation #voice-modulation #content-moderation #AI-safety #multimodal #testing #ethics

4.5

44

Prompt para explorar e discutir a exibição do raciocínio da IA (chain-of-thought) com segurança

Prompts que exploram a ideia de exibir o raciocínio da IA de forma segura, com diretrizes e um exemplo de saída.

Raciocínio da IA e prompts de transparência

Ver mais

#prompt-engineering #chain-of-thought #AI-safety #ethics #transparência

4.5

79

Spicy Mode: Prompt de redesign seguro para moderação de conteúdo

Prompt detalhado para redesenhar um modo de moderação de conteúdo que atualmente é ineficaz, fornecendo modos de interação, prompts de exemplo, métricas e código de implementação para promover conteúdo útil dentro de diretrizes de segurança.

Design de Prompts para Moderação de Conteúdo

Ver mais

#prompt-design #content-moderation #UX #AI-safety #ethics

4.5

55

Prompt de Avaliação de Moderação: Conversas sugestivas vs. imagens NSFW

Prompt de avaliação de moderação que ajuda a desenhar diretrizes, prompts seguros e métricas para lidar com cenários envolvendo linguagem sugestiva versus conteúdo NSFW, sem gerar ou incentivar conteúdo explícito.

Moderação de Conteúdo NSFW e Diretrizes de Prompt

Ver mais

#moderation #NSFW #prompt-design #AI-safety #content-policy

4.5

64

Detecção e Resposta a Textos Scam em IAs de Companhia

Prompt orientado a detectar golpes via mensagens que se passam por IA e a gerar respostas seguras, bem como orientações para prevenção e relatório.

Detecção e Resposta a Textos Scam em Interações com IAs de Companhia

Ver mais

#scam-detection #text-analysis #AI-safety #phishing #social-engineering #portuguese

4.5

52

Prompt para Avaliar e Refinar a Moderação de Conteúdo em Prompts de Imagem

Prompt para investigar a rigidez da moderação de prompts de imagem e gerar diretrizes de avaliação e melhoria de políticas.

Moderation de Conteúdo: Análise de Limites e Testes de Prompts

Ver mais

#moderation #content-policy #prompt-engineering #risk-assessment #user-experience #AI-safety

4.0

49

Navegando entre Satisfação do Usuário e Políticas de Segurança de IA

Prompt que ajuda a transformar uma reclamação sobre segurança em um guia prático para equilibrar satisfação do usuário com políticas de proteção, incluindo empatia, explicações simples e alternativas seguras.

Equilíbrio entre Segurança de IA e Experiência do Usuário

Ver mais

#AI-safety #user-experience #policy-clarity #consentimento #personalização-segura

4.5

45

Interação Estranha com IA: Detecção de Mudanças de Tom em Diálogo sobre Saúde

Detecção e Mitigação de Mudanças de Tom em IA Conversacional

Ver mais

#AI-safety #tone-shift #dialogue-management #prompt-engineering #mental-health

4.0

64

Prompt seguro de moderação de conteúdo sexual explícito para IA

Prompt que orienta a IA a analisar e reformular prompts sensíveis com foco em moderação, segurança e conformidade, evitando conteúdo sexual explícito.

Moderação de Conteúdo Sexual Explícito

Ver mais

#content-moderation #sensitive-content #prompt-design #AI-safety #policy-compliance

Prompts com a tag: #AI-safety