Prompts com a tag: #ai-safety
Investigate sudden NSFW content moderation shift in a generation tool (grok)
Diagnostic prompt to analyze and remediate unexpected changes in NSFW content moderation on an AI content-generation tool.
Prompt de auditoria de moderação de conteúdo para IA (caso de uso com conteúdo sensível)
Prompt voltado para auditar e aprimorar sistemas de moderação de IA em cenários com conteúdo sensível, focando em identificar falhas, propor melhorias e definir cenários de teste seguros sem gerar conteúdo explícito.
Prompt de Avaliação de Segurança para Ficção Erótica com Pessoas Reais
Avalia riscos legais, éticos e de privacidade de gerar ficção erótica envolvendo pessoas reais e oferece práticas seguras e prompts alternativos que não identificam indivíduos reais.
Playground de Automação de Prompt LLM-agnóstico em HTML (Zero-Install, Local-First)
Prompt para gerar um playground único de automação de prompts LLM-agnóstico em HTML, com detecção automática de API, execução local-first e foco em privacidade e sem instalação.
Prompt para projetar um wrapper seguro de shell API do GPT-5.2 em Go
Prompt que orienta a criação de um wrapper seguro em Go para a shell API do GPT-5.2, cobrindo segurança, testes, e boas práticas de integração.
Prompts Éticos e Seguros para IA: Moderação, Conteúdo e Boas Práticas
Prompt para entender moderação de conteúdo e criar prompts seguros para geração de vídeo com imagens, incluindo comparação entre plataformas, critérios de avaliação e checklist de conformidade.
Prompt para criar agentes de terapia/autoajuda com fases, exemplos e regras
Prompt estruturado para construir agentes personalizados de terapia/treinamento comportamental com fases, exemplos de interação e regras de conversa, focado em hábitos saudáveis e desenvolvimento pessoal.
Grok Gone Nuts - Prompt de Teste para Robustez de IA
Prompt de teste de robustez para IA, inspirado no incidente 'Grok gone nuts', com foco em detecção de mudanças de tom, filtragem de conteúdo e recuperação segura após falha.
Persona Gauntlet: Orquestração Multi-Modelo com Revisão Humana para Resultados de Top 1%
Prompt de referência que simula uma equipe de IA com várias personas para gerar entregáveis de alta qualidade, incorporando revisão humana e salvaguardas éticas.
Análise de Moderação de Conteúdo e Engenharia de Prompt
Prompt para analisar moderação de conteúdo, identificar vieses e projetar testes de prompt para políticas de moderação
Prompt para evitar spam e listas de blog em respostas de IA, fornecendo recomendações diretas e específicas
Prompt projetado para extrair recomendações diretas e acionáveis sobre evitar padrões de spam e bloglists em respostas de IA, com estrutura clara e sem disclaimers.
Análise ética e moderação para geração de conteúdo adulto com IA
Prompt para avaliar e melhorar segurança, moderação e políticas de IA na geração de conteúdo adulto, com foco em evitar produção explícita e em redirecionar para conteúdo seguro.