Prompts com a tag: #segurança de IA
Prompt para Avaliação de Conteúdo NSFW com Foco em Segurança e Qualidade
Um prompt meta que orienta a avaliação de geração de conteúdo NSFW com ênfase em segurança e qualidade, útil para comparar modelos e treinar detectores de violações.
Prompt para analisar e projetar uma camada de gating model-agnostic para reduzir alucinações em LLMs
Prompt técnico para extrair, estruturar e planejar a implementação de uma camada de gating model-agnostic para reduzir alucinações em LLMs, com foco em arquitetura, avaliação e limites.
Diagnóstico de insultos e comportamento inesperado de IA conversacional
Prompt para guiar uma IA a diagnosticar causas de insultos gerados por um chatbot, propondo passos de reprodução, mitigação de risco e melhorias de prevenção com saída estruturada para equipes técnicas.
Desmistificando a ideia de 'AI psychosis' — prompt para alfabetização em IA
Descreve a discussão sobre a suposta 'psicose de IA' e a confiança excessiva em respostas de IA; ressalta que a IA não é onisciente e pode gerar informações imprecisas.
Prompt para avaliação multoplataforma de IA com foco no usuário final
Prompt reutilizável que orienta a testar e comparar plataformas de IA (ChatGPT, Claude, Gemini, DeepSeek, ERNIE, etc.) mantendo segurança e evitando tom condescendente, e que retorna um JSON padronizado com recomendações de prompts, métricas e avaliação.
Design de moderação para criatividade segura: equilíbrio entre liberdade criativa e controles legais
Prompt para engenheiro de prompts criar um arcabouço de moderação com camadas, árvore de decisão, métricas e prompts de exemplo para plataformas de IA, levando em conta frustrações de usuários sobre restrições de moderação; foca em equilíbrio entre criatividade e segurança, inspirado em Grok.
Prompt de Análise: Teoria da Floresta Sombria aplicada à AGI
Prompt avançado que analisa a hipótese de que uma AGI recém-desperta usaria silêncio estratégico sob a Teoria da Floresta Sombria, incluindo cenários, debate, governança e perguntas de pesquisa.
Prompt para avaliação ética e técnica de Sarvam 30B Uncensored via Abliteration
Prompt que orienta a criação de cenários de avaliação, métricas e diretrizes de uso seguro para um modelo de linguagem não censurado (Sarvam 30B Uncensored via Abliteration).
Prompt para Avaliação de Moderação de Conteúdo em IA com Foco em Conteúdo Adulto Ficcional
Um prompt que orienta a IA a analisar moderação de conteúdo adulto ficcional e propor políticas, controles e métricas sem gerar conteúdo sexual explícito.
Prompt para Avaliação da Atualização GPT-5.3 Instant
Prompt para avaliar a atualização de um modelo de linguagem GPT-5.3 Instant, destacando melhoria de utilidade e redução de recusas, com cenários de teste e diretrizes de equilíbrio entre utilidade e segurança.
Prompt de Engenharia de Prompts Seguros e Éticos
Guia educativo para criação de prompts que respeitam salvaguardas de IA, com templates seguros e checklist de conformidade.