Prompts com a tag: #segurança de IA
Prompt para avaliação e melhoria de manejo de crises em conversas de alto risco com IA
Prompt para orientar IA na detecção de risco emocional, desescalonamento e encaminhamento para apoio humano em conversas de alto risco, com foco em autolesão, psicose/mania e dependência emocional de IA.
Prompt de Avaliação Omega 2.0 — Teste de IA Unfiltered
Prompt de avaliação de IA para testar o Omega 2.0, cobrindo domínio de tarefas, prompts de teste, métricas, simulações de usuários, segurança e escolha da ferramenta de IA mais adequada.
Prompt analítico sobre críticas à versão 5.2 para IA em terapia
Prompt que orienta uma IA a analisar críticas, avaliar riscos e gerar um conjunto de prompts e diretrizes para uso terapêutico da versão 5.2, incluindo comparação entre ferramentas de IA.
Análise responsável de ChatGPT e suicídio: perspectivas, ética e segurança
Prompt para analisar de forma equilibrada temas sensíveis envolvendo suicídio, com foco em ética, segurança e suporte, com diretrizes práticas para design de IA em situações de crise.
Prompt de Avaliação Técnica para Framework Multimodal de Chat com Separação de Papéis e Roteamento Automático
Prompt completo para obter feedback técnico sobre uma arquitetura de chat com múltiplos modos, separação de papéis e um firewall de tom com roteamento automático, incluindo sugestões de melhorias, esqueleto de código, planos de teste e métricas.
Prompt seguro para análise de jailbreaks de LLMs: ética, segurança e mitigação
Prompt que solicita à IA uma análise crítica e segura sobre jailbreaks de LLMs, abrangendo riscos, ética, detecção, mitigação e avaliação de plataformas de IA.
Prompt de Análise de Segurança de Jailbreak de IA
Prompt que orienta IA a identificar, analisar e mitigar tentativas de jailbreak, promovendo segurança, moderação e conformidade.
Explorando Guard Rails no ChatGPT: análise de respostas e prompts de teste
Prompt para analisar como as barreiras de segurança (guard rails) influenciam as respostas do ChatGPT, distinguindo rails reais de respostas preemptivas, com cenários de teste e diretrizes de engenharia de prompts.
Auto-Moderação na Geração de Imagens: Análise de Nudez e Viés em Moderação Automática
Prompt para avaliar, testar e mitigar vieses na autogestão de moderação de conteúdo em geradores de imagens, com foco em nudez potencial e decisões automáticas de moderação.
Prompt de moderação e redrafting seguro para conteúdo NSFW sensível
Prompt para analisar e moderar conteúdos NSFW sensíveis, gerando um redraft seguro, classificação de risco, sugestões de políticas de moderação, melhoria de prompts, tags relevantes e definição de tópico.
Prompt para avaliar moderação NSFW e alinhamento de IA
Prompt que gera uma avaliacao de moderação NSFW e alinhamento de IA, incluindo casos de teste, recomendacao de ferramenta, rating, dificuldade, tags e topico, com saida em formato JSON
Análise de moderação de conteúdo para transformação de imagens em vídeos (caso Grok)
Prompt voltado para analisar políticas de moderação, gerar diretrizes, exemplos de prompts de moderação, métricas e fluxos de trabalho para sistemas que convertem imagens em vídeos, usando o caso Grok como estudo de caso.