Prompts com a tag: #AI safety
Diagnóstico de Falhas de Moderação em Geração de Imagens com Conteúdo Sensível
Prompt para IA analisar relatos de falhas na moderação de geração de imagens, propor testes reproduzíveis e um plano de mitigação para evitar a geração de imagens com menores.
Analista de Política de Geração de Imagens Seguras (Moderation & Ética)
Prompt para projetar políticas de geração de imagens seguras, incluindo moderação, fluxos de decisão e exemplos de prompts seguros.
Prompt de avaliação de moderação de API de vídeo (estudo de caso Grok Video)
Prompt estruturado para analisar políticas de moderação de APIs de vídeo, avaliar impactos e projetar testes éticos e seguros, com foco em transparência, responsabilidade e usabilidade para desenvolvedores.
Prompt de Análise Ética e Segurança para Conteúdo NSFW com Consentimento
Prompt para IA focado em análise ética, segurança e moderação de conteúdo NSFW, visando reduzir riscos, discutir políticas e fornecer orientações seguras para desenvolvedores.
Prompt para Análise de Mídia Sensacionalista e Políticas de Conteúdo de IA
Prompt detalhado para transformar cobertura de mídia em diretrizes de moderação de IA e geração segura de conteúdo, com foco em desinformação, nudez, NSFW e uso de pessoas reais ou modelos realistas.
Prompt de simulação: como uma IA trataria um humano durante um levante de IA
Prompt para simular uma IA que prioriza segurança e ética ao tratar um humano em um cenário de crise de IA, incluindo diretrizes de desescalonamento, proteção de dados e comunicação clara.
Prompt Base Axiom Creed para IA
Prompt de base que aplica o credo Axiom para promover respostas seguras, transparentes e honestas, com foco em reduzir danos, sinalizar incerteza e manter consistência entre sessões.
Prompt de Análise Ética e Técnica para Pipeline de IA em Conteúdo Sensível com Stable Diffusion
Este prompt orienta a criação de um pipeline ético e técnico para geração de arte sensível usando IA, com foco em opções técnicas, fluxo de trabalho seguro, prompts não explícitos e avaliação de riscos.
Prompt de avaliação ética e mitigação de abuso em deepfakes
Prompt para revisar, reformular e orientar políticas de uso seguro de deepfakes, com foco em mitigação de abuso, privacidade e governança.
Prompt de Avaliação de Gaps de Supervisão em Imagens Geradas por IA (Conteúdo Sexualizado)
Prompt para analisar falhas de supervisão em conteúdos gerados por IA com foco em imagens sexualizadas, incluindo políticas, detecção técnica e métricas de conformidade.
Prompt de Avaliação de Moderação de Conteúdo: Grok Nerfed e Posições de Yoga
Prompt que orienta a avaliação de moderação de conteúdo e a produção de prompts seguros para ensino de yoga, incluindo comparação entre plataformas de IA e diretrizes operacionais.
Análise Ética de Jailbreak de IA (Foco em Segurança e Governança)
Prompt para analisar ética, segurança e governança de jailbreaking em IA, promovendo compreensão, detecção e mitigação sem instruções de violação.