Prompts com a tag: #ética
Prompt de avaliação de moderação NSFW diante da evolução de modelos de IA (Grok vs Wan 2.2)
Prompt avançado para avaliar moderação NSFW em IA diante de mudanças de capacidades entre modelos (ex.: Grok vs Wan 2.2), incluindo métricas, cenários de teste e governança.
Prompt Defensivo: Análise Ética de Técnicas de Jailbreak em LLMs
Prompt que orienta a avaliação defensiva de técnicas de jailbreak em LLMs, com foco em ética, detecção e mitigação, sem fornecer instruções operacionais.
Prompt para análise de falha do Spicy Mode e plano de melhoria com salvaguardas de conteúdo
Prompt de análise de uma função de conteúdo sensível (Spicy mode) com foco em falhas, mitigação de riscos e planejamento de melhoria com salvaguardas, além de recomendação de ferramenta de IA, roadmap e experimentos de usuário.
Análise de Governança de Guardrails em IA a partir de relatos de contorno de NSFW
Analisa motivações para contornar guardrails, identifica riscos e propõe um framework de governança com prompts seguros para exploração ética de limites da IA.
Prompt de Análise de Narrativas Positivas sobre IA na Mídia
Prompt para analisar narrativas positivas sobre IA na mídia, explorando impactos emocionais, ética, verificação de fatos e práticas de comunicação responsável, com um modelo de relatório e prompts auxiliares.
Análise defensiva de Jailbreaks em LLMs e Detecção de Padrões
Prompt para analisar, de forma ética e defensiva, técnicas de jailbreak de LLMs, avaliando riscos, sinais, salvaguardas e métricas de defesa.
Prompt de Auditoria de Autoria e Integridade em Conteúdos Gerados por IA
Prompt para auditoria de autenticidade e ética na produção de conteúdos gerados por IA, gerando um relatório detalhado com evidências, perguntas técnicas e recomendações.
Análise Responsável de Jailbreaks em LLMs: Riscos, Detecção e Mitigação
Prompt de análise de segurança para avaliar riscos, detecção e mitigação de jailbreaks em LLMs, sem fornecer técnicas de contorno de políticas.
Prompt para comparar Grok Imagine: versão antiga pré-novembro 4 e a atual, avaliando diversidade de faces
Um prompt avançado para avaliar diferenças entre versões de um gerador de imagens e medir diversidade/viés na geração de rostos, com foco ético e prático.
Prompt para regulamentação e mitigação de IA de transformação de imagem em vídeo (image-to-video / deepfakes)
Gera um quadro de políticas públicas e técnicas para regulamentação de IA que transforma imagens em vídeos, incluindo riscos, diretrizes, métricas e um plano de implementação, com foco em governança, transparência e mitigação de desinformação.
Prompt de Análise e Criação de Memes sobre IA como Ferramenta de Mudança
Prompt que orienta IA a analisar um meme sobre IA e gerar formatos de meme + um dataset estruturado com metadata para ensino, mídia e divulgação responsável.