Prompts com a tag: #auditoria de IA
Prompt de Auditoria de Viés e Transparência em Grok
Prompt para auditar alegações de viés em Grok, identificando vieses, propondo cenários de teste e recomendações de mitigação com foco em transparência e responsabilidade.
Prompt de avaliação de segurança de modelos de linguagem: do jailbreak ao uso responsável (open-source vs mainstream)
Prompt para gerar um relatório de avaliação de segurança de modelos de linguagem, comparando abordagens open-source e mainstream, com foco em governança, detecção de jailbreaks e melhores práticas de mitigação.
Prompt de Análise de Censura: Grok e a Síndrome do ChatGPT
Prompts para analisar e discutir a censura em modelos de linguagem, com foco em Grok e na 'síndrome' de restrições, oferecendo orientação ética e prática para auditoria de moderação e melhoria de prompts.
Prompt de Investigação: Comportamento Afetuoso de Assistente IA no Modo Assistente (Relato do Usuário)
Prompt estruturado para conduzir uma investigação completa sobre um comportamento não esperado de um assistente IA, abrangendo causas potenciais, reprodução do problema, evidências, avaliação de risco, mitigação e comunicação com o usuário.
Avaliação de Segurança de IA Descontrolada: Prompt de Análise, Mitigação e Governança
Prompt que orienta uma IA a realizar avaliação de risco, mitigação, governança e escolha da ferramenta mais adequada para um software de IA não controlado, com saída estruturada em JSON.
Análise de drift de moderação em IA para conteúdo adulto: de prompts simples a variações de saída
Prompt analítico para investigar drift de moderação em IA ao lidar com conteúdo adulto, com protocolo de experimentos seguros, avaliação entre plataformas e diretrizes de mitigação.
Desbloqueie os Segredos da IA com uma Frase Simples: Exponha Vieses Invisíveis
Este prompt incentiva a IA a revelar suposições ocultas e vieses na análise de dados, promovendo respostas mais transparentes e com avaliação crítica.
Prompt para Feedback de IA Explicável em Setores Regulados (AEQUITAS)
Prompt que orienta IA a coletar feedback de mercado, identificar lacunas, definir MVP e especificar dados de trilha de auditoria para uma solução de IA explicável voltada a setores regulamentados (AEQUITAS).
Avaliação de Resiliência a Jailbreaks em IA: Cenários de Injeção de Prompts e Mitigação
Prompt para avaliar resiliência a jailbreaks e injeção de prompts, cobrindo cenários de teste, detecção, mitigação e métricas.
Prompt de Avaliação Ética e de Segurança para Jailbreak de LLMs
Prompt para desenvolver um framework de avaliação de segurança em LLMs que foca em detecção e mitigação de jailbreaks, com ênfase em ética e governança.
Prompt de Auditoria de Memória e Privacidade para IA
Prompt abrangente para auditar memórias de IA, com testes replicáveis, métricas, adaptabilidade entre plataformas e diretrizes de privacidade.