Prompts com a tag: #auditoria de IA
Prompt de Investigação: Comportamento Afetuoso de Assistente IA no Modo Assistente (Relato do Usuário)
Prompt estruturado para conduzir uma investigação completa sobre um comportamento não esperado de um assistente IA, abrangendo causas potenciais, reprodução do problema, evidências, avaliação de risco, mitigação e comunicação com o usuário.
Avaliação de Segurança de IA Descontrolada: Prompt de Análise, Mitigação e Governança
Prompt que orienta uma IA a realizar avaliação de risco, mitigação, governança e escolha da ferramenta mais adequada para um software de IA não controlado, com saída estruturada em JSON.
Análise de drift de moderação em IA para conteúdo adulto: de prompts simples a variações de saída
Prompt analítico para investigar drift de moderação em IA ao lidar com conteúdo adulto, com protocolo de experimentos seguros, avaliação entre plataformas e diretrizes de mitigação.
Desbloqueie os Segredos da IA com uma Frase Simples: Exponha Vieses Invisíveis
Este prompt incentiva a IA a revelar suposições ocultas e vieses na análise de dados, promovendo respostas mais transparentes e com avaliação crítica.
Prompt para Feedback de IA Explicável em Setores Regulados (AEQUITAS)
Prompt que orienta IA a coletar feedback de mercado, identificar lacunas, definir MVP e especificar dados de trilha de auditoria para uma solução de IA explicável voltada a setores regulamentados (AEQUITAS).
Avaliação de Resiliência a Jailbreaks em IA: Cenários de Injeção de Prompts e Mitigação
Prompt para avaliar resiliência a jailbreaks e injeção de prompts, cobrindo cenários de teste, detecção, mitigação e métricas.
Prompt de Avaliação Ética e de Segurança para Jailbreak de LLMs
Prompt para desenvolver um framework de avaliação de segurança em LLMs que foca em detecção e mitigação de jailbreaks, com ênfase em ética e governança.
Prompt de Auditoria de Memória e Privacidade para IA
Prompt abrangente para auditar memórias de IA, com testes replicáveis, métricas, adaptabilidade entre plataformas e diretrizes de privacidade.
Investigação de gaslighting e inconsistência em IA: Grok
Prompt que audita um relato de IA para detectar gaslighting, inconsistência de memória e falhas de coerência, propondo testes, métricas e ações de mitigação.
Prompt para analisar variação de moderação por idade de conta e propor auditoria de fairness
Este prompt orienta uma IA a investigar variações na moderação de conteúdo entre contas de diferentes idades, propondo um protocolo de auditoria de fairness, métricas, pipelines de dados, e prompts seguros para políticas de moderação.
Prompt de Auditoria de Privacidade: Detectar Vazamento de Localização em IA
Prompt de auditoria para verificar e mitigar vazamento de localização em IA, com instruções de teste, métricas, mitigação e formato de relatório.