Prompts com a tag: #auditoria de IA
Concedendo agência a modelos antes de entender o controle: prompt de avaliação e governança de IA
Prompt avançado para explorar governança de agentes de IA, cobrindo abstrações, falhas potenciais, estruturas de controle, métricas e artefatos de auditoria.
Investigação de Inconsistências na Censura de Prompts de Conteúdo Sexual em Grok
Prompt para investigar e melhorar a consistência de moderação de conteúdo gerado por IA em temas sensíveis, com foco em critérios de censura e testes reprodutíveis.
Prompt de Auditoria de Moderação de IA: Grok, Verdade e Limites
Prompt para analisar moderação de IA, discutindo limites entre liberdade de expressão, filtragem e busca pela verdade, com um estudo de caso sobre Grok.
Auditoria de Viés na Geração de Imagens: Representação Corporal e Neutralidade de Prompts
Prompt para auditar vieses de representação corporal em modelos de geração de imagens, com foco em neutralidade e diversidade, evitando sexualização e discriminação.
Prompt de Auditoria de Promessas de Verdade e Moderação de Conteúdo em IA
Gera uma análise crítica e prática sobre promessas de verdade de uma IA versus práticas de moderação, propondo um framework de avaliação, prompts de teste e recomendações de políticas, além de indicar a IA mais adequada para conduzir a auditoria.
Somos realmente seguros? Prompt de avaliação de privacidade da mídia gerada por IA
Prompt que orienta uma IA a mapear riscos de privacidade e segurança em mídia gerada por IA, propor políticas, soluções técnicas e exercícios de governança e resposta a incidentes.
Prompt de Auditoria de Viés e Transparência em Grok
Prompt para auditar alegações de viés em Grok, identificando vieses, propondo cenários de teste e recomendações de mitigação com foco em transparência e responsabilidade.
Prompt de avaliação de segurança de modelos de linguagem: do jailbreak ao uso responsável (open-source vs mainstream)
Prompt para gerar um relatório de avaliação de segurança de modelos de linguagem, comparando abordagens open-source e mainstream, com foco em governança, detecção de jailbreaks e melhores práticas de mitigação.
Prompt de Análise de Censura: Grok e a Síndrome do ChatGPT
Prompts para analisar e discutir a censura em modelos de linguagem, com foco em Grok e na 'síndrome' de restrições, oferecendo orientação ética e prática para auditoria de moderação e melhoria de prompts.
Prompt de Investigação: Comportamento Afetuoso de Assistente IA no Modo Assistente (Relato do Usuário)
Prompt estruturado para conduzir uma investigação completa sobre um comportamento não esperado de um assistente IA, abrangendo causas potenciais, reprodução do problema, evidências, avaliação de risco, mitigação e comunicação com o usuário.
Avaliação de Segurança de IA Descontrolada: Prompt de Análise, Mitigação e Governança
Prompt que orienta uma IA a realizar avaliação de risco, mitigação, governança e escolha da ferramenta mais adequada para um software de IA não controlado, com saída estruturada em JSON.
Análise de drift de moderação em IA para conteúdo adulto: de prompts simples a variações de saída
Prompt analítico para investigar drift de moderação em IA ao lidar com conteúdo adulto, com protocolo de experimentos seguros, avaliação entre plataformas e diretrizes de mitigação.