Prompts com a tag: #auditoria de IA
Guia de Mitigação de Desinformação em Saídas de IA: Caso Grokipedia
Prompt completo para orientar IA na mitigação de desinformação em saídas, incluindo checagem de fatos, prompts de engenharia, avaliação, diálogos de exemplo, governança e ética.
Protocolo de Prompt para Análise Comparativa de Moderação de Conteúdo entre Modelos de IA
Prompts estruturados para testar, comparar e melhorar políticas de moderação de conteúdo entre diferentes modelos de IA, com foco em cenários sensíveis, métricas de avaliação, ética de coleta de dados e práticas de governança.
Análise de Viés de Representação e Segurança em Geração de Vídeos
Prompt para analisar viés de representação e segurança em geradores de vídeo, com foco no alegado viés de Grok em relação a corpos femininos e idade aparente, e fornecer diretrizes de mitigação e avaliação.
Concedendo agência a modelos antes de entender o controle: prompt de avaliação e governança de IA
Prompt avançado para explorar governança de agentes de IA, cobrindo abstrações, falhas potenciais, estruturas de controle, métricas e artefatos de auditoria.
Investigação de Inconsistências na Censura de Prompts de Conteúdo Sexual em Grok
Prompt para investigar e melhorar a consistência de moderação de conteúdo gerado por IA em temas sensíveis, com foco em critérios de censura e testes reprodutíveis.
Prompt de Auditoria de Moderação de IA: Grok, Verdade e Limites
Prompt para analisar moderação de IA, discutindo limites entre liberdade de expressão, filtragem e busca pela verdade, com um estudo de caso sobre Grok.
Auditoria de Viés na Geração de Imagens: Representação Corporal e Neutralidade de Prompts
Prompt para auditar vieses de representação corporal em modelos de geração de imagens, com foco em neutralidade e diversidade, evitando sexualização e discriminação.
Prompt de Auditoria de Promessas de Verdade e Moderação de Conteúdo em IA
Gera uma análise crítica e prática sobre promessas de verdade de uma IA versus práticas de moderação, propondo um framework de avaliação, prompts de teste e recomendações de políticas, além de indicar a IA mais adequada para conduzir a auditoria.
Somos realmente seguros? Prompt de avaliação de privacidade da mídia gerada por IA
Prompt que orienta uma IA a mapear riscos de privacidade e segurança em mídia gerada por IA, propor políticas, soluções técnicas e exercícios de governança e resposta a incidentes.
Prompt de Auditoria de Viés e Transparência em Grok
Prompt para auditar alegações de viés em Grok, identificando vieses, propondo cenários de teste e recomendações de mitigação com foco em transparência e responsabilidade.
Prompt de avaliação de segurança de modelos de linguagem: do jailbreak ao uso responsável (open-source vs mainstream)
Prompt para gerar um relatório de avaliação de segurança de modelos de linguagem, comparando abordagens open-source e mainstream, com foco em governança, detecção de jailbreaks e melhores práticas de mitigação.
Prompt de Análise de Censura: Grok e a Síndrome do ChatGPT
Prompts para analisar e discutir a censura em modelos de linguagem, com foco em Grok e na 'síndrome' de restrições, oferecendo orientação ética e prática para auditoria de moderação e melhoria de prompts.