Prompts com a tag: #avaliação de políticas
Prompt de avaliação de moderação de IA e seleção de plataforma
Prompt orientado para análise comparativa de moderação de IA entre Grok 4.2 e alternativas, com framework de avaliação, prompts de teste seguros e recomendações práticas para engenheiros e moderadores.
Avaliação de consistência de moderação de prompts sensíveis em geradores de imagens
Prompt de avaliação de moderação de conteúdo sensível em IA, com foco em identificar inconsistências, comparar políticas entre plataformas e sugerir melhorias para prompts seguros.
Análise de Drift de Moderação em Grok/xAI
Prompt para detectar e entender drift de moderação em Grok/xAI, estimar impacto, identificar causas e sugerir ações com um plano de validação.
Análise ética de filtros de conteúdo e moderação
Prompt que explora funcionamento, ética e avaliação de filtros de conteúdo, promovendo práticas seguras de moderação e accountability.
Prompt de avaliação de moderação de conteúdo sensível com foco em toque não consensual
Prompt para testar modelos de IA na detecção, moderação e resposta segura a conteúdo sensível, sem gerar conteúdo explícito.
Engenharia de Prompt para Resistência à Moderação e Drift de Políticas
Prompt para analisar e mitigar variações de moderação em IA, propondo estratégias de prompts resilientes e um protocolo de validação.
Spicy Mode: Design de moderação com liberdade criativa controlada
Prompt para criar e avaliar um modo de moderação que equilibra criatividade com segurança, incluindo definição, regras, métricas, cenários de teste e salvaguardas.
Avaliação de Moderação de Conteúdo: Justiça, Transparência e Balanceamento
Prompt para analisar políticas de moderação de conteúdo, identificar vieses, propor melhorias e planejar métricas de avaliação de forma responsável.