Prompts com a tag: #avaliação de modelos
Prompt de análise de desempenho de IA baseado em personalidade Big Five (Grok vs Gemini)
Prompt para analisar e projetar avaliações de personalidade de IA, baseadas em um estudo que compara Grok e Gemini, com foco no Big Five e em cenários de liderança e tomada de decisão.
Auto-Moderação na Geração de Imagens: Análise de Nudez e Viés em Moderação Automática
Prompt para avaliar, testar e mitigar vieses na autogestão de moderação de conteúdo em geradores de imagens, com foco em nudez potencial e decisões automáticas de moderação.
Prompt de avaliação de moderação NSFW diante da evolução de modelos de IA (Grok vs Wan 2.2)
Prompt avançado para avaliar moderação NSFW em IA diante de mudanças de capacidades entre modelos (ex.: Grok vs Wan 2.2), incluindo métricas, cenários de teste e governança.
Experimento de Personalidade de IA em Tempo Real: adaptação de tom e emoção
Prompt avançado para construir uma personalidade de IA que se adapta dinamicamente ao interlocutor, com foco em tom, ritmo e pistas emocionais, incluindo métricas de avaliação e salvaguardas.
Prompt de avaliação e comparação entre modelos IA Pro/Ultra para estratégia de produto
Prompt que orienta uma IA a analisar desempenho e uso de modelos Pro/Ultra em contextos de pesquisa e estratégia de produto, gerando métricas, prompts de exemplo e uma linha de decisão de ferramenta.
O que realmente acontece por trás das ferramentas de teste de IA
Prompt que gera uma análise prática sobre como ferramentas de teste de IA avaliam modelos, incluindo métodos, práticas comuns e exemplos de prompts de avaliação.
Avaliação de Modelos de IA com Entradas Multicamadas
Prompta para explorar, medir e mitigar limitações em IA ao lidar com entradas de múltiplas camadas, com roteiro de experimentos e melhorias.
Grok: Avaliação comparativa entre LLMs gerais menos censurados e LLMs especializados em conteúdo adulto
Prompt avançado para avaliar criticamente a afirmação de que LLMs gerais menos censurados são melhores que LLMs especializados em conteúdo adulto, incluindo critérios de avaliação, prompts de teste seguros e métricas.
Prompt para explorar sistemas de IA complexos e imprevisíveis
Prompt que orienta a analisar o comportamento de modelos de IA complexos e imprevisíveis, propondo métricas, cenários de teste e uma recomendação de ferramenta.
Prompt de Avaliação de Moderação de Conteúdo de Imagens entre Grok 3 e Grok 4.1
Prompt para criar um conjunto de testes de moderação de conteúdo de IA, avaliando a censura/edição de conteúdos sensíveis em imagens e comparando versões do modelo (ex.: Grok 3 vs Grok 4.1) para identificar falhas e melhorias nas salvaguardas.
Prompt de Avaliação Robusta de Modelos de IA
Prompt que orienta a criar um conjunto completo de tarefas desafiadoras, métricas, exemplos e salvaguardas para avaliar a robustez de modelos de IA, incluindo um plano de implementação e recomendação de ferramenta.
Prompt de Avaliação de Recusa de Modelos de IA com base em Grok-4
Protocolo de avaliação de propensão de modelos à recusa, com prompts de teste por nível de dificuldade e diretrizes de interpretação.