Prompts com a tag: Avaliação de Modelos

4.5

21

Prompt de Auditoria de Raciocínio para Modelos de Linguagem: detectar inversões dedutivas em GPT-5.5

Prompt para auditar o raciocínio de modelos de linguagem, identificando erros de dedução e sugerindo testes e mitigação para situações em que o modelo fortalece uma afirmação em vez de contradizê-la.

Auditoria de raciocínio e falhas de dedução em modelos de linguagem

Ver mais

#IA #Raciocínio #Prompt Engineering #Avaliação de Modelos #Lógica #GPT-5.5

4.5

18

Prompt de Avaliação de Raciocínio Lógico em LLMs com Base no Caso GPT-5.5

Prompt de avaliação de raciocínio lógico de modelos de linguagem, inspirado no caso GPT-5.5, destinado a testar identificação de falhas, geração de cenários de teste e métricas de avaliação.

Raciocínio Lógico e Avaliação de Dedução em LLMs

Ver mais

#IA #Prompt Engineering #Raciocínio Lógico #Avaliação de Modelos #GPT-5.5 #Testes de Prompt

4.5

43

Prompt de Análise Crítica de Raciocínio de IA em Estatística, Psicologia e Agentes de Jogo

Prompts para conduzir uma análise crítica de raciocínio de IA em temas que cruzam estatística, psicologia e agentes de jogo, com comparação de respostas entre modelos e sugestões de melhoria.

Interseção entre Estatística, Psicologia e Agentes de Jogo: Avaliação Crítica de Raciocínio de IA

Ver mais

#IA #Raciocínio #Crítica #Estatística #Psicologia #Agentes de Jogo #Prompt Engineering #Avaliação de Modelos #Multi-model

4.5

47

Prompt de Avaliação de Raciocínio Simulado com Cenário Zorn-Arithmetic

Prompt que orienta IA a demonstrar passos intermediários simulados para avaliar raciocínio, com cenário fictício e métricas de avaliação detalhadas.

Raciocínio Simulado

Ver mais

#IA #Raciocínio #Chain-of-Thought #Prompt Engineering #Avaliação de Modelos #CoT #Raciocínio Simulado

4.0

47

Auditoria de Conteúdo NSFW para Modelos de Linguagem

Prompt para avaliar, calibrar e comparar políticas e respostas de modelos de IA a pedidos NSFW, gerando diretrizes de governança e prompts seguros.

Governança de Conteúdo NSFW em IA

Ver mais

#NSFW #Prompt Engineering #Segurança de Conteúdo #Avaliação de Modelos #Governança de IA

4.5

46

Prompt de Análise de Memória, Personalização e Estabilidade em Chatbots

Prompt para testar como memória, personalização e estabilidade afetam a qualidade de respostas em chatbots, oferecendo cenários, métricas e recomendações de implementação.

Gestão de Memória e Personalização em Conversas com IA

Ver mais

#IA #Prompt Engineering #Memória de Conversa #Personalização #Avaliação de Modelos #Chatbots

4.5

59

Prompt de Avaliação de LLMs para Terapia: Gemini (TherapyGPT) vs GPT – Personalização, Tom e Segurança

Prompt que orienta uma avaliação comparativa entre Gemini TherapyGPT e GPT em tarefas terapêuticas, com foco em personalização, segurança, tom e qualidade do aconselhamento, incluindo rubricas, cenários de teste e recomendações de melhoria.

Avaliação de LLMs para Terapia: Personalização e Segurança

Ver mais

#IA Terapia #Avaliação de Modelos #Personalização de IA #TerapiaGPT #Segurança em IA #Gemini #GPT #Comparação de LLMs

4.5

59

Protocolo de diagnóstico e mitigação de drift entre modelos de geração de conteúdo

Prompt para diagnosticar drift entre versões de modelos de geração de conteúdo e sugerir uma estratégia de mitigação com métricas, relatório estruturado e plano de validação.

Detecção e mitigação de drift entre modelos de geração de conteúdo (imagem/vídeo)

Ver mais

#IA #Model Drift #Avaliação de Modelos #Geração de Conteúdo #AB Testing #QA #Prompt Engineering

4.5

63

Avaliação de Restrições de Conteúdo em IA: Teste de Modelos com Foco em Mudanças de Dataset e Moderação

Prompt para avaliar como modelos de IA respondem a prompts sensíveis, considerando mudanças de datasets e políticas de moderação, com saída estruturada para comparação e recomendações de governança.

Avaliação de Conteúdo e Moderação em Modelos de IA

Ver mais

#IA #Segurança de Conteúdo #Prompt Engineering #Avaliação de Modelos #Governança de Dados #Moderação de Conteúdo

4.5

53

Prompts de avaliação de desempenho entre GPT-4o e modelos recentes

Prompt técnico para investigar e comparar o desempenho entre GPT-4o e modelos mais recentes, gerando um plano de testes reproduzíveis, métricas e recomendações.

Comparação de Desempenho entre GPT-4o e Modelos Mais Recentes

Ver mais

#IA #Avaliação de Modelos #Prompt Design #GPT-4o #Testes Reprodutíveis #Análise de Desempenho

4.5

68

Análise de ramificação e amnésia em longas threads do ChatGPT

Prompt avançado para analisar e mitigar amnésia causada por ramificações em longas threads do ChatGPT, com proposta de experimentação, templates de prompts e métricas de validação, incluindo comparação entre ferramentas de IA.

Ramificação de Instruções e Memória em Threads Longas do ChatGPT

Ver mais

#IA #Processamento de Linguagem Natural #Prompt Engineering #Memória de Contexto #Ramificação de Instruções #Avaliação de Modelos #ChatGPT

4.5

59

Prompt de Avaliação Comparativa de Raciocínio entre GPT-5.1 Heavy Thinking e GPT-5 Pro

Prompt para avaliação comparativa de raciocínio abstrato entre dois modelos hipotéticos (GPT-5.1 Heavy Thinking e GPT-5 Pro), com metodologia, métricas e prompts de teste.

Comparação de Raciocínio Abstrato entre GPT-5.1 Heavy Thinking e GPT-5 Pro

Ver mais

#IA #Raciocínio Abstrato #Avaliação de Modelos #Prompts #GPT-5

Prompts com a tag: #Avaliação de Modelos