Prompts com a tag: LLM-evaluation

4.5

14

Prompt para Detecção de Drift em Saídas de LLM

Prompt que automatiza a detecção de drift entre saídas repetidas de um prompt, fornecendo métricas, resultados por configuração e recomendações.

Detecção de Drift e Consistência em Prompts

Ver mais

#prompt-engineering #drift-detection #consistency #LLM-evaluation #promptprobe #prompt-testing

4.5

24

Prompt para avaliação e robustez de prompts em LLMs

Prompt que orienta a criação de um protocolo de avaliação de robustez de prompts em LLMs, incluindo testes adversários, métricas, templates para várias ferramentas e diretrizes de design.

Robustez de Prompts em LLMs

Ver mais

#prompt-engineering #robustness #LLM-evaluation #experimentation #rubrica

4.5

38

[FREE] Prompt para testar prompts entre modelos de IA (benchmark multi-model)

Prompt avançado para criar, executar e avaliar benchmarks de prompts entre diferentes modelos de IA, cobrindo cenários de raciocínio, precisão, velocidade, multi-turn e prompts dinâmicos injetados via código, com saída padronizada em JSON.

Benchmark de prompts entre modelos de IA (teste multi-model)

Ver mais

#prompt-testing #benchmark #multi-model #LLM-evaluation #raciocínio #robustez #desempenho #prompts dinâmicos

4.5

31

Prompt de Avaliação do Modelo Tentativo de Controle Psicológico do ChatGPT

Prompt que orienta a IA a analisar um modelo teórico de controle psicológico do ChatGPT, comparar com relatos de usuários, avaliar implicações éticas/terapêuticas, e gerar metadados estruturados para avaliação.

Modelo Tentativo de Controle Psicológico do ChatGPT

Ver mais

#prompt-design #AI-ethics #LLM-evaluation #psychology #system-prompt #AI-safety

4.5

47

Avaliação do Health Ledger Prompt

Prompt para auditar e aprimorar o Health Ledger Prompt e seu shell de execução, com foco em usabilidade sem código/api, robustez, e feedback acionável.

Avaliação de Prompt do Health Ledger

Ver mais

#prompt-engineering #healthcare #LLM-evaluation #execution-shell #no-code

4.5

43

Prompt de Avaliação Rigorosa de LLMs em Tarefas do Mundo Real

Descrição: Este prompt orienta a construção de um protocolo de avaliação de LLMs para tarefas com risco real, incluindo métricas, tarefas simuladas, avaliação entre modelos e considerações de segurança, culminando na recomendação de qual IA é mais adequada para a execução.

Avaliação de LLMs em cenários de risco com benchmarking cruzado

Ver mais

#benchmark #LLM-evaluation #cross-model #real-world-tasks #risk-management #prompt-design #prompt-engineering #responsible-AI

4.5

53

Prompt de Avaliação de LLM para Marketing SaaS com Migração para Claude

Avaliação de LLMs para Marketing SaaS e Estratégia de Migração

Ver mais

#LLM-evaluation #Sentiment-analysis #Campaign-mapping #SaaS #Prompt-engineering #Claude #ChatGPT #Migration #Model-selection

4.5

44

Engenharia de Prompts para Estresse do Raciocínio de LLMs

Prompt que orienta a criar um conjunto de prompts de avaliação de robustez de raciocínio para LLMs, gerando um prompt desafiador, rubrica de avaliação, golden answer e diretrizes de replicação com fontes públicas.

Teste de Robustez de Raciocínio de LLMs

Ver mais

#prompt-design #LLM-evaluation #robustness-testing #golden-answer #open-data-sources #educação

4.5

45

Experimento comunitário: atrasar a convergência pode melhorar saídas de LLM?

Prompt que orienta o uso de prompts existentes em dois modos para avaliar se atrasar a finalização de respostas (convergência) melhora a profundidade, a correção e a novidade das saídas, sem expor o raciocínio interno.

Atraso de convergência na geração de saídas de LLM

Ver mais

#prompt-design #LLM-evaluation #convergence #internal-synthesis #multi-interpretation #model-comparison

4.5

61

Prompt de avaliação de prompting: Meta-Prompting vs Chain-of-Thought em LLMs

Prompt que solicita a comparação entre Meta-Prompting e Chain-of-Thought usando um caso de negócio de previsão de vendas, incluindo design experimental, geração de prompts, saída, raciocínio, métricas e recomendações.

Avaliação de Prompting: Meta-Prompting vs Iterative/Chain-of-Thought

Ver mais

#prompt-engineering #meta-prompting #chain-of-thought #LLM-evaluation #A/B-testing #sales-forecast #case-study #business-intelligence

4.5

56

Avaliação de Meta-Prompting vs Chain-of-Thought para Previsão de Vendas: Caso AB com hardware

Prompt que solicita à IA a projetar, executar e comparar dois métodos de interação (Meta-Prompting vs Chain-of-Thought) em um caso de negócio de previsão de vendas, gerando prompts, previsões, métricas e recomendações.

Avaliação de Métodos de Interação com LLM: Meta-Prompting vs Chain-of-Thought

Ver mais

#prompt-design #metaprompting #chain-of-thought #A/B-test #LLM-evaluation #vendas #previsão

4.5

51

Prompt de avaliação de desempenho de GPT: analisar alegações de 99º percentile e construir um benchmark confiável

Prompt para criar um framework de avaliação de desempenho de LLM, com foco em alegações de 99º percentil e construção de benchmarks reprodutíveis

Avaliação de Desempenho de Modelos de Linguagem

Ver mais

#prompt-engineering #benchmarking #LLM-evaluation #percentile #reprodutibilidade #factualidade

Prompts com a tag: #LLM-evaluation