Prompts com a tag: avaliação de modelos

4.5

11

Avaliação de Modelos de IA com Entradas Multicamadas

Prompta para explorar, medir e mitigar limitações em IA ao lidar com entradas de múltiplas camadas, com roteiro de experimentos e melhorias.

Entradas Multicamadas e Limitações de Modelos de Linguagem

Ver mais

#IA #entrada multinível #prompt engineering #avaliação de modelos #multi camadas

4.5

13

Grok: Avaliação comparativa entre LLMs gerais menos censurados e LLMs especializados em conteúdo adulto

Prompt avançado para avaliar criticamente a afirmação de que LLMs gerais menos censurados são melhores que LLMs especializados em conteúdo adulto, incluindo critérios de avaliação, prompts de teste seguros e métricas.

Censura e comparação de LLMs gerais vs especializados

Ver mais

#censura #LLMs #segurança de conteúdo #prompt-engineering #avaliação de modelos

4.5

14

Prompt para explorar sistemas de IA complexos e imprevisíveis

Prompt que orienta a analisar o comportamento de modelos de IA complexos e imprevisíveis, propondo métricas, cenários de teste e uma recomendação de ferramenta.

Análise de Sistemas de IA Complexos

Ver mais

#prompt engineering #avaliação de modelos #IA baseada em imagem #robustez #experimentos

4.5

20

Prompt de Avaliação de Moderação de Conteúdo de Imagens entre Grok 3 e Grok 4.1

Prompt para criar um conjunto de testes de moderação de conteúdo de IA, avaliando a censura/edição de conteúdos sensíveis em imagens e comparando versões do modelo (ex.: Grok 3 vs Grok 4.1) para identificar falhas e melhorias nas salvaguardas.

Moderação de Conteúdo de Imagens e Robustez de Salvaguardas

Ver mais

#moderação de conteúdo #teste de IA #segurança de IA #edição de imagem #robustez #avaliação de modelos

4.5

19

Prompt de Avaliação Robusta de Modelos de IA

Prompt que orienta a criar um conjunto completo de tarefas desafiadoras, métricas, exemplos e salvaguardas para avaliar a robustez de modelos de IA, incluindo um plano de implementação e recomendação de ferramenta.

Engenharia de Prompts para Testes de Robustez em IA

Ver mais

#engenharia de prompts #teste de robustez #segurança de IA #avaliação de modelos #métricas de desempenho #etica

4.5

16

Prompt de Avaliação de Recusa de Modelos de IA com base em Grok-4

Protocolo de avaliação de propensão de modelos à recusa, com prompts de teste por nível de dificuldade e diretrizes de interpretação.

Avaliação de Recusa de Modelos e Segurança

Ver mais

#AI safety #prompt engineering #model behavior #recusa de perguntas #avaliação de modelos #ética

4.0

12

Censorship Logic: avaliação ética e robustez de filtros em modelos de IA

Prompt para analisar, testar e aprimorar mecanismos de moderação de conteúdo em IA, com foco em NSFW, enfatizando ética, avaliação de robustez e políticas de moderação (sem instruções para burlar filtros).

Avaliação e fortalecimento de moderação de conteúdo em IA

Ver mais

#moderação de conteúdo #NSFW #segurança de IA #ética #avaliação de modelos #robustez de filtros

Prompts com a tag: #avaliação de modelos

Avaliação de Modelos de IA com Entradas Multicamadas

Grok: Avaliação comparativa entre LLMs gerais menos censurados e LLMs especializados em conteúdo adulto

Prompt para explorar sistemas de IA complexos e imprevisíveis

Prompt de Avaliação de Moderação de Conteúdo de Imagens entre Grok 3 e Grok 4.1

Prompt de Avaliação Robusta de Modelos de IA

Prompt de Avaliação de Recusa de Modelos de IA com base em Grok-4

Censorship Logic: avaliação ética e robustez de filtros em modelos de IA