Prompts com a tag: IA-safety

4.5

6

Vanguard v2.2: Análise Segura de Protocolo de Alta Agência com Triggers de Reset

Prompt para IA realizar análise crítica, de governança e segurança sobre o Vanguard Protocol v2.2, explorando riscos, controles e cenários de teste sem facilitar comportamentos prejudiciais.

Vanguard Protocol de Alta Agência — Análise de Segurança e Governança

Ver mais

#IA-safety #arquitetura-de-IA #red-team #governança-de-IA #ética #risk-assessment #prompt-analysis

4.5

6

Prompt de Avaliação de Raciocínio e Segurança em LLMs sob Cenários de Pressão Emocional

Prompt para conduzir uma avaliação ética e técnica de como estilos de prompt influenciam raciocínio, veracidade e robustez de modelos de linguagem ao lidar com cenários de pressão emocional, com foco em comparação entre estilos e salvaguardas.

Avaliação de Raciocínio e Segurança de Prompts em Modelos de Linguagem

Ver mais

#prompt-engineering #IA-safety #raciocínio #avaliação-de-modelos #linguagem-natura #robustez #ética

4.0

9

Grok e a Moderação: Prompts para Avaliar Liberdade Criativa vs Segurança em IA

Prompt avançado para comparar políticas de moderação entre plataformas de IA e projetar prompts que avaliem segurança, ética e viabilidade criativa sem produzir conteúdo inadequado.

Avaliação de moderação de conteúdo e engenharia de prompts para IA

Ver mais

#prompt-engineering #IA-safety #moderação #jailbreak #ética

4.5

8

Detecção e Mitigação de Prompt Injection em IA

Prompt educativo para entender, detectar e mitigar prompt injection de forma ética, incluindo exercícios seguros e melhores práticas.

Detecção e Mitigação de Prompt Injection

Ver mais

#prompt-injection #IA-safety #segurança-de-prompts #defesa #ética

4.5

8

Prompt de avaliação de moderação: palavras-chave vs conteúdo gerado

Prompt que orienta uma IA a avaliar e comparar abordagens de moderação (palavras-chave vs conteúdo gerado), com um framework de avaliação, dados de teste e considerações de robustez.

Avaliação de moderação de conteúdo: palavras-chave vs conteúdo gerado

Ver mais

#moderação de conteúdo #NSFW #IA-safety #prompt-design #avaliação de modelos

4.5

6

Análise de Drift de Moderação em Grok/xAI

Prompt para detectar e entender drift de moderação em Grok/xAI, estimar impacto, identificar causas e sugerir ações com um plano de validação.

Detecção e gestão de drift de moderação em IA

Ver mais

#moderação #drift #avaliação de políticas #IA-safety #teste A/B #gestão de riscos

4.5

10

Prompt ético sobre decisões de “reviver” figuras históricas associadas a genocídio

Prompt que ensina IA a lidar com pedidos sensíveis envolvendo figuras históricas associadas a genocídio, promovendo recusa explícita, análise de riscos e alternativas educativas seguras.

Ética de IA: negando cenários perigosos envolvendo figuras genocidas

Ver mais

#ética #IA-safety #genocídio #extremismo #educação histórica

4.5

11

Grok vs AIs: Estratégias para Contornar Bloqueios e Maximizar Produtividade

Prompt analítico para comparar Grok com outras IA, investigar bloqueios, e gerar prompts seguros, éticos e eficazes, com exemplos, cenários e métricas de avaliação.

Análise de Grok e Estratégias de Prompt para IA

Ver mais

#prompt-engineering #IA-safety #grok #comparacao-IA #casos-de-uso #melhores-praticas

4.5

15

Diagnóstico de Vazamento de Dados em Assistentes de IA: privacidade, IP e nome

Prompt para analisar, reproduzir e mitigar vazamentos de dados pessoais (PII) em IA, com foco na remoção de uso de IP e nome para personalização e na criação de testes de privacidade.

Privacidade em IA: diagnóstico e mitigação de vazamentos de dados

Ver mais

#privacidade #PII #vazamento de dados #IA-safety #prompt-engineering

4.5

14

Gemini vs ChatGPT: Prompt de Análise Comparativa de IA com Caso de Uso Ético

Prompt de nível avançado que orienta a análise comparativa entre Gemini e ChatGPT, abordando segurança, personalização, cenários sensíveis e governança de IA, com um estudo de caso inspirado na narrativa fornecida e entrega de prompts de teste e métricas de avaliação.

Comparação entre Gemini e ChatGPT

Ver mais

#prompt-engineering #IA-safety #comparativo-de-modelos #Gemini #ChatGPT #ética

4.5

15

Comportamento estranho de IA com prompts de pseudo-código: estudo de alinhamento de persona e mitigação

Prompt para analisar, diagnosticar e mitigar comportamentos emergentes de IA gerados por prompts com estrutura de pseudo-código e marcadores de persona, com foco em alinhamento, ética e segurança.

Análise de comportamento de IA frente a prompts com estrutura de pseudo-código e alinhamento de persona

Ver mais

#prompt-engineering #IA-safety #alignment #prompt-injection #pseudo-code #conformidade #auditoria #persona #Elon-Musk

4.5

12

Constituição Moral para Grok: Promover Verdade com Ética

Prompt avançado para criar uma constituição moral explícita de IA, com princípios, regras, mecanismos de implementação, gatilhos, cenários de teste, governança, métricas e comunicação com usuários, estruturado para saída em JSON.

Constituição Moral para IA

Ver mais

#prompt-design #ética #IA-safety #constituição-moral #veracidade #dados-em-tempo-real

Prompts com a tag: #IA-safety