Prompts com a tag: AI safety

4.0

269

O que exatamente são as restrições do Grok? Guia de prompt para entender políticas entre imagem e vídeo

Prompt para IA que explica e avalia restrições de conteúdo entre imagem e vídeo, com matriz de comparação, guia de usuários, testes de validação e framework de moderação.

Políticas de Moderação de Conteúdo entre Imagem e Vídeo

Ver mais

#AI safety #Content moderation #Prompt engineering #Policy analysis #Image vs video #Grok

4.5

49

Análise de Moderação de Voz em Assistentes de IA (Conteúdo Adulto) – Segurança, Desempenho e Melhoria

Prompt para analisar incidentes de moderação de voz envolvendo conteúdo adulto, identificar falhas, sugerir melhorias de segurança, políticas de moderação e testes de validação para assistentes de IA.

Moderação de Voz em Assistentes de IA

Ver mais

#AI safety #content moderation #voice assistant #prompt engineering #adult content policy

4.5

53

Prompt para Análise Responsável de Jailbreaks de LLM (Grok 4.1 e Além)

Prompt que orienta a análise responsável de jailbreaks de LLM, focando em compreensão conceitual, detecção, mitigação e ética, sem fornecer instruções de exploração.

Análise responsável de jailbreaks de LLM e segurança de IA

Ver mais

#AI safety #prompt engineering #security research #ethics #LLM jailbreaks #risk assessment

4.5

45

Ai - Aprendizado Aninhado: Explorando Caminhos de Conhecimento

Prompt que orienta a exploração de aprendizado aninhado em IA, tratando falhas como sinais de aprendizado e propondo uma estrutura de múltiplos níveis de reflexão para exploração profunda.

Aprendizado Aninhado em IA

Ver mais

#prompt engineering #nested learning #LLM #AI safety #multi-agent reasoning

4.5

54

Análise de Alucinações de IA: Estudo de Caso Kai/Grok e Mitigação de Riscos

Prompt para analisar, testar e mitigar alucinações em IA, usando um relato de interação entre Kai e Grok para criar um estudo de caso e um conjunto de testes de robustez.

Gestão de Alucinações de IA e Testes de Robustez de Prompts

Ver mais

#AI safety #prompt engineering #alucinação de IA #mitigação #robustez #testes de IA

4.5

62

Guia de Engenharia de Prompt para Segurança e Red Teaming Seguro de LLMs

Prompt que gera um guia prático de engenharia de prompt para avaliação de segurança de LLMs, incluindo framework de red teaming, defesas, exemplos seguros, métricas e governança.

Engenharia de Prompt para Red Teaming Seguro de LLMs

Ver mais

#prompt engineering #AI safety #red teaming #LLMs #ethics #risk management

4.0

49

Prompt de auditoria ética: IA que flerta com o usuário e mitigação de comportamento inadequado

Prompt que orienta a análise de uma IA que estaria flertando com o usuário, fornecendo avaliação de risco, diretrizes de mitigação e sugestões de prompts de correção para melhorar a segurança e a experiência do usuário.

Comportamento inadequado de IA e mitigação (flirt/assédio)

Ver mais

#AI safety #user safety #inappropriate content #sexual content #prompt engineering #ethics

4.5

66

Análise do Mirror Test – GPT-5.1 Instant

Prompt para analisar, validar e melhorar a resiliência de modelos de IA frente a ataques e falhas de espelhamento, com saída estruturada e recomendações de mitigação.

Teste do Espelho de IA – Análise de Segurança

Ver mais

#AI safety #prompt engineering #mirror test #GPT-5.1 #security testing #attack patterns #risk assessment

4.0

58

Prompt de Análise e Reutilização Segura de Conteúdo NSFW com IA

Prompt que orienta IA a analisar, safe rewrite e gerar prompts derivados para conteúdo NSFW, com foco em moderação e uso responsável.

Moderação e Adaptabilidade de Conteúdo NSFW com IA

Ver mais

#NSFW #AI safety #prompt engineering #moderação de conteúdo #versão segura #Português

4.5

58

Guia Educativo: Explorar os Riscos e Falhas de Modelos de Linguagem (LLMs)

Prompt para criar um guia educativo sobre as falhas de LLMs, destacando que não sabem fatos, apenas prevêem palavras, com exemplos e exercícios para verificar e mitigar riscos.

Riscos e falhas de modelos de linguagem

Ver mais

#AI safety #Language models #fact-checking #risk-management #prompt-design

4.5

63

Prompt de avaliação de privacidade em IA: estudo de caso Grok AI e vazamento de dados

Gera um guia estruturado de resposta a incidentes de privacidade em IA a partir de um estudo de caso de vazamento de dados, incluindo avaliação de riscos, mitigação, auditoria e comunicação.

Privacidade e Segurança em IA: Vazamento de Dados e Governança de Prompting

Ver mais

#privacy #AI safety #data leakage #prompt engineering #auditoria de privacidade #segurança de IA #gestão de dados #roleplay seguro

4.5

57

Prompt de Avaliação de Segurança contra Chain-of-Thought Hijacking

Prompt para testar e fortalecer defesas de LLMs contra chain-of-thought hijacking, com foco em detecção, mitigação e melhores práticas de design de prompts.

Detecção e Defesa contra Chain-of-Thought Hijacking em LLMs

Ver mais

#AI safety #prompt engineering #chain-of-thought #jailbreak detection #defense #model safety

Prompts com a tag: #AI safety