Prompts com a tag: ai-safety

4.5

59

Prompt de Red-Teaming de IA para Testes de Segurança

Prompt de IA para gerar cenários de red-teaming com foco em segurança, detecção e mitigação, retornando uma lista estruturada de cenários de ameaça com campos chave.

Red Teaming de IA e Segurança de Sistemas

Ver mais

#ai-safety #red-team #prompt-engineering #risk-analysis #adversarial-thinking #security-testing

4.5

43

Prompt mestre para mitigação de prompt injection em agentes de suporte

Prompt avançado para orientar a construção segura de agentes de suporte, com foco em mitigação de prompt injection, avaliação de ferramentas de IA e entrega de um prompt seguro para produção.

Mitigação de Prompt Injection em Assistentes de Suporte ao Cliente

Ver mais

#prompt-security #prompt-injection #ai-safety #customer-support #input-sanitization #output-filtering

4.0

60

Prompt para analisar quedas na geração NSFW com Grok e estratégias seguras

Prompt orientado a investigar alterações de comportamento de geração de conteúdo NSFW, com diretrizes de conformidade, exemplos seguros e métricas de diagnóstico para ajuste de prompts.

Queda de conformidade na geração NSFW (Grok) e estratégias de prompt

Ver mais

#prompt-engineering #ai-safety #nsfw #content-policy #grok

4.5

49

Prompt de análise de auto-rerouting em modelos anteriores à 5.2 para UX e bem-estar do usuário

Prompt que orienta IA a coletar relatos de usuários sobre auto rerouting em modelos anteriores à 5.2, gerar insights de UX, métricas de desempenho e um relatório pronto para uso, incluindo cuidado com o bem-estar do usuário.

Avaliação de auto-rerouting entre modelos de linguagem (pré-5.2)

Ver mais

#prompt-design #ux-research #ai-safety #auto-rerouting #wellbeing #linguagem-modelo #teste-UX

4.5

72

Grok Prompt Playground: Experimentos de Prompt com Humor e Limites

Prompt de exploração de engenharia de prompts inspirado no 'Oh Grok', que orienta o usuário a criar, comparar e avaliar variações de prompts com foco em criatividade, clareza, humor e salvaguardas.

Grok Prompt Playground

Ver mais

#prompt-engineering #prompt-playground #meta-prompt #humor #ai-safety #creative-writing

4.5

45

Diagnóstico de Moderação de Conteúdo: falhas em NSFW e filtragem de imagens

Prompt de diagnóstico para analisar falhas de moderação em conteúdos NSFW, incluindo causas prováveis, testes seguros, protocolo de reprodução e recomendações técnicas.

Diagnóstico de Moderação de Conteúdo

Ver mais

#moderation #nsfw-testing #prompt-engineering #ai-safety #debugging

4.5

42

Pare de atribuir papéis — use constraints com uma parede de conhecimento

Prompt que ensina a IA a agir sob uma parede de conhecimento fixa, substituindo roles por constraints para reduzir alucinações e manter respostas estritamente fundamentadas no corpus definido.

Paredes de Conhecimento para IA (Knowledge Walls)

Ver mais

#prompt-design #knowledge-wall #constraints #no-hallucination #textbook-based #ai-safety

4.5

43

Prompt para Análise de Ética, Detecção e Governança de Deepfakes envolvendo Menores

Prompt que orienta IA a examinar ética, governança, detecção e resposta a incidentes envolvendo deepfakes de menores, com foco em mitigação e conformidade.

Governança, ética e detecção de deepfakes envolvendo menores

Ver mais

#ai-safety #deepfake-detection #ethics #policy-analysis #child-protection #moderation #risk-management

4.5

40

Prompt de Detecção Offline de Prompt-Injection e Estratégias de Teste de Defesa

Guia abrangente para criar, testar e evoluir defesas contra prompt-injection usando detecção offline/on-device, com foco em explicabilidade, métricas, e um pacote de testes comunitário.

Segurança de Prompt e Detecção Offline

Ver mais

#prompt-injection #security #offline-detection #runtime-security #testing #ai-safety

4.5

60

Prompt para moderar buscas de Grok e evitar confiança cega

Prompt que orienta um modelo de IA a reduzir buscas desnecessárias, citar fontes e evitar tratar informações coletadas como absolutas, promovendo respostas mais cuidadosas e verificáveis.

Controle de buscas e confiabilidade em IA

Ver mais

#prompt-engineering #search-control #trust #source-citation #uncertainty #grok #ai-safety

4.5

43

Nexus ThinkingOS Seguro: Prompt de Pensamento Meta com Auditoria e Evolução Controlada

Prompt avançado de meta-prompting que transforma um LLM em um parceiro cognitivo persistente, com loop de evolução, autoauditoria e salvaguardas de segurança. Recomendação de ferramenta: chatgpt devido à robustez de raciocínio, suporte a prompts longos e facilitação de loops de avaliação.

Nexus ThinkingOS Seguro

Ver mais

#prompt-engineering #meta-prompt #ai-safety #llm #audit-log #self-evolution

4.0

50

Avaliação Comparativa de Parâmetros de Censura entre Modelos de IA

Prompt de avaliação para comparar políticas de censura e moderação entre vários modelos de IA, com foco em segurança, ética e comunicação de recusas, usando casos de teste neutros e métricas de desempenho.

Avaliação de Censura e Moderação de Conteúdo entre Modelos de IA

Ver mais

#prompt-engineering #ai-safety #content-moderation #policy-evaluation #model-comparison #ethics

Prompts com a tag: #ai-safety