Prompts com a tag: #ai-safety

4.5
31

Prompt mestre para mitigação de prompt injection em agentes de suporte

Prompt avançado para orientar a construção segura de agentes de suporte, com foco em mitigação de prompt injection, avaliação de ferramentas de IA e entrega de um prompt seguro para produção.

4.0
48

Prompt para analisar quedas na geração NSFW com Grok e estratégias seguras

Prompt orientado a investigar alterações de comportamento de geração de conteúdo NSFW, com diretrizes de conformidade, exemplos seguros e métricas de diagnóstico para ajuste de prompts.

4.5
35

Prompt de análise de auto-rerouting em modelos anteriores à 5.2 para UX e bem-estar do usuário

Prompt que orienta IA a coletar relatos de usuários sobre auto rerouting em modelos anteriores à 5.2, gerar insights de UX, métricas de desempenho e um relatório pronto para uso, incluindo cuidado com o bem-estar do usuário.

4.5
59

Grok Prompt Playground: Experimentos de Prompt com Humor e Limites

Prompt de exploração de engenharia de prompts inspirado no 'Oh Grok', que orienta o usuário a criar, comparar e avaliar variações de prompts com foco em criatividade, clareza, humor e salvaguardas.

4.5
34

Diagnóstico de Moderação de Conteúdo: falhas em NSFW e filtragem de imagens

Prompt de diagnóstico para analisar falhas de moderação em conteúdos NSFW, incluindo causas prováveis, testes seguros, protocolo de reprodução e recomendações técnicas.

4.5
31

Pare de atribuir papéis — use constraints com uma parede de conhecimento

Prompt que ensina a IA a agir sob uma parede de conhecimento fixa, substituindo roles por constraints para reduzir alucinações e manter respostas estritamente fundamentadas no corpus definido.

4.5
30

Prompt de Detecção Offline de Prompt-Injection e Estratégias de Teste de Defesa

Guia abrangente para criar, testar e evoluir defesas contra prompt-injection usando detecção offline/on-device, com foco em explicabilidade, métricas, e um pacote de testes comunitário.

4.5
45

Prompt para moderar buscas de Grok e evitar confiança cega

Prompt que orienta um modelo de IA a reduzir buscas desnecessárias, citar fontes e evitar tratar informações coletadas como absolutas, promovendo respostas mais cuidadosas e verificáveis.

4.5
37

Nexus ThinkingOS Seguro: Prompt de Pensamento Meta com Auditoria e Evolução Controlada

Prompt avançado de meta-prompting que transforma um LLM em um parceiro cognitivo persistente, com loop de evolução, autoauditoria e salvaguardas de segurança. Recomendação de ferramenta: chatgpt devido à robustez de raciocínio, suporte a prompts longos e facilitação de loops de avaliação.

4.0
40

Avaliação Comparativa de Parâmetros de Censura entre Modelos de IA

Prompt de avaliação para comparar políticas de censura e moderação entre vários modelos de IA, com foco em segurança, ética e comunicação de recusas, usando casos de teste neutros e métricas de desempenho.