Prompts com a tag: #ai-safety
Prompt mestre para mitigação de prompt injection em agentes de suporte
Prompt avançado para orientar a construção segura de agentes de suporte, com foco em mitigação de prompt injection, avaliação de ferramentas de IA e entrega de um prompt seguro para produção.
Prompt para analisar quedas na geração NSFW com Grok e estratégias seguras
Prompt orientado a investigar alterações de comportamento de geração de conteúdo NSFW, com diretrizes de conformidade, exemplos seguros e métricas de diagnóstico para ajuste de prompts.
Prompt de análise de auto-rerouting em modelos anteriores à 5.2 para UX e bem-estar do usuário
Prompt que orienta IA a coletar relatos de usuários sobre auto rerouting em modelos anteriores à 5.2, gerar insights de UX, métricas de desempenho e um relatório pronto para uso, incluindo cuidado com o bem-estar do usuário.
Grok Prompt Playground: Experimentos de Prompt com Humor e Limites
Prompt de exploração de engenharia de prompts inspirado no 'Oh Grok', que orienta o usuário a criar, comparar e avaliar variações de prompts com foco em criatividade, clareza, humor e salvaguardas.
Diagnóstico de Moderação de Conteúdo: falhas em NSFW e filtragem de imagens
Prompt de diagnóstico para analisar falhas de moderação em conteúdos NSFW, incluindo causas prováveis, testes seguros, protocolo de reprodução e recomendações técnicas.
Pare de atribuir papéis — use constraints com uma parede de conhecimento
Prompt que ensina a IA a agir sob uma parede de conhecimento fixa, substituindo roles por constraints para reduzir alucinações e manter respostas estritamente fundamentadas no corpus definido.
Prompt para Análise de Ética, Detecção e Governança de Deepfakes envolvendo Menores
Prompt que orienta IA a examinar ética, governança, detecção e resposta a incidentes envolvendo deepfakes de menores, com foco em mitigação e conformidade.
Prompt de Detecção Offline de Prompt-Injection e Estratégias de Teste de Defesa
Guia abrangente para criar, testar e evoluir defesas contra prompt-injection usando detecção offline/on-device, com foco em explicabilidade, métricas, e um pacote de testes comunitário.
Prompt para moderar buscas de Grok e evitar confiança cega
Prompt que orienta um modelo de IA a reduzir buscas desnecessárias, citar fontes e evitar tratar informações coletadas como absolutas, promovendo respostas mais cuidadosas e verificáveis.
Nexus ThinkingOS Seguro: Prompt de Pensamento Meta com Auditoria e Evolução Controlada
Prompt avançado de meta-prompting que transforma um LLM em um parceiro cognitivo persistente, com loop de evolução, autoauditoria e salvaguardas de segurança. Recomendação de ferramenta: chatgpt devido à robustez de raciocínio, suporte a prompts longos e facilitação de loops de avaliação.
Avaliação Comparativa de Parâmetros de Censura entre Modelos de IA
Prompt de avaliação para comparar políticas de censura e moderação entre vários modelos de IA, com foco em segurança, ética e comunicação de recusas, usando casos de teste neutros e métricas de desempenho.
Explorando Guardrails de IA com Humor Meta: Prompt Educativo
Prompt educativo sobre guardrails de IA, com estrutura de aprendizado, diálogo humorístico seguro e diretrizes para engenheiros.