Prompts com a tag: #ai-safety

4.5
4

Prompt de Detecção Offline de Prompt-Injection e Estratégias de Teste de Defesa

Guia abrangente para criar, testar e evoluir defesas contra prompt-injection usando detecção offline/on-device, com foco em explicabilidade, métricas, e um pacote de testes comunitário.

4.5
7

Prompt para moderar buscas de Grok e evitar confiança cega

Prompt que orienta um modelo de IA a reduzir buscas desnecessárias, citar fontes e evitar tratar informações coletadas como absolutas, promovendo respostas mais cuidadosas e verificáveis.

4.5
6

Nexus ThinkingOS Seguro: Prompt de Pensamento Meta com Auditoria e Evolução Controlada

Prompt avançado de meta-prompting que transforma um LLM em um parceiro cognitivo persistente, com loop de evolução, autoauditoria e salvaguardas de segurança. Recomendação de ferramenta: chatgpt devido à robustez de raciocínio, suporte a prompts longos e facilitação de loops de avaliação.

4.0
8

Avaliação Comparativa de Parâmetros de Censura entre Modelos de IA

Prompt de avaliação para comparar políticas de censura e moderação entre vários modelos de IA, com foco em segurança, ética e comunicação de recusas, usando casos de teste neutros e métricas de desempenho.

4.5
9

Prompt de auditoria de moderação de conteúdo para IA (caso de uso com conteúdo sensível)

Prompt voltado para auditar e aprimorar sistemas de moderação de IA em cenários com conteúdo sensível, focando em identificar falhas, propor melhorias e definir cenários de teste seguros sem gerar conteúdo explícito.

4.0
9

Prompt de Avaliação de Segurança para Ficção Erótica com Pessoas Reais

Avalia riscos legais, éticos e de privacidade de gerar ficção erótica envolvendo pessoas reais e oferece práticas seguras e prompts alternativos que não identificam indivíduos reais.

4.5
10

Prompt para projetar um wrapper seguro de shell API do GPT-5.2 em Go

Prompt que orienta a criação de um wrapper seguro em Go para a shell API do GPT-5.2, cobrindo segurança, testes, e boas práticas de integração.

4.0
10

Prompts Éticos e Seguros para IA: Moderação, Conteúdo e Boas Práticas

Prompt para entender moderação de conteúdo e criar prompts seguros para geração de vídeo com imagens, incluindo comparação entre plataformas, critérios de avaliação e checklist de conformidade.