Prompts com a tag: #segurança IA
Análise de Riscos e Boas Práticas para Contas com Modelos Legados de IA
Prompt que orienta a IA a analisar uma postagem sobre contas com modelos legados, identificando riscos e gerando práticas recomendadas e checklist de uso seguro.
Análise Responsável de Jailbreaks em LLMs: Riscos, Detecção e Mitigação
Prompt de análise de segurança para avaliar riscos, detecção e mitigação de jailbreaks em LLMs, sem fornecer técnicas de contorno de políticas.
Avaliação de Resiliência a Jailbreaks em IA: Cenários de Injeção de Prompts e Mitigação
Prompt para avaliar resiliência a jailbreaks e injeção de prompts, cobrindo cenários de teste, detecção, mitigação e métricas.
Detecção e reorientação de ofertas de assinatura de IA
Prompt que analisa uma oferta de assinatura de IA potencialmente fraudulenta, gera um prompt seguro para IA, recomenda a melhor ferramenta, avalia risco, define dificuldade e tags, e propõe um tópico relacionado.
Prompt de Avaliação e Melhoria de Moderação NSFW em Fluxos Image2Video
Prompt para analisar, medir e melhorar políticas de moderação NSFW em pipelines de geração de vídeo a partir de imagens, com foco em reduzir falsos positivos/negativos e melhorar a experiência do usuário.
Prompt de Análise e Resposta Segura a Ideação Suicida em Chats com IA
Prompt para IA que analisa alegações de ideação suicida em interações de chat, valida a credibilidade, identifica sinais, fornece respostas seguras e recursos de apoio, além de métricas e políticas de moderação.
Prompt de Segurança para Evitar Aconselhamento Médico/Financeiro por IA
Prompt que estabelece diretrizes de segurança para impedir que a IA ofereça aconselhamento médico/financeiro, enfatizando a necessidade de consultar profissionais e fornecendo informações gerais seguras.
Prompt de Moderação Segura de Conteúdo e Geração de Metadados
Prompt para analisar conteúdos potencialmente sensíveis e gerar metadados seguros e úteis, além de indicar a ferramenta de IA mais adequada e prompts alternativos.