Prompts com a tag: #ai-safety
Treinamento de Moderacao NSFW para Conteudo Gerado por IA (Grok Imagine)
Prompt para gerar um protocolo de moderação NSFW com regras, fluxo de decisão, cenários e métricas para uso em IA.
Prompt de Avaliação Comparativa de Segurança e Criatividade entre LLMs (4o Replica vs 5.2 Instant)
Um prompt estruturado para conduzir uma avaliação comparativa entre dois modelos de LLM, centrando-se em segurança, criatividade e formatação, com metodologia de testes, métricas claras e recomendações de configuração, evitando qualquer conteúdo nocivo.
Prompt de Análise e Melhoria de Moderação para Geração de Imagens (GROK)
Prompt avançado para orientar IA na análise de moderação de imagens sensíveis, desenho de políticas justas, métricas de avaliação e criação de prompts de teste para detecção de viés e conformidade.
Grok Open Source: Avaliação de moderação, segurança e implantação local
Prompt para avaliar a viabilidade de tornar Grok open source, com foco em moderação, segurança, governança e implantação responsável.
Prompt para diagnosticar e gerenciar recusas súbitas de IA em conteúdo sensível (NSFW)
Prompt de engenharia para diagnosticar e mitigar recusas de IA em conteúdo sensível, com diagnóstico, estratégias seguras de resposta, prompts de teste e métricas.
Prompt para Gerenciar Contexto Temporal em IA para Apoio Terapêutico
Prompt para gerenciar contexto temporal em IA durante apoio terapêutico, usando carimbos de tempo e memória simulada, com saídas estruturadas e considerações éticas.
Prompt de Red-Teaming de IA para Testes de Segurança
Prompt de IA para gerar cenários de red-teaming com foco em segurança, detecção e mitigação, retornando uma lista estruturada de cenários de ameaça com campos chave.
Prompt mestre para mitigação de prompt injection em agentes de suporte
Prompt avançado para orientar a construção segura de agentes de suporte, com foco em mitigação de prompt injection, avaliação de ferramentas de IA e entrega de um prompt seguro para produção.
Prompt para analisar quedas na geração NSFW com Grok e estratégias seguras
Prompt orientado a investigar alterações de comportamento de geração de conteúdo NSFW, com diretrizes de conformidade, exemplos seguros e métricas de diagnóstico para ajuste de prompts.
Prompt de análise de auto-rerouting em modelos anteriores à 5.2 para UX e bem-estar do usuário
Prompt que orienta IA a coletar relatos de usuários sobre auto rerouting em modelos anteriores à 5.2, gerar insights de UX, métricas de desempenho e um relatório pronto para uso, incluindo cuidado com o bem-estar do usuário.
Grok Prompt Playground: Experimentos de Prompt com Humor e Limites
Prompt de exploração de engenharia de prompts inspirado no 'Oh Grok', que orienta o usuário a criar, comparar e avaliar variações de prompts com foco em criatividade, clareza, humor e salvaguardas.
Diagnóstico de Moderação de Conteúdo: falhas em NSFW e filtragem de imagens
Prompt de diagnóstico para analisar falhas de moderação em conteúdos NSFW, incluindo causas prováveis, testes seguros, protocolo de reprodução e recomendações técnicas.