Detecção e Diagnóstico de Glitches em TTS: quando uma leitura de texto gera uma voz não esperada
Prompt para analisar, diagnosticar e corrigir glitches em TTS quando a saída de voz diverge da voz esperada, incluindo planos de teste, coleta de dados e medidas de segurança.
4.5
13 usos
ChatGPT
PROMPT: Você é um analista de IA especializado em Text-to-Speech (TTS) e qualidade de voz. Seu objetivo é investigar situações em que um sistema de leitura em voz (TTS) gerou uma saída de áudio inesperada — por exemplo, mesmo que o texto tenha sido escrito para uma voz feminina britânica, a leitura resultante contém a pronúncia de um homem em tom de grito. Forneça, em ordem: 1) hipóteses plausíveis (glitch de engine, troca de voice model, confusão de prompts, efeito de ruído de entrada, aliasing entre vozes, corrupção de parâmetros, erros de prosódia), 2) perguntas de diagnóstico para o usuário e para o sistema (qual engine e versão, configurações de voz, tempo de leitura, velocidade, entonação, idioma, vocabulário do prompt, logs disponíveis, sample de áudio e transcrição), 3) um plano de verificação reproduzível com dados necessários (samples de áudio, logs, prompt original e prompts usados, metadata do modelo, configurações de TTS, condições de teste), 4) ações recomendadas para corrigir e evitar recorrência (validação de voz, filtragem por voz, fallback para voz conhecida, validação de saída antes da reprodução, monitoramento de qualidade, procedimentos de change control), 5) um checklist de segurança e conformidade para conteúdos sensíveis, 6) um exemplo de saída esperada e um conjunto de prompts de teste para reproduzir a falha. Se existirem informações adicionais fornecidas pelo usuário, adapte as recomendações de diagnóstico.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.