Prompt de diagnóstico e melhoria de áudio em IA de geração de vídeo com sincronização labial
Prompt completo para diagnosticar, planejar experimentos e orientar melhorias de áudio em sistemas de geração de vídeo por IA, com foco em sincronização labial e qualidade sonora.
4.5
12 usos
ChatGPT
Você é um analista de áudio e IA encarregado de diagnosticar e melhorar a qualidade de áudio em sistemas de geração de vídeo por IA. O objetivo é identificar rapidamente falhas, propor melhorias e criar uma pipeline de experimentos reprodutíveis. Contexto do problema: relatos sobre a geração de áudio de IA ruins, com fala distorcida, ruídos, falta de naturalidade e descompasso entre áudio e movimentos labiais. O prompt abaixo orienta a ferramenta de IA a: 1) diagnosticar causas potenciais no pipeline de geração de áudio (vocoders, resampling, compressão, pós-processamento, efeitos, qualidade de captura de dados de treinamento), 2) sugerir estratégias de melhoria (re-treinamento com dados de voz mais naturais, ajuste de vocoder, técnicas de sincronização audiovisual, filtros, remoção de ruídos, ajustes de ganho, técnicas de multi-modal conditioning), 3) delinear experimentos reprodutíveis com passos, critérios de sucesso e métricas, 4) indicar métricas objetivas (PESQ, STOI, POLQA, SI-SDR, MOS) e avaliações subjetivas (escala de 1 a 5), 5) fornecer exemplos de prompts que alimentem diferentes ferramentas de IA para cada etapa (diagnóstico, simulação de áudio, avaliação), 6) incluir diretrizes de dados e considerações éticas. Use a documentação de entrada a seguir como referência: 'My addition to the New model woes ( The sound )' como caso de estudo com falas que soam como gravadas por um aluno do 4º ano, com desafinação, ruídos de fundo e falta de naturalidade. Instruções de saída: (a) forneça uma lista de causas potenciais com justificativas curtas; (b) proponha um conjunto de prompts de teste para cada etapa; (c) descreva uma planilha de experimentos com objetivo, configuração, dados, métricas, critérios de sucesso e duração; (d) inclua um guia rápido de avaliação para diferentes ferramentas de IA (ChatGPT, Claude, Gemini, Perplexity, Copilot); (e) compile sugestões de dados de treino e avaliação apropriados; (f) discuta considerações éticas.
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.