ChatTTS
ChatTTS é um modelo de geração de voz para cenários conversacionais em chinês e inglês.
Please wait while we load the page
O ChatTTS é um modelo de geração de voz concebido para cenários conversacionais. É ideal para aplicações como tarefas de diálogo para assistentes de grandes modelos de linguagem, bem como introduções áudio e vídeo conversacionais. O modelo suporta chinês e inglês, demonstrando alta qualidade e naturalidade na síntese de fala. Este nível de desempenho é alcançado através do treino com aproximadamente 100.000 horas de dados em chinês e inglês. A equipa do projeto planeia disponibilizar um modelo básico open-source treinado com 40.000 horas de dados, o que ajudará as comunidades académica e de desenvolvedores em investigação e desenvolvimento adicionais.
Para usar o ChatTTS, descarregue o código do GitHub, instale as dependências necessárias (torch e ChatTTS), importe as bibliotecas requeridas, inicialize o ChatTTS, prepare o seu texto, gere a fala usando o método infer e reproduza o áudio gerado usando a classe Audio do IPython.display.
Escolha ChatTTS se quiser uma conversão de texto para fala com som natural. É perfeito para dar vida ao seu conteúdo escrito com voz.
Informação de preços não disponível
Nenhum produto disponível