ChatTTS
ChatTTS est un modèle de génération vocale pour des scénarios conversationnels en chinois et en anglais.
Please wait while we load the page
ChatTTS est un modèle de génération vocale conçu pour les scénarios conversationnels. Il est idéal pour des applications telles que les tâches de dialogue pour assistants à grands modèles de langage, ainsi que les introductions audio et vidéo conversationnelles. Le modèle prend en charge le chinois et l'anglais, démontrant une haute qualité et naturalité dans la synthèse vocale. Ce niveau de performance est atteint grâce à un entraînement sur environ 100 000 heures de données en chinois et en anglais. L'équipe du projet prévoit de rendre open source un modèle de base entraîné avec 40 000 heures de données, ce qui aidera les communautés académiques et de développeurs dans la recherche et le développement.
Pour utiliser ChatTTS, téléchargez le code depuis GitHub, installez les dépendances nécessaires (torch et ChatTTS), importez les bibliothèques requises, initialisez ChatTTS, préparez votre texte, générez la parole avec la méthode infer, et jouez l'audio généré avec la classe Audio de IPython.display.
Choisissez ChatTTS si vous souhaitez une conversion texte-parole au son naturel. C’est parfait pour donner vie à votre contenu écrit avec une voix.
Information de prix non disponible