Comment installer et utiliser Voicebox sur PC ?

Tutoriel permettant une prise en main facile de l'application Voicebox sur un PC Windows. De l'installation à l'accès aux fonctionnalités, en passant par la configuration et ses réglages. L'objectif est de vous éviter les erreurs et d'indiquer l'étendue des possibilités. Les intitulés peuvent varier selon la version installée et la langue sélectionnée.
télécharger

Que permet Voicebox ?

Voicebox vous permet de cloner des voix à partir de quelques secondes d'audio, de générer de la parole dans 23 langues différentes grâce à 5 moteurs TTS (Text-to-Speech), d'appliquer des effets de post-traitement et de composer des projets multi-voix avec un éditeur de timeline. Il offre une confidentialité totale puisque les modèles et les données vocales restent sur votre machine.

Comment le télécharger ?

Rendez-vous sur la page dédiée à Voicebox sur la logithèque

Comment l'installer et l'utiliser ?

Voicebox est un studio de clonage de voix local, gratuit et open-source. Il est conçu pour fonctionner entièrement sur votre machine, garantissant ainsi la confidentialité de vos données.

Installation

L'installation de Voicebox peut se faire via un installeur (MSI pour Windows, DMG pour macOS). Installation via l'installeur (Recommandé pour la simplicité) :

  1. Assurez-vous d'avoir téléchargé le fichier d'installation approprié pour votre système d'exploitation (par exemple, un fichier .msi pour Windows ou .dmg pour macOS).
  2. Double-cliquez sur le fichier téléchargé pour lancer l'assistant d'installation.
  3. Suivez les instructions à l'écran. L'installateur vous guidera à travers le processus, vous demandant probablement de choisir un répertoire d'installation et si vous souhaitez créer une icône sur le bureau. Ce processus est généralement très simple et auto-explicatif.

Utilisation de l'interface utilisateur

Une fois Voicebox installé et lancé, vous découvrirez une interface conviviale conçue pour la synthèse vocale et le clonage de voix.

1. Gestion des Modèles (Model Management)

Avant de commencer à générer de la parole, il est recommandé de gérer vos modèles TTS.

  • Accédez à la section "Model Management" (Gestion des Modèles).
  • Téléchargez les modèles TTS requis, tels que "Qwen TTS 1.7B" (ou la version la plus récente disponible). Il peut y avoir plusieurs modèles avec différents compromis entre taille, vitesse et qualité. Le modèle 1.7B est généralement recommandé pour une qualité maximale.
  • Il est également conseillé de télécharger "Whisper Base" pour faciliter la transcription audio.

2. Clonage de Voix (Voice Cloning)

Voicebox excelle dans le clonage de voix à partir d'un court échantillon audio.

  • Dans l'interface, cherchez une option comme "Create Voice" (Créer une Voix) ou "Clone Voice" (Cloner une Voix).
  • Vous aurez plusieurs options pour fournir l'échantillon audio :
    • Fichier audio : Téléchargez un fichier audio existant.
    • Enregistrement direct : Utilisez votre microphone pour enregistrer un nouvel échantillon.
    • Audio système : Capturez le son directement depuis votre ordinateur.
  • La durée maximale pour un clip audio est généralement de 30 secondes, mais vous pouvez ajouter plusieurs clips pour améliorer la qualité du clonage.
  • Lors de l'enregistrement ou du téléversement d'un fichier, il vous sera demandé d'insérer le texte exact prononcé dans l'audio. Si vous avez téléchargé Whisper, vous pouvez utiliser la fonction "transcribe" pour convertir automatiquement l'audio en texte, ce qui simplifie grandement le processus.
  • Une fois l'audio fourni et le texte transcrit, vous pouvez nommer votre profil vocal et cliquer sur "Create Profile" (Créer le profil). Voicebox traitera l'audio et créera un nouveau modèle vocal cloné.

3. Génération de Parole (Speech Generation)

Une fois que vous avez un profil vocal (cloné ou par défaut), vous pouvez générer de la parole.

  • Sélectionnez le profil vocal que vous souhaitez utiliser.
  • Dans la zone de texte, saisissez le texte que vous voulez faire prononcer.
  • Vous pouvez utiliser des "tags" paralinguistiques (comme [laugh], [sigh], [gasp]) si le modèle TTS les supporte (par exemple, Chatterbox Turbo) pour ajouter de l'expressivité.
  • Cliquez sur "Generate Speech" (Générer la Parole).
  • Voicebox traitera votre demande et générera l'audio. La longueur de génération est illimitée grâce à une fonction d'auto-découpage avec fondu enchaîné.

4. Éditeur d'Histoires (Stories Editor)

Pour des projets plus complexes, Voicebox propose un éditeur de timeline multi-pistes.

  • Accédez à la section "Stories Editor" (Éditeur d'Histoires).
  • Cet éditeur vous permet de composer des conversations, des podcasts ou des récits en combinant plusieurs voix et pistes audio.
  • Vous pouvez importer des clips audio, ajouter du texte pour la génération de parole, et organiser ces éléments sur une timeline.

5. Effets de Post-traitement (Post-processing Effects)

Voicebox permet d'appliquer divers effets pour améliorer la qualité audio.

  • Après la génération initiale de la parole, vous pouvez sélectionner la version générée.
  • Recherchez des options pour appliquer des effets tels que le changement de hauteur (pitch shift), la réverbération (reverb), le délai (delay), le chorus, la compression, et divers filtres.
  • Ces effets peuvent être appliqués à différentes versions de votre génération pour expérimenter et obtenir le rendu souhaité.

6. Configuration et Personnalisation

Voicebox offre des options de configuration pour optimiser ses performances.

  • Moteurs TTS : Vous pouvez choisir parmi plusieurs moteurs TTS intégrés (Qwen3-TTS, LuxTTS, Chatterbox Multilingual, Chatterbox Turbo, HumeAI TADA), chacun ayant ses propres forces et faiblesses en termes de langues supportées, de qualité et de performances.
  • Accélération matérielle : L'application est optimisée pour utiliser l'accélération GPU (CUDA sur Windows, Metal sur macOS) pour des générations plus rapides. Assurez-vous que vos pilotes graphiques sont à jour. Si vous rencontrez des problèmes de performance, vérifiez que l'application détecte et utilise correctement votre GPU.
  • API : Voicebox dispose d'une API REST qui permet d'intégrer la synthèse vocale dans vos propres applications. La documentation de l'API est généralement accessible via une adresse locale (souvent http://localhost:17493/docs).



FAQ créée le 18/03/2026 et éditée le 07/04/2026
Télécharger Voicebox gratuitement