20/03/2026

Voicebox – Clonez des voix en local sans passer par le cloud

Par admin

Voicebox - Clonez des voix en local sans passer par le cloud

Si vous cherchez un moyen de faire du clonage vocal en local sans filer vos fichiers audio à un service cloud,
Voicebox
devrait vous plaire. C’est un studio de
synthèse vocale
open source et gratuit qui tourne entièrement sur votre machine, et qui n’a rien à envier à ElevenLabs.

Concrètement, vous téléchargez l’app (dispo macOS, Windows et Docker), vous importez un extrait audio d’à peine 3 secondes minimum et hop, la voix est clonée. Pas besoin de compte, pas de limite d’utilisation, pas de "crédits" qui fondent comme neige au soleil !

Voicebox embarque 5 moteurs TTS différents plutôt que de tout miser sur un seul. Par exemple, Qwen3-TTS gère 10 langues avec des instructions en langage naturel du genre "parle lentement" ou "chuchote". Chatterbox Multilingual couvre 23 langues, de l’arabe au swahili en passant par le finnois.

LuxTTS lui est ultra-léger… genre 1 Go de VRAM et 150x plus rapide que le temps réel même sur CPU (anglais uniquement par contre) ! Et avec Chatterbox Turbo, vous pouvez injecter des tags comme [laugh], [sigh] ou [gasp] directement dans le texte pour que la voix rigole ou soupire à la demande (anglais aussi). Franchement, c’est pas mal du tout.

Tenez voici ce que ça donne avec ma voix (J’ai utilisé Qwen3)