29/06/2026

Alexandria – Vos ebooks en livres audio multi-voix, en local

Par admin

Alexandria - Vos ebooks en livres audio multi-voix, en local

Je ne suis pas très client des livres audio parce que mon cerveau, en général, part faire des trucs dans son coin et je me retrouve à rien écouter du tout. Je préfère un petit podcast où ça rigole qu’une œuvre littéraire qui demande de la concentration.

Mais je sais que vous appréciez beaucoup les livres audio et il arrive très souvent qu’un bouquin n’ait pas sa version audio. Un vieux roman qui n’est plus édité, un PDF technique, une fanfiction de 800 pages, un article de korben.info ou juste un truc que personne chez Audible ne prendra le temps d’enregistrer parce que ça n’intéresse que vous.

Mais youpi, Finrandojin, un internaute, en a eu marre d’attendre l’audiobook de ses rêves et a codé Alexandria, un générateur de livre audio qui tourne 100% en local sur votre ordi.

Vous balancez un fichier .txt, .md ou .epub, dans l’appli, puis un LLM découpe le texte et annote chaque ligne avec le personnage qui parle et la manière dont il le dit, puis le moteur
Qwen3-TTS
joue le tout en local comme une vraie troupe de doubleurs professionnels. Et le résultat est assez propre, même si ça ne vaut pas encore un vrai enregistrement fait par un vrai humain. M’enfin, faute de mieux, pourquoi pas !

Et surtout, ce LLM qui fait le découpage, vous le branchez où vous voulez. En local via LM Studio ou Ollama, ou dans le cloud avec OpenAI ou n’importe quelle API compatible. Ensuite, une fois le script annoté, Alexandria vous propose 9 voix pré-entraînées avec contrôle de l’émotion et du ton.

Vous pouvez aussi
cloner une voix
à partir de 5 à 15 secondes d’échantillon, ou carrément en fabriquer une à partir d’une simple description écrite. Vous tapez par exemple "Une voix masculine chaude et grave, au ton calme et posé" (c’est ma voix quoi…lol) et hop, il vous la fabrique.

La fonctionnalité de génération de personnas fait également gagner un temps de dingue puisqu’en un clic, le LLM analyse le bouquin, invente une description de voix pour chaque personnage, génère l’audio de référence et assigne tout automatiquement.

Et pour les obsédés du détail, il y a même un éditeur web où vous regénérez n’importe quelle ligne individuellement, du training LoRA pour vous fabriquer des voix persistantes, et un export en MP3 en pistes séparées pour bidouiller ça ensuite dans Audacity, ou en
M4B
chapitré qui rentre direct dans Audiobookshelf, Apple Books ou VLC. Et tout ça bien sûr, dans une dizaine de langues, français compris.

Alexandria exigera par contre une carte graphique avec 8 Go de VRAM au minimum, 16 et plus si vous voulez du débit correct. Et si vous êtes sur Mac, mauvaise nouvelle, l’accélération MPS d’Apple Silicon n’est pas encore supportée, donc ça tournera en mode CPU, donc ce sera lent. Mais c’est pas très grave, vous lancez la génération, et vous retournez lire d’autres articles sur mon site pour passer le temps.

Même galère aussi pour les gens qui ont de l’AMD sous Windows. Les chanceux par contre, ce sont les possesseurs de NVIDIA sous Windows ou Linux et les AMD sous Linux. Maintenant si vous tenez juste à faire
parler votre Mac sans y passer trois heures par chapitre
, vous serez mieux servi ailleurs qu’avec Alexandria.

Pour l’installation, le plus simple passe par
Pinokio
en deux clics, et si vous n’avez pas le GPU qui va bien, il y a un notebook Google Colab pour tourner sur un T4 gratuit dans le navigateur. Comptez quand même un téléchargement de 3,5 Go pour les modèles TTS à la première utilisation, ils ne sont pas inclus dans l’install.

Vous l’aurez compris, c’est du DIY un peu gourmand en GPU, mais pour tous vos
ebooks à écouter
qui n’auront jamais de narrateur, ça ouvre les perspectives ! Le code est sous licence MIT et je vous invite quand même à tester avec un chapitre avant de vous lancer dans un roman entier.

Source

Source : korben.info