Rocky – Le pote alien de Projet Dernière Chance débarque sur Raspberry Pi

J’sais pas si vous avez vu le film ou lu le livre mais Rocky, c’est l’araignée de roche extraterrestre de Projet Dernière Chance (Project Hail Mary) qui communique en chantant. Et Lahiru Maramba, un dev Firebase en poste chez Google, vient de le recréer en vrai avec un Raspberry Pi Zero 2W et un LLM local. Et voilà comme avoir un vrai pote Eridien posé sur votre bureau, qui vous répond en accords polyphoniques au lieu de parler.
L’architecture c’est ce que son concepteur appelle du "Voice Box & Brain". Le Pi Zero 2W tout seul est bien trop faiblard pour faire tourner un modèle de langage, du coup le Pi gère juste le hardware (micro, écran LCD, LED RGB, synthèse des accords) et balance l’audio brut à un Mac qui fait le gros du calcul. Le Mac transcrit ce que vous racontez avec mlx-whisper (un modèle Whisper-Tiny optimisé Apple Silicon), passe le texte à LM Studio qui fait tourner un Gemma 4 quantifié en local, et renvoie la réponse au Pi qui la joue en musique. Latence totale annoncée sur le repo, environ 2 secondes, soit, selon son propre benchmark, le même temps que via l’API Gemini dans le cloud, sauf que là, tout en local !
Le langage Eridien, lui, est fidèle au bouquin d’Andy Weir puisque chaque réponse est synthétisée en accords. Certains mots sont mappés sur des accords émotionnels précis, par exemple "amaze" sort en Mi majeur bien lumineux. Et pour les mots inconnus, ils sont hashés mathématiquement vers une signature de 3 fréquences, déterministe et permanente. Autrement dit, le même mot bizarre produira toujours exactement le même accord, comme un vrai vocabulaire qui se construit. C’est ce genre de petit détail qui fait la diff…
Côté matériel, il faut un
Raspberry Pi
Zero 2W et un PiSugar Whisplay HAT, un module tout-en-un qui apporte l’écran LCD, le bouton, la LED RGB et l’audio. De son côté, le repo propose 2 chemins d’install : la méthode "It Just Works" avec les drivers système précompilés (apt-get et c’est parti), ou la méthode isolée avec uv pour ceux qui veulent un environnement propre. Côté Mac, vous lancez LM Studio avec le modèle 4-bit quantifié sur le port 1234 et Y’a même un mode cloud avec une clé API Gemini si vous n’avez pas de Mac sous la main, ainsi qu’une fonctionnalité expérimentale planquée avec un générateur de sons façon R2-D2.
Pour la petite histoire, le film Projet Dernière Chance réalisé par Phil Lord et Christopher Miller est sorti en mars, avec Ryan Gosling en Ryland Grace et pour donner une voix à Rocky, les sound designers d’Hollywood ont tout simplement bossé avec un ocarina pour les aigus, une jarre pour les graves, et des chants de baleine, après avoir consulté Andy Weir sur l’anatomie du bestiau.
Je l’ai vu, et franchement, j’ai bien aimé. Je suis bien rentré dedans, même si j’aurais préféré que ce soit un peu plus "hard science" et un peu plus bidouille DIY comme l’était "Seul Sur Mars"… mais bon, il en faut pour tous les goûts/.
Après si l’idée d’un compagnon IA DIY vous branche mais que vous voulez un truc plus généraliste et pas un Eridien qui chante, jetez un œil à
Adeus
, l’assistant IA personnel open source que j’avais couvert.
Quoiqu’il en soit, voici la vidéo complète où Lahiru montre tout le process, du câblage à Rocky qui prend vie :
Bref, c’est gratuit, c’est sous licence MIT, et le repo est
juste ici
.
Amusez-vous bien à construire votre petit pote Eridien !
Source : korben.info