13/03/2026

LiteRT – L'IA embarquée de Google passe la seconde

Par admin

TensorFlow Lite, c’est fini. Enfin presque car Google a rebrandé dernièrement son framework d’inférence embarquée sous le nom de
LiteRT
, et en a profité pour refaire pas mal de choses sous le capot.

Rassurez-vous mes petits prompts engineers (lol), le principe reste le même à savoir faire tourner des modèles de machine learning directement sur votre smartphone, votre tablette ou votre Raspberry Pi, sans envoyer vos données dans le cloud. Sauf que cette fois, y’a une nouvelle API baptisée Compiled Model qui change la donne car, en fait, l’ancien système vous obligeait à choisir manuellement votre accélérateur.

Avec ce Compiled Model, le runtime sélectionne automatiquement le meilleur accélérateur dispo, que ce soit le CPU, le GPU ou le NPU de votre appareil. Et ça gère l’exécution asynchrone et le zéro-copie côté buffers GPU… donc autant dire que côté latence, on passe de la 2CV au TGV. Bref, moins de bricolage pour les devs.

Côté plateformes, c’est plutôt copieux. Sur Android, ça exploite les NPU de Qualcomm, MediaTek et Google Tensor. Sur iOS, Metal se charge du GPU (et l’Apple Neural Engine arrive bientôt). Linux passe par WebGPU, macOS par Metal, et Windows reste en CPU pour le moment, et Google annonce même un support IoT avec Raspberry Pi. Carrément, du smartphone au micro-contrôleur ! Attention par contre, certains supports NPU sont encore marqués "à venir", donc ne vous attendez pas à tout faire tourner sur n’importe quel chipset dès demain.

D’ailleurs, le gros morceau c’est le support de l’IA générative embarquée. Avec le module LiteRT-LM, vous pouvez déployer des LLMs directement sur le téléphone. Pas de serveur, pas de connexion, tout tourne dans la poche. Bon, faut pas s’attendre à faire tourner un modèle de 70B paramètres sur un Pixel non plus, mais pour les devs qui veulent intégrer du GenAI dans leurs apps mobiles sans dépendre du cloud, c’est franchement pas mal. Et si
Ollama
vous permet déjà de faire tourner des modèles en local sur votre PC, ici je vous parle carrément d’appareils mobiles et d’embarqué.

Côté langages, y’a le choix : Kotlin et C++ pour la nouvelle API Compiled Model, Swift pour l’API Interpreter sur iOS, Python pour le desktop. Et si vous venez du monde PyTorch, un convertisseur dédié transforme vos modèles au format .tflite sans trop de douleur. L’ancienne API Interpreter reste dispo pour la rétrocompatibilité, mais à vrai dire, Google pousse clairement vers Compiled Model. Du coup, si vous aviez des projets TensorFlow Lite existants, la migration se fait en douceur parce que le format .tflite ne change pas.

En fait, le problème, c’est plutôt le manque de doc sur les cas tordus… et n’oubliez pas de tester vos modèles après conversion.

Pour ceux qui voudraient se lancer, tiens, y’a aussi un codelab de segmentation d’images en temps réel sur Android et une collection de modèles pré-entraînés sur Kaggle. Des apps d’exemple sont dispo sur GitHub pour pas repartir de zéro (détection d’objets, classification d’images, pose estimation…). Et si vous êtes plutôt Apple, sachez que
l’IA locale sur mobile
c’est clairement la tendance du moment.

Bref, si l’inférence embarquée ça vous parle, ça vaut clairement le coup d’œil !

Source : korben.info

Actus auto-importées phonandroid

Google Photos va transformer votre galerie en dressing numérique grâce à cette nouvelle fonction IA

Google Photos va bientôt connaître vos vêtements mieux que vous. L’application va scanner vos anciennes photos pour composer un dressing numérique complet. Il sera même possible d’essayer des tenues virtuellement… Source : www.phonandroid.com

Disque dur externe Seagate Portable 5 To à 119 € : on n’avait pas vu ce prix depuis longtemps

Pour la French Week d’Amazon, le disque dur externe Seagate Portable 5 To perd 40 € sur son prix. En utilisant le bon code promo, il descend à 119,99 €……

L’IA Claude s’invite dans la suite Adobe et d’autres logiciels de création

Anthropic continue de lier son IA Claude aux logiciels les plus utilisés à travers le monde. Cette fois-ci, place à la création artistique avec une intégration dans la suite Adobe,……

Sony met fin à la polémique : voici pourquoi tout le monde a cru que l’on pouvait perdre tous ses jeux PS5 au bout de 30 jours

La semaine a été mouvementée pour Sony, qui s’est retrouvé au milieu d’une polémique après l’intégration d’un nouveau DRM à sa boutique en ligne. Pendant plusieurs jours, la rumeur selon……

Honor Magic9 : le futur roi de la vidéo grâce à un partenariat avec un géant du cinéma ?

L’ultime smartphone de la série Honor 600, le Honor 600 Pro, ayant été présenté officiellement, les rumeurs peuvent désormais se focaliser sur les prochains modèles de la marque chinoise. Le……

LiteRT – L'IA embarquée de Google passe la seconde

Laisser un commentaire Annuler la réponse