27/02/2026

FDM-1 – L'IA qui utilise un ordinateur comme vous

Par admin

FDM-1 - L'IA qui utilise un ordinateur comme vous

Standard Intelligence
vient d’annoncer FDM-1, un modèle IA capable de contrôler n’importe quel ordinateur… en regardant l’écran et en cliquant. Comme nous !!

En gros le modèle regarde des pixels, comprend l’interface et exécute des actions. Clics, mouvements de souris, saisie clavier… et ça tourne à 30 FPS avec 11 ms de latence. Donc c’est beaucoup plus réactif que la plupart des français devant un formulaire administratif, quoi… ^^

Concrètement, vous pourriez lui demander de remplir vos tableurs Excel ou Google Sheets, de naviguer dans SAP, Salesforce ou n’importe quel logiciel métier sous Windows, macOS ou Linux, ou d’automatiser ces clics débiles que vous faites 200 fois par jour. Attention, c’est pas un bot Selenium ou un macro AutoHotkey hein. C’est vraiment un truc qui comprend ce qu’il voit à l’écran.

Du coup, ça se compose de 3 blocs. Un encodeur vidéo qui compresse le flux visuel, un modèle de dynamique inverse, entraîné sur 40 000 heures de données humaines, qui relie les actions aux changements d’écran, et bien sûr le modèle d’action, qui prédit le prochain clic.

Le truc carrément dingue, c’est l’échelle d’entrainement de ce modèle… 11 millions d’heures de vidéo d’entraînement, 80 000 machines virtuelles en parallèle, un seul GPU NVIDIA H100 qui pilote 42 VMs à la fois. Ça représente plus d’un million de simulations par heure. Y’a de quoi faire donc !

Et les applications vont loin… Par exemple, CAO sur Blender 3D, conduite autonome avec moins d’une heure de vidéo à 1080p, et même du fuzzing d’applications bancaires (Ahaha, je sais ça va vous plaire ça !).