Un agent qui ne se contente plus d'assister
Jusqu'ici, Lain savait naviguer sur le web, manipuler des fichiers, exécuter du code. Mais dès qu'il fallait cliquer sur un bouton dans une application Windows ou remplir un formulaire qui n'a pas d'API, l'agent s'arrêtait.
Avec la version 0.23, cette limite saute. Lain peut maintenant utiliser directement l'interface graphique de Windows — clics, saisie clavier, scroll, drag-and-drop, raccourcis. Elle voit ce qu'elle fait grâce à de vrais screenshots, avec support multi-écrans.
L'ordinateur devient un environnement d'action, pas juste un terminal.
🖱 Contrôle autonome du PC
C'est la nouveauté la plus structurante de cette release.
Concrètement, Lain peut désormais :
- Automatiser des outils qui n'ont aucune API — logiciels métier, applications legacy, interfaces propriétaires
- Naviguer dans des interfaces complexes — menus, fenêtres modales, onglets
- Enchaîner des actions comme le ferait un humain devant son écran
Pour prendre ses décisions, l'agent capture des screenshots réels et les interprète. Le support multi-moniteurs permet de travailler sur des setups de travail réalistes.
📂 Upload de fichiers dans le navigateur
Pendant ses tâches de navigation web, Lain peut maintenant envoyer des fichiers dans des formulaires.
Ça paraît simple, mais c'est une brique essentielle. Beaucoup de processus réels passent par des portails web avec des documents à transmettre. Sans cette capacité, l'agent restait bloqué à l'étape critique. Maintenant, il peut compléter des chaînes d'actions de bout en bout.
🧠 Un nouveau système de configuration LLM
La gestion des modèles a été entièrement repensée :
- Catalogue de modèles intégré — plus besoin de chercher les identifiants
- Configuration par rôle — planification, exécution, résumé… chaque étape peut utiliser le modèle le plus adapté
- Migration automatique depuis l'ancien format
Un seul modèle ne suffit pas pour tout faire efficacement. La séparation par rôles permet d'optimiser la qualité du raisonnement, la vitesse d'exécution et le coût des appels.
Support de GPT-5.4
Cette release prend une dimension supplémentaire avec le support de GPT-5.4, qui améliore fortement :
- La planification des tâches complexes
- La compréhension des interfaces graphiques via les screenshots
- La fiabilité des actions dans les chaînes multi-étapes
Les plans deviennent plus cohérents, les séquences de navigation plus robustes face aux variations d'interface.
⚡ Chargement progressif des outils
Les outils peu utilisés ne sont plus chargés au démarrage, mais à la demande. Moins de contexte inutile, meilleures performances, agent plus réactif.
Réduire le bruit contextuel améliore directement la stabilité des décisions — surtout avec un modèle puissant comme GPT-5.4.
Plus de transparence
L'interface a été améliorée pour rendre l'exécution plus lisible :
- Visualisation des étapes du plan pendant l'exécution
- Affichage de la dernière pensée de l'agent
- Bouton pour voir le détail complet des outils utilisés
Comprendre ce que fait l'agent — et pourquoi — est essentiel pour construire la confiance dans un système autonome.
Planification renforcée
Le système de planification a été durci :
- Limite portée à 20 étapes
- Instructions plus strictes pour éviter les actions vagues
- Meilleure reprise après un choix utilisateur
- Les outils activés manuellement restent déverrouillés entre les sessions
La direction
Pris ensemble, ces changements dessinent une trajectoire claire. Lain évolue vers un agent qui comprend les objectifs, planifie, agit dans l'environnement réel et s'adapte aux interactions.
Un collaborateur logiciel autonome, pas un chatbot.
La version 0.23 pose les fondations pour faire fonctionner un agent dans un véritable workspace numérique — et les résultats avec GPT-5.4 montrent que le modèle commence à être à la hauteur de l'ambition.
Lain est un agent IA autonome développé par Ekioo. En savoir plus →