EVA-I conduit des travaux internes sur les techniques permettant d'exécuter des assistants d'intelligence artificielle intégralement sur le matériel de l'utilisateur, sans recours à des infrastructures cloud d'inférence ou d'entraînement. Les axes ci-dessous décrivent les domaines actuellement étudiés.
Étude des techniques de quantification (4-bit, 6-bit, mixed), de l'allocation mémoire unifiée des puces M-series et de l'optimisation des chaînes d'inférence sous MLX et Core ML, afin d'obtenir des temps de réponse compatibles avec une utilisation conversationnelle sur un matériel d'utilisateur standard (16 Go RAM).
Adaptation de modèles de langage ouverts par méthodes LoRA (Low-Rank Adaptation) directement sur l'appareil de l'utilisateur, sans externalisation des données d'entraînement. L'objectif est qu'un utilisateur puisse reproduire et contrôler l'intégralité de sa propre personnalisation.
Architectures de mémoire vectorielle persistante stockée localement, indexation sémantique des contenus utilisateurs, rappel contextuel pertinent sans transmission à des services tiers.
Protocoles permettant à un agent local de déclencher, explicitement et sur demande de l'utilisateur, des requêtes vers des modèles cloud de son choix, en isolant les données envoyées du contexte personnel non nécessaire à la requête.
Étude des implications du règlement européen sur l'intelligence artificielle (UE) 2024/1689 (« AI Act ») et du RGPD sur la conception de solutions d'IA edge, et identification des choix architecturaux qui réduisent ou éliminent les obligations de traitement de données personnelles à la source.
Les contributions ouvertes (code, modèles dérivés, jeux de données, articles) seront publiées au fur et à mesure des travaux sur des canaux ouverts (Hugging Face, GitHub) avec des licences permissives compatibles avec un usage commercial. Cette page sera mise à jour à chaque publication.
Dernière mise à jour : 16 mai 2026.