L'écosystème de l'intelligence artificielle vient d'accueillir un nouveau venu prometteur. Thinking Machines Lab, le laboratoire fondé par Mira Murati et d'anciens chercheurs d'OpenAI, dévoile son premier produit : Tinker. Cette plateforme vise à rendre accessible le réglage fin des modèles d'IA les plus avancés à un public élargi, des entreprises aux chercheurs indépendants.

Une équipe d'experts derrière l'innovation

Thinking Machines Lab n'est pas une startup ordinaire. Fondée par Mira Murati, ancienne CTO d'OpenAI qui en a brièvement dirigé l'entreprise fin 2023, la structure réunit plusieurs vétérans de l'IA. Parmi les cofondateurs figurent John Schulman, l'un des créateurs originaux d'OpenAI, Barret Zoph (ex-vice-président de la recherche), Lilian Weng (spécialiste sécurité et robotique), Andrew Tulloch (pré-entraînement et raisonnement) et Luke Metz (post-entraînement).

Cette concentration d'expertise a valu à la startup une valorisation record de 12 milliards de dollars après une levée de fonds de 2 milliards en juillet dernier, avant même le lancement de son premier produit.

Tinker : simplifier le réglage fin des modèles d'IA

Tinker se présente comme une plateforme automatisant le processus de réglage fin (fine-tuning) des modèles d'IA open source. Concrètement, elle permet aux utilisateurs de personnaliser des modèles existants pour des tâches spécifiques sans maîtriser toute la complexité technique sous-jacente.

« Nous croyons que Tinker aidera à donner aux chercheurs et développeurs les moyens d'expérimenter avec les modèles, et rendra les capacités de pointe beaucoup plus accessibles à tous », explique Mira Murati dans une interview.

Deux méthodes d'apprentissage disponibles

La plateforme supporte actuellement deux modèles open source : Llama de Meta et Qwen d'Alibaba. Les utilisateurs peuvent ajuster ces modèles via deux approches distinctes :

  • L'apprentissage supervisé : adaptation du modèle avec des données étiquetées
  • L'apprentissage par renforcement : méthode popularisée par ChatGPT qui utilise des retours positifs ou négatifs pour améliorer les performances

John Schulman, qui a dirigé le développement de l'apprentissage par renforcement pour ChatGPT, souligne l'approche de Tinker : « Il y a une part de magie secrète, mais nous donnons aux utilisateurs le contrôle total sur la boucle d'entraînement. Nous masquons les détails de l'entraînement distribué, mais conservons le contrôle complet sur les données et les algorithmes. »

Retours positifs des premiers testeurs

Les utilisateurs ayant testé la version bêta de Tinker saluent son équilibre entre simplicité d'utilisation et puissance technique.

Eric Gan, chercheur chez Redwood Research, utilise la fonctionnalité d'apprentissage par renforcement de Tinker pour entraîner des modèles à écrire des portes dérobées dans du code. « Tinker est définitivement beaucoup plus simple que de faire l'apprentissage par renforcement à partir de zéro », note-t-il.

Robert Nishihara, PDG d'Anyscale, ajoute : « Bien que d'autres outils de réglage fin existent déjà, Tinker offre un mélange remarquable d'abstraction et de capacité de réglage. »

Une vision ouverte face aux géants fermés

Thinking Machines Lab défend une approche résolument ouverte dans un paysage dominé par les modèles propriétaires. Alors que la plupart des entreprises américaines d'IA gardent leurs meilleurs modèles fermés, accessible uniquement via des API, la startup veut inverser cette tendance.

« Si vous considérez ce qui est fait dans les laboratoires de pointe et ce que font les autres personnes intelligentes dans le monde universitaire, ils divergent de plus en plus », observe Mira Murati. « Et ce n'est pas bon pour le progrès scientifique. »

Cette position intervient dans un contexte où la Chine compte désormais plus de modèles d'IA open source de pointe que les États-Unis.

Modération et modèle économique

Pour l'instant, Tinker est gratuit, bien que l'entreprise prévoie d'instaurer un système de tarification à l'avenir. La startup procède actuellement à une modération manuelle des demandes d'accès pour prévenir les mauvais usages, avec l'intention de développer des systèmes automatisés de contrôle.

Thinking Machines Lab mise sur la démocratisation du réglage fin comme prochaine frontière de l'IA. La startup a déjà publié plusieurs recherches fondamentales sur l'entraînement des modèles, notamment sur le maintien des performances des réseaux neuronaux et le réglage fin plus efficace des grands modèles de langage.

À retenir

  • Thinking Machines Lab réunit d'anciens cadres chercheurs d'OpenAI
  • Tinker automatise le réglage fin des modèles d'IA open source
  • La plateforme rend accessible l'apprentissage par renforcement, méthode clé derrière ChatGPT
  • Valorisation record de 12 milliards de dollars pour la startup
  • Approche ouverte face aux modèles fermés des géants américains