Dans la course mondiale à l’intelligence artificielle, un acteur chinois s’impose de plus en plus clairement : Moonshot AI. Son nouveau modèle, K2.6, marque une progression rapide et vient bousculer les références du secteur. Trois mois seulement après la version précédente, K2.6 affiche des performances en hausse sur plusieurs tests clés. Sur SWE-Bench Pro, un benchmark qui mesure la capacité d’un modèle à corriger de vrais problèmes sur des projets GitHub, il atteint 58,6 points. Il dépasse ainsi GPT-5.4 et Claude Opus 4.6. Même tendance sur DeepSearchQA et Terminal-Bench, deux tests qui évaluent respectivement la recherche d’information complexe et l’exécution de tâches techniques.
Pour comprendre cette avancée, il faut regarder sous le capot. K2.6 repose sur une architecture dite “Mixture-of-Experts”. Concrètement, cela signifie que le modèle mobilise seulement une partie de ses capacités à chaque requête, ce qui réduit les coûts de calcul. Sur le papier, il compte 1 000 milliards de paramètres, mais n’en active qu’une fraction à chaque instant. Autre élément clé : la “fenêtre de contexte”. C’est la quantité d’informations que le modèle peut traiter en une seule fois. Ici, elle atteint 256 000 tokens, soit l’équivalent de centaines de pages de texte. De quoi améliorer la compréhension de tâches longues ou complexes.
Côté performance, Moonshot mise aussi sur la quantification INT4, une technique qui compresse les données numériques pour accélérer les calculs. Résultat : une inférence environ deux fois plus rapide, avec une perte de précision limitée. Mais tout n’est pas encore validé. La majorité des résultats provient des tests internes du laboratoire, et aucune reproduction indépendante complète n’a été publiée à ce stade. De plus, si les poids du modèle sont accessibles, les données d’entraînement et les méthodes utilisées restent confidentielles, ce qui limite la transparence.
Enfin, l’accès à ce type de modèle reste coûteux. Même en version optimisée, il nécessite plusieurs cartes graphiques haut de gamme et une infrastructure pouvant atteindre plusieurs milliers de dollars par mois. En résumé, K2.6 illustre une tendance forte : les modèles ouverts chinois se rapprochent désormais des meilleurs systèmes propriétaires. Mais la bataille de la transparence et de la reproductibilité, elle, est loin d’être tranchée.
Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.