La partie interessante n’est pas le parallelisme lui-meme, c’est la raison qui le motive. Un agent unique sur une tache longue finit par atteindre sa fenetre de contexte et commence a compresser le contexte anterieur, degradant la qualite des sorties. La solution de Kimi: deployer jusqu’a 100 sous-agents, chacun avec son propre contexte frais, coordonnes en essaim.

Le systeme est auto-organise: il determine combien d’agents deployer et comment diviser le travail selon la tache. Dans leurs benchmarks, ils citent des resultats 4,5 fois plus rapides et plus de 1 500 appels d’outils par tache.

Le cadrage qu’ils utilisent est un passage des “modeles plus grands” (mise a l’echelle verticale) vers l’intelligence organisationnelle (mise a l’echelle horizontale): un cerveau contre une entreprise ou un laboratoire.

Pas encore essaye, mais l’architecture est une reponse propre a une vraie contrainte.

Kimi Agent Swarm