Chaînes de Markov et Monte-Carlo : quand les querelles façonnent l’IA

MATHÉMATIQUES & IA

Par Jp@NeuroStratum — Article original publié le 24 novembre 2025

Résumé — Saint-Pétersbourg, 1906. Un mathématicien russe en colère contre un prêtre-mathématicien veut prouver que la probabilité peut embrasser les variables dépendantes. Andreï Markov ne le sait pas encore, mais sa querelle avec Pavel Nekrassov va offrir à l’intelligence artificielle un de ses outils les plus puissants. Un siècle plus tard, Los Alamos — on cherche à simuler les réactions nucléaires — Stanislas Ulam invente la méthode de Monte-Carlo en jouant au solitaire. Deux passions, deux génies, deux outils qui se rencontrent et donnent naissance aux MCMC : ces algorithmes silencieux qui font tourner l’IA moderne.

⏱ Temps de lecture estimé : 5 minutes

Derrière les architectures flamboyantes de l’IA moderne se cachent des idées centenaires, nées dans la fureur d’une querelle académique ou au détour d’une partie de solitaire. Les chaînes de Markov et Monte-Carlo traversent l’informatique comme des fils invisibles, tissant PageRank, les HMM, le reinforcement learning, les LLM. Cette histoire commence dans la Russie impériale, se poursuit à Los Alamos, et irrigue aujourd’hui chaque recoin de l’IA.

La Querelle Qui A Changé l’Informatique

Andrey Markov (1856-1922), élève de Tchebychev, était un anticonformiste. Son intuition révolutionnaire : l’avenir ne dépend que du présent. Jusqu’alors, les probabilistes travaillaient avec des événements indépendants. Markov s’intéresse aux séquences où chaque élément influence le suivant.

L’anecdote la plus savoureuse : en 1913, il compte manuellement les 20 000 lettres d’Eugène Onéguine de Pouchkine pour prouver que les lettres se succèdent selon des probabilités de transition. Un mathématicien russe dénombrant patiemment chaque voyelle d’un poème pour prouver un point théorique.

Face à lui : Pavel Nekrasov (1853-1924), mathématicien respecté mais religieux, qui défend l’idée que la loi des grands nombres ne s’applique qu’aux événements indépendants. Pour Nekrasov, la « dépendance » ouvre un espace pour le libre arbitre, pour l’intervention divine. C’est séduisant philosophiquement, mais mathématiquement fragile.

Markov accuse Nekrasov de mélanger foi et science. Et pour prouver son point, il crée les chaînes de Markov : un modèle rigoureux pour traiter les séquences d’événements dépendants. Ironie magnifique : cet outil né d’une querelle avec un religieux devient un siècle plus tard un pilier du monde numérique.

Monte-carlo : du Solitaire à la Bombe

L’histoire de Monte-Carlo est tout aussi improbable. En 1946, Stanisław Ulam, mathématicien polonais à Los Alamos, se remet d’une encéphalite en jouant au solitaire. Question : quelle est la probabilité de réussir ? Le calcul combinatoire est trop complexe. Mais pourquoi ne pas simuler des milliers de parties et compter ?

John von Neumann saisit immédiatement le potentiel. Il formalise l’idée, la programme sur l’ENIAC, et l’applique aux problèmes de physique nucléaire. Le nom « Monte-Carlo » est choisi en référence aux casinos – humour interne à Los Alamos.

L’idée : quand c’est trop compliqué pour être calculé, simulons. Jetez des fléchettes aléatoires pour calculer π, simulez des millions de trajectoires pour comprendre une particule. Le hasard devient un outil d’exploration.

Omniprésence en IA Moderne

MCMC (Markov Chain Monte Carlo) marie les deux mondes : une chaîne de Markov dont la distribution stationnaire est celle qu’on cherche à explorer. On lance la chaîne, on laisse passer un temps de « burn-in », puis on collecte les états visités. Metropolis-Hastings, Gibbs sampling : ces algorithmes sont au cœur du bayesian deep learning, des modèles graphiques probabilistes, de l’inférence d’incertitudes.

Les chaînes de Markov irriguent tout : les HMM ont été la pierre angulaire de la reconnaissance vocale (Siri avant les transformers), du traitement du langage, de la bio-informatique. Les random walks alimentent PageRank, DeepWalk, node2vec, les Graph Neural Networks. Le reinforcement learning est presque entièrement markovien : l’agent évolue d’état en état. AlphaGo utilise Monte-Carlo Tree Search – symbiose parfaite entre les deux concepts.

Monte-Carlo est partout : la descente de gradient stochastique (SGD) estime le gradient sur un échantillon aléatoire. La robotique simule des millions de trajectoires virtuelles. Le dropout Monte-Carlo estime l’incertitude des prédictions. Les diffusion models (DALL·E, Stable Diffusion) débruitent progressivement en échantillonnant – Monte-Carlo dans l’espace des images. Les LLM échantillonnent chaque token selon une distribution.

La Beauté de l’Héritage

Markov nous a appris que l’avenir peut se comprendre par le présent, que les transitions suffisent à capturer la complexité. Monte-Carlo nous a appris que le hasard est un outil, pas un obstacle. Ensemble, ils ont engendré MCMC, l’art d’explorer l’inexplorable.

Combien de praticiens de l’IA savent que PageRank est une marche aléatoire, que GPT échantillonne à chaque token, qu’AlphaGo explore avec Monte-Carlo ? L’IA moderne est bâtie sur ces idées centenaires, souvent oubliées, mais éternellement pertinentes.

Markov voulait défendre la science contre l’obscurantisme ; Ulam voulait estimer des probabilités dans un jeu de cartes. Aucun n’imaginait qu’un jour, leurs intuitions feraient parler des machines, jouer aux échecs, générer des images, traduire des langues. C’est la beauté des mathématiques : elles survivent à leurs créateurs, voyagent à travers les époques, irriguent des domaines qui n’existaient pas encore.


Écrit avec le soutien de l’IA pour aider à organiser les pensées et façonner le langage.

Jp@NeuroStratum

Pour Aller plus Loin

Article publié initialement sur Skool IA Mastery le 24 novembre 2025.

Publications similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *