Les outils d’IA agentique (agents autonomes capables de planifier, décider et agir via des outils) reposent sur une combinaison d’algorithmes issus du machine learning moderne, de la théorie de la décision et de l’optimisation.

Voici une vue structurée 👇

1️⃣ Les grandes familles d’algorithmes utilisés

A. Modèles de base : Transformers (LLM)

La majorité des agents actuels reposent sur des modèles de type Transformer, introduits par le papier Attention Is All You Need.

Algorithmes clés :

Self-attention
Attention multi-têtes
Apprentissage auto-supervisé
Fine-tuning supervisé
RLHF (Reinforcement Learning from Human Feedback)

Exemples de modèles utilisés dans les agents :

OpenAI (GPT-4/5)
Anthropic (Claude)
Google DeepMind (Gemini)

B. Planification et raisonnement

Les agents doivent planifier des actions multi-étapes.

Méthodes utilisées :

Tree of Thoughts (ToT)
Monte Carlo Tree Search (MCTS)
A* (recherche heuristique)
Planification hiérarchique (HTN)
Graphes de dépendance
Chaînes de Markov

C. Apprentissage par renforcement (RL)

Très utilisé pour l’agentique.

Algorithmes classiques :

Q-Learning
Deep Q Networks (DQN)
Policy Gradient
PPO (Proximal Policy Optimization)
Actor-Critic

Base théorique :

Processus de décision markoviens (MDP)

D. Mémoire et retrieval (RAG)

Les agents modernes utilisent :

Embeddings vectoriels
Recherche par similarité (cosine similarity)
Approximate Nearest Neighbors (ANN)
Index vectoriels (FAISS, HNSW)

2️⃣ En quels langages sont-ils développés ?

🔹 Langage dominant : Python

Pourquoi ?

Écosystème ML massif
Librairies spécialisées
Rapidité de prototypage

Librairies courantes :

PyTorch
TensorFlow
JAX
Hugging Face Transformers
LangChain
AutoGen

🔹 Autres langages utilisés

C++ → performance (inférence optimisée)
CUDA → calcul GPU
Rust → sécurité et performance
Go → orchestration backend
JavaScript / TypeScript → agents web

3️⃣ Outils mathématiques fondamentaux

L’IA agentique repose sur plusieurs piliers mathématiques :

📐 A. Algèbre linéaire (fondation absolue)

Espaces vectoriels
Matrices
Décomposition SVD
Produits scalaires
Valeurs propres

Tout LLM = multiplication massive de matrices.

📊 B. Probabilités & statistiques

Variables aléatoires
Bayes
Entropie
Maximum de vraisemblance
Divergence KL
Estimation Monte Carlo

📈 C. Optimisation

Descente de gradient
Gradient stochastique (SGD)
Adam
RMSProp
Lagrangiens
Optimisation convexe

🎲 D. Théorie de la décision

MDP
Bellman equations
Espérance mathématique
Exploration vs exploitation

🧠 E. Théorie de l’information

Entropie de Shannon
Cross-entropy
Mutual information

🔢 F. Théorie des graphes

Utilisée pour :

Planification
RAG
Graph reasoning
Knowledge graphs

4️⃣ Architecture typique d’un agent IA moderne

Un agent agentique combine :

LLM (raisonnement / langage)
Planner (planification d’actions)
Memory (court et long terme)
Tool use (API, recherche, code, base de données)
Boucle de contrôle (observe → plan → act → reflect)

C’est une superposition :

LLM + RL + Planning + Memory + Tooling

5️⃣ Résumé synthétique

Composant	Algorithmes clés	Mathématiques
LLM	Transformers	Algèbre linéaire
RL	PPO, DQN	Probabilités
Planning	MCTS, A*	Graphes
Mémoire	Embeddings	Géométrie vectorielle
Optimisation	SGD, Adam	Calcul différentiel

Carpe Diem

samedi 14 février 2026