Introduction : le calcul de dose, un probleme computationnel majeur

Le calcul de la distribution de dose dans le patient est une etape fondamentale de la radiotherapie. Sa precision conditionne directement la qualite du traitement : une erreur de dose peut conduire soit a un sous-traitement de la tumeur, soit a des toxicites excessives aux organes sains. Historiquement, le calcul de dose repose sur des algorithmes deterministes (Pencil Beam, Convolution/Superposition, AAA) ou stochastiques (Monte Carlo). Chacune de ces approches presente un compromis entre precision et temps de calcul.

Le machine learning (ML) ouvre une troisieme voie : apprendre la relation entre la geometrie du patient, les parametres du faisceau et la distribution de dose resultante a partir de donnees d'entrainement. Cette approche promet des calculs quasi-instantanes avec une precision approchant celle des methodes de reference.

Methodes traditionnelles de calcul de dose

Algorithmes analytiques

Les algorithmes analytiques decomposent le probleme de calcul de dose en composantes primaire et diffusee. L'algorithme Pencil Beam (PB) modelise chaque faisceau elementaire comme un noyau de dose pre-calcule dans l'eau, corrige par la densite electronique du milieu traverse.

D(x, y, z) = \int \int \Phi(x', y') \cdot K(x - x', y - y', z) \cdot \rho_{el}(x, y, z) \, dx' \, dy'

ou $\Phi$ est la fluence primaire, $K$ est le noyau de dose et $\rho_{el}$ est la densite electronique relative. Cette approche est rapide (quelques secondes) mais presente des limitations dans les milieux heterogenes, particulierement aux interfaces tissu-air et tissu-os.

L'algorithme AAA (Anisotropic Analytical Algorithm) ameliore la precision en utilisant des noyaux de dose anisotropes qui tiennent compte de la direction de propagation, mais reste une approximation.

Algorithme de convolution/superposition

L'algorithme de convolution/superposition (C/S) est plus precis car il calcule explicitement le transport de l'energie deposee par les electrons secondaires :

D(\vec{r}) = \int T(\vec{r'}) \cdot h(\vec{r} - \vec{r'}, \rho) \, d^3\vec{r'}

ou $T$ est la fluence d'energie totale libere (TERMA) et $h$ est le noyau de convolution adapte a la densite locale. Le temps de calcul est de l'ordre de quelques minutes.

Monte Carlo

La simulation Monte Carlo, comme nous l'avons vu dans un article precedent, simule le transport individuel de chaque particule. Elle est consideree comme le gold standard de la precision dosimetrique, mais son temps de calcul (plusieurs heures pour un plan complet avec une incertitude inferieure a 2%) limite son utilisation en routine clinique.

Feature engineering pour la prediction de dose

Representation des donnees d'entree

La prediction de dose par ML necessite une representation structuree des donnees d'entree. Les features typiquement utilisees incluent :

Donnees anatomiques :

Image CT (densites electroniques ou nombres de Hounsfield) en 3D
Masques binaires des structures d'interet (volume cible, OAR)
Cartes de distance signee (Signed Distance Maps, SDM) a la frontiere de chaque structure

Donnees geometriques :

Distance a la source de rayonnement
Angles du bras et du collimateur
Configuration du MLC (ouverture des lames)
Carte de fluence primaire

Cartes de distance signee

Les cartes de distance signee (SDM) se sont revelees particulierement utiles comme features d'entree. Pour chaque voxel, la SDM indique la distance minimale a la surface de la structure consideree, avec un signe positif a l'interieur et negatif a l'exterieur :

SDM(\vec{r}) = \begin{cases} +d(\vec{r}, \partial S) & \text{si } \vec{r} \in S \\ -d(\vec{r}, \partial S) & \text{si } \vec{r} \notin S \end{cases}

ou $d(\vec{r}, \partial S)$ est la distance euclidienne minimale au contour $\partial S$ de la structure $S$ . Les SDM encodent implicitement la relation spatiale entre les structures anatomiques et les gradients de dose attendus, ce qui facilite l'apprentissage.

Architectures de reseaux de neurones

CNN 3D pour la prediction voxel a voxel

Les reseaux convolutifs 3D (3D-CNN) sont l'architecture de base pour la prediction dosimetrique. Ils traitent directement les volumes 3D d'entree et produisent un volume de dose en sortie. L'architecture se compose typiquement de couches convolutives, de normalisation par lots (batch normalization) et de fonctions d'activation ReLU.

Le defi principal est la taille des volumes medicaux : un scanner thoracique typique de 512 x 512 x 150 voxels ne tient pas en memoire GPU dans un reseau 3D complet. Les strategies pour contourner cette limitation incluent le decoupage en patches, le sous-echantillonnage spatial et les architectures a resolution multiple.

U-Net 3D

L'architecture U-Net 3D est la plus utilisee pour la prediction dosimetrique. Sa structure encodeur-decodeur avec connexions de saut (skip connections) permet de capturer a la fois les informations contextuelles globales (a travers les couches profondes) et les details spatiaux fins (a travers les connexions de saut).

L'encodeur reduit progressivement la resolution spatiale tout en augmentant le nombre de canaux de features :

\text{Encodeur : } (B, C, D, H, W) \xrightarrow{\text{conv + pool}} (B, 2C, D/2, H/2, W/2) \xrightarrow{} \cdots

Le decodeur realise l'operation inverse, augmentant la resolution spatiale par des operations de deconvolution ou d'upsampling. Les connexions de saut concatenent les features de l'encodeur aux features du decodeur a chaque niveau de resolution.

Architectures avec attention

Les mecanismes d'attention ameliorent les performances des U-Net en permettant au reseau de ponderer l'importance relative des differentes regions spatiales et des differents canaux de features. L'attention spatiale guide le reseau vers les regions anatomiquement pertinentes (interfaces tissu-tumeur, zones de gradient de dose eleve).

\alpha_i = \frac{\exp(s_i)}{\sum_j \exp(s_j)}, \quad \hat{x}_i = \alpha_i \cdot x_i

ou $s_i$ est le score d'attention pour le voxel $i$ et $\alpha_i$ est le poids d'attention normalise par softmax.

Reseaux generatifs adverses (GAN)

Les GAN (Generative Adversarial Networks) ont ete appliques a la prediction dosimetrique pour ameliorer le realisme des distributions de dose predites. Le generateur produit la distribution de dose a partir des entrees anatomiques, tandis que le discriminateur apprend a distinguer les distributions reelles des distributions predites.

La fonction de perte du GAN combine le terme adversarial classique avec un terme de reconstruction :

\mathcal{L}_{GAN} = \mathbb{E}[\log D(y)] + \mathbb{E}[\log(1 - D(G(x)))] + \lambda \|y - G(x)\|_1

L'avantage du GAN est de produire des distributions de dose plus nettes, avec des gradients plus realistes, en evitant l'effet de lissage typique des fonctions de perte L1 ou L2 seules.

Donnees d'entrainement et preparation

Constitution du jeu de donnees

La qualite du modele de prediction depend directement de la qualite et de la diversite des donnees d'entrainement. Un jeu de donnees typique comprend :

100 a 500 patients pour un site anatomique specifique
Pour chaque patient : image CT, contours, parametres de faisceau, distribution de dose de reference
La distribution de dose de reference peut provenir du TPS clinique, d'un calcul Monte Carlo, ou d'un plan cliniquement accepte

Augmentation de donnees

L'augmentation de donnees est critique en imagerie medicale. Les transformations applicables incluent :

Rotations et reflexions (en respectant la coherence physique)
Deformations elastiques simulant les variations anatomiques inter-patients
Ajout de bruit gaussien sur l'image CT
Variations de contraste et de luminosite

Il est important de noter que certaines augmentations doivent etre appliquees simultanement a l'image CT, aux contours et a la distribution de dose pour maintenir la coherence geometrique.

Methodes de validation

Metriques d'evaluation

Plusieurs metriques sont utilisees pour evaluer la qualite des predictions dosimetriques :

Metriques voxel a voxel :

MAE = \frac{1}{N} \sum_{i=1}^{N} |D_{pred,i} - D_{ref,i}|

RMSE = \sqrt{\frac{1}{N} \sum_{i=1}^{N} (D_{pred,i} - D_{ref,i})^2}

Metriques cliniques :

Ecarts sur les metriques DVH ( $D_{95}$ , $D_{mean}$ , $D_{max}$ pour les OAR)
Analyse gamma 3D avec criteres 3%/3mm ou 2%/2mm
Indice de conformite et indice d'homogeneite

Validation croisee et test externe

La validation croisee k-fold (typiquement k = 5) est la norme pour evaluer les modeles avec des jeux de donnees limites. Cependant, la validation croisee interne ne suffit pas a garantir la generalisabilite. Une validation externe sur des donnees provenant d'un centre different, avec des equipements et des protocoles differents, est fortement recommandee.

Applications cliniques

Planification adaptative

La prediction dosimetrique rapide est particulierement utile pour la radiotherapie adaptative, ou le plan de traitement doit etre re-evalue a chaque seance en fonction de l'anatomie du jour. Un modele de ML peut fournir une estimation de la dose en quelques secondes, permettant de decider rapidement si une re-planification est necessaire.

Optimisation de la planification

Les predictions de dose ML peuvent servir d'objectifs dosimetriques pour l'optimisation inverse. Plutot que de definir manuellement les contraintes de dose, le systeme utilise la prediction comme objectif cible, ce qui automatise et standardise le processus de planification.

Verification pre-traitement

Les modeles de prediction peuvent etre utilises comme outil de verification independante du calcul de dose du TPS. En comparant la prediction du ML avec le calcul du TPS, on peut detecter des erreurs potentielles de planification.

Comparaison avec Monte Carlo

Le tableau suivant resume les caracteristiques des differentes approches de calcul de dose :

Methode	Precision	Temps de calcul	Donnees requises
Pencil Beam	+/- 5-10% (heterogene)	Secondes	Modele physique
AAA / C/S	+/- 2-3%	Minutes	Modele physique
Monte Carlo	+/- 1-2%	Heures	Sections efficaces
Deep Learning	+/- 2-4%	Secondes	Donnees d'entrainement

La precision du deep learning est comparable a celle des algorithmes analytiques avances, avec un temps de calcul proche du Pencil Beam. Toutefois, la precision reelle depend fortement de la qualite et de la representativite des donnees d'entrainement.

Defis et perspectives

Robustesse et generalisabilite

Le principal defi des modeles de prediction dosimetrique reste leur generalisabilite. Un modele entraine sur des donnees d'un accelerateur specifique (par exemple Varian TrueBeam a 6 MV) peut ne pas etre directement applicable a un autre appareil (Elekta Versa HD) ou a une autre energie. Le transfer learning et l'apprentissage federe sont des pistes prometteuses pour ameliorer la generalisabilite.

Incertitude de prediction

Contrairement a Monte Carlo qui fournit une estimation statistique de l'incertitude, les reseaux de neurones classiques produisent une prediction deterministe sans quantification de l'incertitude. Les approches bayesiennes (MC Dropout, Deep Ensembles) permettent d'estimer l'incertitude de prediction, ce qui est essentiel pour l'application clinique.

Integration dans le workflow clinique

L'integration des modeles de ML dans les systemes de planification de traitement commerciaux necessite une validation rigoureuse et une certification reglementaire. Les constructeurs de TPS commencent a integrer des composants d'IA, mais le chemin vers un systeme entierement base sur le ML reste long.

FAQ

Le machine learning peut-il remplacer le calcul Monte Carlo ?

Non, pas dans l'etat actuel de la technologie. Le ML offre une approximation rapide mais ne reproduit pas la rigueur physique de Monte Carlo. Il est mieux adapte aux applications necessitant un calcul rapide (planification adaptative, verification) tandis que Monte Carlo reste incontournable pour la dosimetrie de reference, la validation des algorithmes et les situations ou la precision absolue est critique.

Combien de patients faut-il pour entrainer un modele de prediction de dose ?

La taille du jeu de donnees depend de la complexite de la tache et du site anatomique. Pour un site relativement standardise comme la prostate, 100 a 200 patients peuvent suffire. Pour des sites plus complexes comme la tete et le cou, 300 a 500 patients sont generalement necessaires. L'augmentation de donnees et le pre-entrainement sur des sites similaires peuvent reduire ces besoins.

Comment evaluer la fiabilite d'un modele de prediction dosimetrique en clinique ?

L'evaluation clinique doit inclure une analyse gamma 3D avec des criteres stricts (2%/2mm ou 3%/3mm), une comparaison des metriques DVH cliniquement pertinentes, et une validation sur un jeu de donnees externe provenant d'un centre different. Il est egalement recommande de comparer les predictions du modele avec des mesures experimentales sur fantome et d'effectuer une evaluation par des physiciens medicaux experts.

DosiPlot utilise-t-il du machine learning pour ses calculs ?

DosiPlot n'utilise pas de machine learning pour ses calculs de dose. Les donnees presentees dans DosiPlot sont calculees par simulation Monte Carlo avec le code PRIMO, ce qui garantit une precision de reference. Cependant, la comprehension des concepts de ML appliques a la dosimetrie est essentielle pour les futurs physiciens medicaux, et DosiPlot contribue a developper l'intuition dosimetrique necessaire pour evaluer les resultats de tout algorithme de calcul.

Machine Learning pour la prediction dosimetrique