La découverte de nouveaux médicaments se heurte à un défi de taille : les molécules utiles — et non nocives — à l’être humain sont rares, alors que l’espace de recherche pour les identifier est gigantesque. Cette contradiction peut être contournée grâce aux nouvelles percées en intelligence artificielle et à un type de données de santé encore peu pris en compte dans la médecine personnalisée : les métabolites.
Le bonheur presque parfait
Rappelez-vous le dernier moment où tout semblait parfait dans votre vie. Un moment heureux, sans soucis. Je dis bien semblait, car la classification internationale des maladies (ICD-11) rapporte en 2019 le nombre de 17 000 codes uniques de maladies. Pour chaque personne atteinte, la vie prend un tout autre sens, et pour les maladies graves, le diagnostic sonne souvent comme une condamnation.
Le début de la fin
En 2014, mon père m’annonçait qu’il était atteint d’un cancer du pancréas de stade 4. Ce diagnostic est arrivé trop tardivement pour que les traitements, qui ont de faibles taux de réponse, soient curatifs. Ce scénario se vérifie malheureusement pour un grand nombre de personnes atteintes de cette maladie, qui va toucher près de la moitié de la population au cours de leur vie. Si la mort est une étape inéluctable, le développement de solutions permettant de vivre plus longtemps et de vieillir en santé — voire, même, de ne pas vieillir, mais ceci fera l’objet d’un autre article et soulève des questions éthiques — bénéficierait d’une meilleure compréhension des applications possibles de l’intelligence artificielle et de la biologie.
C’est pour cette raison que, depuis 2014, je dédie mon temps à la lutte contre le cancer pour que d’autres n’aient pas à vivre l’immense tristesse de suivre un être proche dans la maladie et de le perdre prématurément. Je me réconforte à l’occasion dans les livres de mon père, écrivain, dont la dernière œuvre, dictée alors que je me trouvais à son chevet, témoigne de l’essence même de la vie : une reconnaissance à tous ceux qu’il a aimés.
Nos résolutions
Outre les résolutions que beaucoup d’entre nous prennent chaque début d’année, le fait de mieux manger et de faire de l’exercice font partie de la première étape du continuum de soins de santé, en agissant au niveau de la prévention. Suivent ensuite les étapes du diagnostic, du suivi et du traitement, lesquelles représentent des segments disjoints et qui ne mobilisent que rarement les mêmes données médicales. Il est de fait difficile de prévenir plus tôt et de mieux guérir. Pour que l’intelligence artificielle puisse intervenir dans le continuum des soins de santé, la qualité des données est cruciale. Elles doivent être riches en information, longitudinales et en grand nombre.
« Pour que l’intelligence artificielle puisse intervenir dans le continuum des soins de santé, la qualité des données est cruciale. Elles doivent être riches en information, longitudinales et en grand nombre. »
Une donnée idéale en santé
Parmi les 521 appareils médicaux logiciel approuvés par la FDA depuis 1998, le 75% est dédié à l’imagerie, une conséquence directe des percées en intelligence artificielle dans ce domaine. Actuellement, avec les nouvelles techniques, comme G-Flow-Net (voir ci-dessous), l’intelligence artificielle est apte à s’entraîner sur d’autres types de données, ouvrant la porte à des applications en génomique, en protéomique et en métabolomique. Cette dernière s’intéresse aux petites molécules de la vie qui régulent notre métabolisme, qui transforment ce que nous mangeons en énergie ou en matière et qui évacuent les déchets. Dominant la « pyramide de la vie », la métabolomique a fait d’énormes progrès dans les quinze dernières années, comme en témoigne la base de donnée métabolomique humaine internationale, gérée par l’équipe de David Wishart au Canada, qui répertorie pas moins de 220 945 métabolites, soit une augmentation au centuple depuis la sortie de la première base de données en 2007. Plusieurs de ces métabolites sont exogènes (microbiote, toxines, alimentation) et ont aussi une influence sur la santé et sur la réponse aux traitements. Plusieurs maladies graves dont le cancer, les maladies infectieuses (incluant la résistance antimicrobienne), le diabète et certaines maladies cardiaques créent un débalancement des métabolites qu’il est possible de mesurer en spectrométrie de masse. Cette technique d’analyse bénéficie d’appareillages de plus en plus performants, permettant de distinguer les différents métabolites à partir de quelques gouttes d’échantillon (sang, sérum, urine, etc).
Une analyse métabolomique en quelques secondes
Sans compter le temps où la maladie progresse de manière asymptomatique, il faut en moyenne 5 mois supplémentaires à la médecine pour diagnostiquer un cancer depuis les premiers symptômes, ce qui est une durée excessive dans une perspective curative. Actuellement, la médecine fonde beaucoup d’espoir dans des tests non invasifs qui pourraient diagnostiquer rapidement les différentes maladies avec une haute sensibilité. La métabolomique est une des avenues compte tenu de son faible coût et de sa facilité de mise en action. Certains dispositifs permettant une collecte d’échantillons à la maison avant même que les symptômes surviennent, le recours à des tests métabolomiques désengorgerait les hôpitaux et améliorerait l’efficacité des programmes de dépistage. En plus d’être utilisée pour diagnostiquer des maladies, la mesure des métabolites permettrait de suivre leur évolution dans le temps et d’évaluer la réponse aux traitements. La médecine personnalisée devient accessible.
Une percée révolutionnaire pour l’IA et la découverte de médicaments
Ce serait un euphémisme de dire que l’intelligence artificielle a augmenté en popularité compte tenu de ses performances et de ses multiples applications. Un des pères de l’IA moderne, Yoshua Bengio, fondateur et directeur scientifique de l’institut québécois de l’intelligence artificielle (Mila), est maintenant le 3e scientifique le plus cité au monde, tous domaines confondus. L’intelligence artificielle est partout et l’apprentissage profond (Deep Learning) a connu récemment une percée importante mise de l’avant par son fils, Emmanuel Bengio : le « Generative Flow Network ». Je vous invite à lire ce blog qui résume cet axe de recherche incorporant des notions de causalité, des données qui sont hors distributions normales et des données représentées sous forme de graphes.
L’image ci-dessus illustre comment des quantités probabilistes peuvent se propager dans le modèle d’apprentissage.
Ces travaux vont avoir une implication directe dans la découverte de nouveaux médicaments, qui ne sont autres chose que des molécules possédant des propriétés curatives, en passant par la modélisation, sous forme de graphes, de toutes sortes de molécules.
En combinant les voies associées aux métabolites caractéristiques des maladies, on peut contraindre l’espace d’exploration des molécules à celles qui auront une influence réelle sur le métabolisme humain, et non uniquement sur celles des modèles animaux.
La génération de nouvelles données par IA
Nous entrons dans une nouvelle ère de génération de données par l’IA (Generative AI). Les nouveaux modèles de langage naturels (tel GPT-3) comportent des centaines de milliards de paramètres. À titre indicatif, nous estimons que notre cerveau compte une centaine de milliards de neurones et cent mille milliards de synapses, soit environ trois ordres de grandeur de ces modèles d’IA. Il est maintenant possible de générer des images réalistes uniquement en décrivant la scène souhaitée avec des phrases. À titre d’exemple, la première image de cet article a été générée par l’intelligence artificielle à partir de mon visage et de la phrase “Un pharmacien sert un client dans un hôpital”. Si elle n’est pas encore parfaite, elle paraît assez bonne pour que le lecteur n’y porte pas une attention particulière. Cette image n’est pas issue d’un processus de copier-coller de mon visage sur une scène existante : cette scène est inventée de toutes pièces à partir des concepts tirés de la phrase fournie. Essayez vous-même en quelques clics sur openai.com. Ces technologies peuvent êtres adaptées pour générer de nouvelles données de molécules, des données adjacentes ou orienter la recherche médicale.
La lumière au bout du tunnel
Contrairement à un alpiniste qui connaît sa destination, la recherche en santé n’a que très peu de cibles quantitatives et elle peut difficilement mesurer le progrès. Même certains traitements ayant pu se rendre aux patients doivent parfois être retirés du marché suite à la découverte de risques pour la santé publique. Pour preuve, près de 13 000 traitements qui avaient complété avec succès les différentes phases des études cliniques ont dû être retirés du marché par la FDA.
Combiné à l’IA, la métabolomique peut aider au diagnostic, prédire et suivre la réponse au traitement ainsi que fournir les cibles sur les voies à rétablir pour le développement de nouvelles thérapies. Tel un phare, les métabolites sont des données de choix pour orienter la recherche vers les espaces à explorer et ceux à éviter. Il est temps de mettre les voiles.
Crédit Image à la Une : Unsplash