Découverte de médicaments : programmer l’intuition

Découverte de médicaments : programmer l’intuition

Avec sa quantité astronomique de données, l’industrie pharmaceutique a recours à l’intelligence artificielle (IA)  pour tenter de séparer le bon grain de l’ivraie. Au CIFAR, l’équipe de Sarath Chandar se fie sur le hasard pour trouver de nouveaux médicaments. L’équipe de Sébastien Lemieux, de l’IRIC, elle, essaie de programmer l’intuition dans le code. Analyse et décryptage de la méthode avec ce chercheur spécialisé en bio-informatique.

Éviter le “sur-apprentissage”

Certains algorithmes plus fréquemment utilisés dans ce type de recherche se comportent comme un premier de la classe légèrement obtus, voué à identifier des motifs là où il n’y en a pas nécessairement. Il s’agit du phénomène du “sur-apprentissage” (“overfitting” en anglais). 

“Quand on entraîne des algorithmes,” relate Sébastien Lemieux, “c’est la première chose qu’on essaie de combattre. Parce qu’il ne fait pas distinction entre ce qui est important et ce qui ne l’est pas.”

Un équilibre bayésien

Une technique bayésienne évite de trouver des motifs là où il n’y en a pas.

En exploitant le théorème de Bayes dans la programmation, l’équipe de Sébastien Lemieux peut intégrer des notions comme l’intuition et l’incertitude au sein du processus virtuel. Afin d’y arriver, l’équipe va truquer le réseau pendant sa période d’entraînement. Cette perturbation artificielle introduit un bruit déconnecté de la réalité. 

“Il ne peut pas s’attarder sur un détail,” explique Sébastien Lemieux, “parce que ces détails vont changer d’une fois à l’autre. On espère qu’il va focuser sur des aspects plus généraux qu’on lui présente”, avec comme conséquence, des algorithmes qui ont moins tendance à apprendre une valeur par coeur et y rester concentré indéfiniment. 

“L’algorithme va faire une sorte de synthèse entre nos attentes en matière de données et les observations qui ont été faites,” explique le chercheur. “Quand on a plus de données, ce sont les données qui dominent, mais quand on a moins de données, ce sont les connaissances à priori qui vont prendre le dessus.” L’objectif est de créer un équilibre continu entre des observations en laboratoire et des connaissances acquises à priori.

Tendre la main

Bien que les chimistes et les informaticiens puissent partager des objectifs communs, comme contribuer à la découverte de médicaments, les champs professionnels sont souvent cloisonnés. Selon le chercheur, les chimistes peuvent parfois favoriser des modèles algorithmiques dépassés parce que ceux-ci ont livré des résultats probants dans le passé.  

Le professeur a donc mis en ligne la plateforme BiDRA. Il s’agit d’une page web démontrant les capacités de l’algorithme en question. L’objectif est de le rendre accessible à la communauté scientifique moins familière avec les nuances techniques propres à l’intelligence artificielle. 

“On essaie d’offrir le logiciel le plus facile à utiliser avec les résultats présentés de façon engageante”, affirme Sébastien Lemieux.

“On veut rendre les approches conviviales pour quelqu’un qui n’est pas informaticien. Quand on vient pour introduire une nouvelle méthode, on n’a pas le choix de comprendre les attentes des utilisateurs.”

Crédit Photo : IRIC

Note de la rédaction : cet article a fait l’objet d’une première parution le 29 juin 2020 et vous est proposé dans le cadre d’une rétrospective de nos meilleures publications.