Dans cette quatrième et dernière partie de la série concernent le cycle de vie d’un projet d’intelligence artificielle, nous parlerons des défis de la mise en œuvre et de la mise à l’échelle d’un modèle d’IA.
Nous avons jusqu’ici couvert les étapes de la veille technique (VT), de la preuve de concept (PDC) et du prototypage (PR). En résumé, le PR crée un modèle de travail qui doit être intégré dans l’infrastructure de l’organisation. Une fois que le PR est en place, le projet passe à la phase finale de mise en œuvre et de mise à l’échelle du modèle.
QU’EST-CE QU’UN MODÈLE DE MISE EN OEUVRE ?
De nouveaux défis techniques se posent avec l’évolution continue de l’espace des problèmes qui génère de nouveaux cas d’utilisation. Les algorithmes d’IA doivent être mis à jour en les exposant constamment à des cas spécifiques obscurs. Le CDRIN travaille en collaboration avec les entreprises afin de déployer le modèle en production. Il offre une formation et un soutien aux équipes techniques dans la construction d’un pipeline de production d’IA. Ce processus implique les défis clés suivants :
INTÉGRATION AVEC L’INFRASTRUCTURE EXISTANTE
La filière de mise en œuvre du modèle comprend les modules suivants :
- Extraction et traitement des données : Les sources de données dans l’environnement de production peuvent aller des tables SQL aux flux de données intégrés, en passant par les flux de caméras.
- Formation : Développer et déployer des pipelines IC/DC (intégration continue/déploiement continu) pour mettre à jour stratégiquement le modèle formé afin d’incorporer de nouvelles informations.
- Prévision : Surveillance continue et contrôle des performances de prédiction du modèle dans l’environnement de données en direct.
- Sauvegarde des sorties : Le pipeline pour le traitement, l’affichage et le stockage des résultats
- Interface et mise à l’échelle du modèle : Contrôle l’événement déclencheur qui appelle à la prédiction sur l’environnement en direct et peut nécessiter une mise à l’échelle dynamique selon le modèle d’utilisation.
“Pour mettre en œuvre avec succès un modèle d’IA, les organisations doivent donc commencer par voir grand et adopter une approche à long terme qui englobe leur structure, leur clientèle et leurs flux de travail internes.” – Deepti Joshi
GÉRER LE TEMPS DE RÉPONSE
Toutes les étapes décrites précédemment font généralement partie d’un cycle de prévision constituant le temps de réponse en production. Pour certaines applications, cela est d’une importance cruciale. Par exemple, un système de suivi d’objets doit traiter plusieurs cycles de prédiction en une seconde. Un système de recommandation doit servir des milliers de clients en quelques secondes seulement pour une expérience utilisateur acceptable.
DES COÛTS
Il peut y avoir plusieurs types de coûts à chaque étape du déploiement d’un modèle. Certains d’entre eux peuvent inclure :
- Coût de la gestion des données : Les données, quel que soit leur mode de stockage, entraînent un certain coût. En dehors de cela, il existe un coût supplémentaire pour les services de données ou de streaming distribués de grande taille qui pourraient être nécessaires pour obtenir une faible latence et une haute disponibilité dans le pipeline de données.
- Dépenses d’infrastructure: La formation de grands modèles comportant des millions de paramètres nécessite un calcul de pointe. En particulier, le calcul GPU peut devenir essentiel pour les modèles qui impliquent un traitement d’image ou de vidéo. Une infrastructure interne d’une telle ampleur représente un important investissement ponctuel. L’alternative à cela est une infrastructure basée sur le cloud qui ajoute une somme importante au coût opérationnel régulier.
L’optimisation des coûts de mise en œuvre nécessite une planification intelligente et éclairée des ressources. Le cloud computing peut être d’une grande valeur dans ce cas car il permet d’utiliser l’important réservoir de ressources publiques dans la mesure de ses besoins.