Depuis son lancement, ChatGPT révolutionne le domaine de l’assistance virtuelle. Marquant le début d’une nouvelle ère pour les technologies de l’intelligence artificielle, l’outil diversifie ses possibilités et les usages qu’on peut en faire. Devant l’évolution continuelle de ChatGPT, à quoi peut-on s’attendre des versions prochaines de l’outil ?
Open AI prévoit l’ajout et l’optimisation de plusieurs fonctionnalités révolutionnaires, qui permettront à ChatGPT de devenir de plus en plus sophistiqué. Pour mieux en cerner les retombées potentielles, CScience s’est entretenu avec Benoît Parent, expert en technologie et intelligence artificielle.
Q: Des versions « améliorées » de ChatGPT ont déjà été annoncées et sont attendues. Mais avant de s’y attarder, si nous parlions de ce que les versions actuelles offrent déjà ?
R: La version 3.5 possède un modèle de langage qui est alimenté à partir d’une base de données. Toutefois, les informations provenant de ces données s’arrêtent à l’année 2021. De plus, cette version n’est pas équipée pour analyser des éléments contextuels, c’est-à-dire que même si elle a la capacité de produire un contenu personnalisé, l’une de ses principales failles relève de la mise en contexte.
Q: Quelles en sont les améliorations apportées par la version 4 ?
R: Actuellement, Microsoft est en partenariat avec Open AI pour l’intégration de l’intelligence artificielle à son moteur de recherche Bing. Désormais, nous sommes capables d’accéder à ChatGPT 4 à partir du moteur de recherche de Bing.
« (…) plus la machine est nourrie d’informations personnelles, plus elle a la capacité de répondre en fonction de votre contexte, de votre géolocalisation et de votre personnalité. »
– Benoît Parent, expert en technologie et intelligence artificielle
De ce fait, Open AI a également inclus à la version 4 la fonction d’interprétation de code, permettant ainsi à l’outil de créer une mise en contexte tout en analysant les éléments essentiels, et d’interpréter des documents pour en synthétiser ou en retranscrire le contenu.
Également, dans cette version, Open AI a optimisé le nombre de tokens en passant de 4096 pour la version 3.5 à maintenant 8192. Les tokens sont une unité d’information que le modèle utilise pour comprendre et générer un texte. Ainsi, dans l’édition 4 de ChatGPT, plusieurs aspects personnels sont pris en considération, et l’outil est donc capable de gérer des échanges plus complexes que la version antérieure.
« Open AI a optimisé le nombre de tokens en passant de 4096 pour la version 3.5 à maintenant 8192 (…) Ainsi, dans l’édition 4 de ChatGPT, plusieurs aspects personnels sont pris en considération, et l’outil est donc capable de gérer des échanges plus complexes que la version antérieure. »
– Benoît Parent, expert en technologie et intelligence artificielle
Par conséquent, plus la machine est nourrie d’informations personnelles, plus elle a la capacité de répondre en fonction de votre contexte, de votre géolocalisation et de votre personnalité. De plus, elle vous permet également d’ajouter des extensions pour compléter votre recherche et l’amener plus loin. Ce changement facilite la recherche de scripts de vidéos sur YouTube, et même l’accès en ligne à partir de la plateforme.
Sans oublier qu’avec cette version, nous pouvons même créer une image à partir d’un texte (text to image) avec DALL-E 2, un API d’Open AI. Également, grâce à une requête précise (un prompt), la version 4 vous donne les sources d’où proviennent l’information. Cette fonctionnalité est intéressante car elle vous permet de confirmer la validité du contenu généré.
Q: Que pouvons-nous espérer de la version 4.5 ?
R: Open AI a déjà apporté beaucoup d’innovation à sa version 4. Elle est déjà assez complète et possède beaucoup de fonctionnalités intéressantes comparativement aux versions antérieures. Ce à quoi nous pouvons nous attendre de la 4.5, en termes d’amélioration, c’est d’une augmentation du nombre de tokens, tout simplement.
Q: Il y a plusieurs spéculations quant à la version 5. Est-elle aussi pour bientôt ?
R : Malgré les rumeurs voulant que la version 5 soit lancée en décembre 2023, Sam Altman, Président et fondateur d’Open AI, a clarifié que l’entraînement du modèle 5 n’avait pas encore débuté. Également, il est important de démystifier les idées autour de l’intelligence artificielle générale (IAG). Une IAG est une IA capable d’effectuer ou d’apprendre pratiquement n’importe quelle tâche cognitive propre aux humains. L’IAG n’existe pas encore et nous ne savons pas encore quand elle va arriver.
« Une IAG est une IA capable d’effectuer ou d’apprendre pratiquement n’importe quelle tâche cognitive propre aux humains. L’IAG n’existe pas encore et nous ne savons pas encore quand elle va arriver (…) D’après plusieurs scientifiques, l’IAG ne devrait pas arriver avant 2037-2053. »
– Benoît Parent, expert en technologie et intelligence artificielle
D’après le peu d’information diffusée sur les médias, la version 5 procèdera des fonctions multimodales autant pour audio que pour vidéo. En effet, l’outil sera apte à interpréter les paroles et l’audio, et à transcrire l’information en texte. Cette version ne possèdera pas de limite de tokens, et sera probablement précurseuse de l’intelligence artificielle générale.
Dans cette vision, Open AI prévoit que ChatGPT 5 devienne un assistant virtuel permettant ainsi l’automatisation de certaines tâches. Sans égaler celle de l’humain, sa conscience en sera tout de même avancée.
D’après plusieurs scientifiques, l’IAG ne devrait pas arriver avant 2037-2053. À l’heure actuelle, nous n’en sommes qu’à l’apprentissage machine (machine learning). Aujourd’hui, le défi demeure celui de comprendre le raisonnement humain puisqu’il est abstrait et se fonde sur les émotions, les points de vue différents et les expériences personnelles.
À lire également :
Amazon Web Services et infonuagique : les dernières innovations en IA générative
Crédit Image à la Une : Freepik