Comment Netflix choisit les séries que vous allez regarder ?

Comment Netflix choisit les séries que vous allez regarder ?

Je ne sais pas vous, mais j’ai remarqué que Netflix me proposait des contenus plus ou moins pertinents. Si certaines suggestions me paraissent évidentes, l’algorithme a notamment compris ma passion pour les polars anglais, d’autres sont un peu discutables. Pourquoi me propose-t’il toujours des séries de superhéros alors que je n’en ai jamais regardé ? Cscience IA a testé pour vous l’algorithme de recommandation de Netflix.

Quand on termine une série ou un film sur Netflix, tout de suite après le générique apparaît une oeuvre du même genre, ce qui est assez pertinent et plutôt logique. Comme Netflix reste plutôt discret sur le fonctionnement de ses algorithmes, j’ai fait appel à un analyste de données (data scientist) qui travaille sur des algorithmes de recommandation depuis une dizaine d’années. Explications :

« En fait, il y a de grandes librairies d’algorithmes qui sont ouvertes à tous. Donc tous ces algorithmes de recommandation fonctionnent sur le même principe, après chacun rajoute quelques modifications selon ses stratégies marketing » m’explique Romain Marino, data scientist dans le commerce électronique. Que ce soit Netflix, Spotify ou encore les plateformes de commerce electronique. Ils utilisent tous trois principaux algorithmes.

Le filtrage collaboratif

Le premier est le filtrage collaboratif. C’est une simple matrice, comme un tableau Excel. En haut du tableau, une liste de séries et en bas une deuxième liste de séries. À l’intersection des colonnes, il y a le nombre de spectateurs qui ont regardé les deux séries. Ensuite, il n’y a plus qu’à voir les corrélations entre les séries. Par exemple, s’il y a de nombreux abonnés qui ont regardé la série Poupée russe et Unorthodox, mais très peu qui ont regardé Poupée russe et Good Girls ; alors à un abonné qui vient de regarder Poupée russe, l’algorithme va lui proposer d’enchainer avec Unorthodox, et inversement. Statistiquement il est fort possible qu’il l’apprécie, étant donné que de nombreux spectateurs apprécient ces deux séries. Et cela marche avec des combinaisons de 2 à de nombreuses séries. « C’est tout simple comme principe est rien qu’avec ça, on obtient déjà d’assez bons résultats ! » commente Romain Marino.

Mais alors que faire des grosses séries à succès que tout le monde regarde, même si elles sont éloignées de leurs goûts personnels ? Par exemple, je n’aime pas les séries de monstres mais je regarde Strangers Things comme beaucoup de monde. C’est là qu’intervient un deuxième paramètre, le lift.

Les subtilités du lift

Ce paramètre permet de pondérer les chiffres des programmes les plus vus. Le but : offrir une recommandation plus personnalisée. Le data scientist expose simplement l’équation derrière le lift comme suit : « C’est la probabilité de regarder Grey’s anatomy et Games of Thrones, divisée par la probabilité de ne regarder que Games of Thrones. Ce score-là permet d’enlever le fait que par défaut, tout le monde regarde Games of Thrones. C’est ce qui permet d’entrer dans la personnalisation des recommandations », poursuit Romain Marino.

Les communautés de goût

Toutes ces données permettent aux algorithmes de nous classer selon des communautés de goûts. Ainsi, la plateforme va proposer des contenus en lien avec ce que “ma communauté Netflix”, c’est-à-dire les utilisateurs qui ont les mêmes goûts que moi ont également aimé regarder.  Si j’analyse ma page d’accueil Netflix par exemple, je fais partie de la communauté des spectateurs qui aiment les polars anglais, les séries comiques se déroulant à Los Angeles et les documentaires policiers. Et c’est comme ça que je me retrouve à regarder la bande-annonce de Dirty John à chaque fois que je me connecte à mon compte. « C’est ce qui permet aussi de sortir des contenus que tu regardes habituellement, ça permet de te proposer des choses que tu n’aurais pas regardé autrement. Parce qu’on a remarqué que tout le monde regarde les best-sellers. Par contre, on a remarqué que ceux qui ont choisi le produit A, qui est moins populaire globalement mais qui est presque toujours acheté avec le produit B; alors si je te propose le A, je suis quasiment sûr que tu vas aussi prendre le B. Même si ce sont deux produits moins populaires tout seuls », analyse Romain Marino.

Malgré ce que je pensais, ces algorithmes ne se basent pas vraiment sur mes goûts personnels mais plutôt sur ‘ma communauté’. C’est ce qu’explique Todd Yellin, le vice-président de Netflix dans une entrevue à Wired : « Nous avons identifié 2 000 communautés de goût. Cela permet de déterminer l’ordre de ce que l’on propose à l’abonné. Vous pourriez avoir tout ce qui est drames à la deuxième rangée, tandis que pour moi cela apparaîtra à la quinzième ligne. » 

Par contre qu’importe son profil, un utilisateur se voit souvent proposé une série ou un film de superhéros. En effet, Marvel et Netflix produisent ensemble des séries depuis la fin 2013. Stratégiquement le marketing de la plateforme va pousser les contenus qu’elle produit.

Et l’éthique dans tout ça ?

Mais tout cela est-ce bien éthique? Pour répondre à cette question, j’interroge Martin Gibert, chercheur en éthique de l’intelligence artificielle à l’UdeM : « Pour un algorithme de recommandation de films, on a du mal à identifier quels sont les dangers éthiques derrière, ça ne me parait pas problématique en soit. Peut être que ça peut vous inciter à écouter toujours les mêmes choses mais bon, est-ce grave ? » 

Sans doute faudrait il considérer la question pour d’autres contenus que les films et séries visant au divertissement, notamment pour des documentaires qui présentent un point de vue ou défendent une théorie, voir même une idéologie…