Quels sites internet utilisent des algorithmes de recommandation?

By Bastien

Qu'est-ce qu'un Algorithme de recommandation?

Le but d’un algorithme de recommandation est de suggérer des éléments pertinents aux utilisateurs.

Avant d’approfondir les détails d’algorithmes particuliers, discutons brièvement de ces deux paradigmes principaux modèles.

Nous classons généralement les algorithmes des moteurs de recommandation en deux types :

Les modèles de filtrage collaboratif et les modèles basés sur le contenu. Ils diffèrent par le type de données concernées.

  • Les modèles de filtrage collaboratif calculent leurs prédictions à l’aide d’un ensemble de données de commentaires des utilisateurs sur les éléments (généralement des notes par étoiles ou pouce vers le haut/pouce vers le bas).
  • Les modèles basés sur le contenu n’utilisent que les caractéristiques des articles (comme le prix d’un produit ou sa couleur).
quels site web utilisent des algorithmes de recommandation

Le modèle de filtrage collaboratif

Tout d’abord, plongeons dans les modèles de filtrage collaboratif. Ils sont construits sur un ensemble de données de commentaires d’utilisateurs/d’articles.

Il peut s’agir d’un retour explicite tel qu’un nombre d’étoiles ou d’un pouce vers le haut/le pouce vers le bas, ou un retour implicite tel que le nombre d’épisodes regardés dans une émission télévisée.

Nous catégorisons davantage ces modèles en fonction de la façon dont ils traitent ces données. Voyons les avantages et les inconvénients de chaque approche.

Utilisateur-Utilisateur :

L’algorithme de recommandation le plus couramment utilisé suit la logique « des gens comme vous, comme ça ».

Nous l’appelons un algorithme « utilisateur-utilisateur » car il recommande un élément à un utilisateur si des utilisateurs similaires ont déjà aimé cet élément.

La similarité entre deux utilisateurs est calculée à partir de la quantité d’éléments qu’ils ont en commun dans l’ensemble de données.Cet algorithme est très efficace lorsque le nombre d’utilisateurs est bien inférieur au nombre d’éléments.

Vous pouvez penser à une boutique en ligne de taille moyenne avec des millions de produits. L’inconvénient majeur est que l’ajout d’un nouvel utilisateur est coûteux car cela nécessite de mettre à jour toutes les similitudes entre les utilisateurs.

Article-Article

L’algorithme « élément-élément » utilise la même approche mais inverse la vue entre les utilisateurs et les éléments. Il suit la logique « si vous aimez ceci, vous aimerez peut-être aussi cela ».

Il recommande des articles similaires à ceux que vous aimiez auparavant. Comme auparavant, la similarité entre deux éléments est calculée en utilisant le nombre d’utilisateurs qu’ils ont en commun dans l’ensemble de données.


Cet algorithme est préférable lorsque le nombre d’articles est bien inférieur au nombre d’utilisateurs, comme les boutiques en ligne à grande échelle. Il est bien adapté si vos articles ne changent pas trop, car vous pouvez pré-calculer le tableau complet des similitudes article-article, puis proposer des recommandations en temps réel.

La mise à jour de ce tableau pour l’ajout d’un nouvel élément est malheureusement difficile.


Utilisateur-Item


Il existe plusieurs formes d’algorithmes de recommandation « utilisateur-élément » qui combinent les deux approches pour générer des recommandations. Les plus simples sont basées sur des techniques de factorisation matricielle.


L’objectif est d’apprendre des vecteurs de faible dimension (« embeddings ») pour tous les utilisateurs et tous les éléments, de sorte que leur multiplication permet de récupérer si un utilisateur aime ou non un élément.

Vous pouvez afficher ces vecteurs comme encodant à quel point un élément a une certaine fonctionnalité (comme un film étant un drame), et respectivement à quel point un utilisateur aime cette fonctionnalité dans les éléments.


Cette factorisation est mieux entraînée à l’aide de SVD, mais comme cet algorithme est très gourmand en calculs, nous préférons souvent des alternatives. Pour les ensembles de données à moyenne échelle, l’ALS donnera des performances raisonnables.

Pour les grands ensembles de données, seul l’algorithme SGD pourra évoluer, mais sera très lent.
Une fois que les intégrations d’utilisateurs et les intégrations d’éléments ont été pré-calculées, les recommandations peuvent être servies en temps réel.

Un autre avantage de cette approche est que vous pouvez en savoir plus sur les utilisateurs et les éléments à l’aide de leurs intégrations.

Par exemple, vous pouvez regrouper des utilisateurs ou des éléments en fonction de leurs préférences. Les algorithmes User-Item partagent l’inconvénient qu’il n’y a pas de méthode efficace pour mettre à jour les intégrations après l’ajout d’un nouvel élément ou d’un nouvel utilisateur.

Logo-Webast_Full_WhiteOnRed@HD

Webast vous accompagne pour développer votre présence en ligne

Création de site Web, SEO, Campagne Google...

Le modèle basé sur le contenu

Tous les modèles précédents souffrent de ce qu’on appelle le problème de démarrage à froid.

Étant donné que les recommandations sont calculées à l’aide d’un ensemble de données de commentaires des utilisateurs sur les éléments, ils ne peuvent pas recommander des éléments sans (ou seulement quelques) commentaires, tels que de nouveaux éléments.

De même, ils ne peuvent rien recommander à un nouvel utilisateur avant d’avoir commencé à donner des commentaires sur suffisamment d’articles.
Ces problèmes sont atténués à l’aide de modèles basés sur le contenu.

L’approche est identique aux précédents algorithmes User-User ou Item-Item, sauf que les similitudes sont calculées en utilisant uniquement des fonctionnalités basées sur le contenu.

Pour former un modèle résolvant le démarrage à froid de l’élément (resp. démarrage à froid de l’utilisateur), vous avez besoin d’un ensemble de données comprenant des descriptions détaillées de vos éléments (resp. de vos utilisateurs), comme le genre d’un film, son budget, sa durée, ou toute variable qui peut aider la recommandation.

Comment mettre une video sur instagram

Les récents progrès de la reconnaissance de formes dans l’apprentissage automatique ont permis de grandes améliorations dans le modèle basé sur le contenu à l’aide d’informations extraites d’images brutes ou de descriptions de texte brut.

De nombreux outils et modèles d’apprentissage en profondeur pré-entraînés de vision par ordinateur ou de traitement du langage naturel sont disponibles en ligne.

L’avantage évident de l’utilisation d’un modèle pré-entraîné est que vous n’avez pas besoin d’un ensemble de données énorme et de serveurs coûteux pour former votre moteur de recommandation.

Modèles hybrides et deep learning

Les algorithmes de moteur de recommandation les plus modernes, et ceux que nous utilisons ici chez Crossing Minds, tirent parti de l’apprentissage en profondeur pour combiner le filtrage collaboratif et les modèles basés sur le contenu.

Les algorithmes hybrides de Deep Learning nous permettent d’apprendre des interactions beaucoup plus fines entre les utilisateurs et les éléments.

Parce qu’ils ne sont pas linéaires, ils sont moins enclins à trop simplifier les goûts d’un utilisateur.
Les modèles d’apprentissage en profondeur peuvent représenter des goûts complexes sur divers éléments, même à partir d’ensembles de données interdomaines (par exemple, couvrant à la fois la musique, les films et les émissions de télévision).

Dans les algorithmes Hybrid Deep Learning, les utilisateurs et les éléments sont modélisés à l’aide à la fois d’intégrations apprises à l’aide de l’approche de filtrage collaboratif et de fonctionnalités basées sur le contenu.

Une fois les intégrations et les fonctionnalités calculées, les recommandations peuvent également être fournies en temps réel.

Modèles hybrides et deep learning

Les schémas d’apprentissage de tels algorithmes sont proches de l’apprentissage profond traditionnel, c’est-à-dire du SGD mini-batch avec heuristique d’accélération.

Mais le fait que les ensembles de données de recommandation soient assez différents des ensembles de données de vision par ordinateur habituels rend beaucoup plus complexe l’utilisation de la mise en œuvre et des outils existants (par exemple, de nombreux optimiseurs dans des bibliothèques comme TensorFlow ou PyTorch ne prennent pas en charge la mise à jour éparse de l’élan, qui est la pierre angulaire de formation de modèles profonds pour recommandation).

Les ingénieurs et les chercheurs sont souvent laissés à eux-mêmes pour mettre en œuvre et former davantage de choses, ce qui nécessite à la fois du temps d’expert et beaucoup de ressources informatiques.


Un autre inconvénient des modèles d’apprentissage en profondeur est qu’ils nécessitent une optimisation poussée des hyperparamètres. Comparés à la pléthore d’architectures open source en vision par ordinateur, les moteurs de recommandation n’ont quasiment pas d’architecture bien connue ou de modèle pré-entraîné.

 

Quels Sites web connus utilisent les algorithmes de recommandation ?

  • Netflix
  • YouTube
  • Tinder
  • Amazon

 

Voici des exemples de site web qui utilisent des algorithmes de recommandation.

Les systèmes attirent les utilisateurs avec des suggestions pertinentes en fonction des choix qu’ils font.

Les systèmes de recommandation peuvent également améliorer les expériences pour :

  • Sites d’actualités
  • Jeux d’ordinateur
  • Bases de connaissances
  • Plateformes de médias sociaux
  • Systèmes de soutien aux opérations sur actions

 

Et la liste n’est pas exhaustive. En bout de ligne ?

Si vous souhaitez offrir aux utilisateurs des choix ciblés, les systèmes de recommandation sont la réponse.

Voici un exemple de système de recommandation dans le commerce électronique.

H&M a adressé les recommandations suivantes aux utilisateurs qui ont cliqué sur « jupe plissée » comme achat potentiel :

Pourquoi l'ajout d'un système de recommandation à votre site Web est bénéfique

Alors, quels sont les avantages d’ajouter un système de recommandation à votre site Web ou logiciel ?

Voici une liste de quelques-uns :

  • Augmentation des ventes grâce à des offres personnalisées.
  • Expérience client améliorée.
  • Plus de temps passé sur la plateforme.
  • Fidélisation de la clientèle grâce au fait que les utilisateurs se sentent compris.

Une étude récente d’Epsilon a révélé que 90 % des consommateurs trouvent la personnalisation attrayante. De plus, 80 % supplémentaires affirment qu’ils sont plus susceptibles de faire affaire avec une entreprise lorsqu’elle leur propose des expériences personnalisées.

L’étude a également révélé que ces consommateurs sont 10 fois plus susceptibles de devenir des clients VIP, qui effectuent plus de 15 achats par an.

La morale de l’histoire? Si vous êtes intéressé par la vente croisée ou la diffusion d’offres personnalisées, un système ou algorithme de recommandation est fait pour vous.

Logo-Webast_Full_WhiteOnRed@HD

Webast vous accompagne pour développer votre présence en ligne

Création de site Web, SEO, Campagne Google...

Découvrez nos derniers articles de blog

Laisser un commentaire