Aujourd’hui les entreprises disposent d’une masse impressionnante d’informations sur leurs internautes. Les nouvelles technologies de l’information permettent en effet une croissance exponentielle et une récupérationaisée des données web. La problématique qui en découle est bien entendu le traitement de ces données en grand nombre.
La multiplicité des points d’accès avec le client a notamment permis d’adapter l’information communiquée au client. Mais au-delà de l’adaptation de l’information, il est désormais nécessaire d’adapter le discours. Dans un milieu de plus en plus concurrentiel, où la réactivité est le maître mot, les entreprises qui se démarquent et se démarqueront sont celles qui sauront tirer profit des
nouvelles technologies pour optimiser la relation qu’elles entretiennent avec leurs clients. De plus, l’essor du e-commerce et l’utilisation de technologies de plus en plus avancées ont engendré l’ère de la haute personnalisation et il est désormais possible de tendre vers un marketing « one to one ».
On l’a bien compris, la connaissance de l’internaute est une problématique primordiale et les outils d’aujourd‘hui nous permettent de relever ce défi et d’explorer intelligemment la multitude de données laissées par chaque internaute après sa visite sur un site. Le Web Mining s’inscrit donc dans la réponse à cette problématique et se met au service de la connaissance client.
Quelques définitions préléminaires
Que sont les logs ? Ce sont des fichiers contenant l’activité du serveur web et répertoriant ainsi toutes les requêtes HTTP sur le site (demande de connexion, affichage de texte, affichage d’une image, …)
Que sont les cookies ? Ce sont des fichiers texte stockés sur le disque dur de l’internaute à chaque visite. Ils sont surtout utilisés pour suivre l’internaute au fil de ses visites et déterminer qui il est et ce qu’il a fait sur le site. Les cookies contiennent généralement l’identifiant client, la date de la dernière visite sur le site, le numéro de session, le code de transaction. Il est possible pour l’internaute de désactiverles cookies, rendant alors impossible l’utilisation de ces informations.
Que sont les tags ? Ce sont des marqueurs en Javascript qui sont insérés sur les pages d’un site. Lorsqu’une page contenant des tags est chargée, elle envoie des informations relatives à la navigation de l’internaute.
Quelle est la différence entre segmentation et typologie ? La principale différence entre ces deux techniques repose sur leurs méthodes : on parlera de méthode séparative pour la segmentation puisqu’elle permet un découpage successif en partant de la population totale, alors qu’on parlera de méthode agrégative pour la typologie puisque on cherche à regrouper les individus selon leurs points communs.
Qu’est-ce que le Web Mining ?
Définition
Le Web Mining est l’application des techniques du Data Mining à l’Internet. Il consiste en l’extraction d’informations pertinentes liées aux données collectées sur le web afin de mieux les connaître et de mieux appréhender leurs comportements.
Le Web Mining remplit trois objectifs principaux :
Améliorer la performance et le confort du site
Augmenter le rendement des espaces publicitaires
Améliorer la rentabilité de chaque internaute et la personnalisation du site
Les deux visions du Web Mining
Vision « site centric »
Web Structure Mining : analyse structurelle du web Le Web Structure Mining analyse la structure des sites Internet ainsi que le cheminement de liens en liens. Il permet ainsi d’améliorer la performance des sites en anticipant le parcours des internautes selon leurs centres d’intérêt et de les y amener de façon plus immédiate touten améliorant le confort de navigation (liens directs).
Web Content Mining : étude du contenu des pages Le Web Content Mining s’intéresse au contenu des pages web : texte, images, liens et processus de découverte des sources d’information à travers les pages Web.
Le plus courant reste le Text Mining basé sur des techniques de description, de classification et d’analyse d’expressions.
Il est principalement utilisé par les moteurs de recherche pour aider les utilisateurs à trouver ce qu’ils recherchent.
Vision « client centric »
Web Usage Mining : Analyse des comportements internautes Le Web Usage Mining consiste à analyser le comportement de l’utilisateur à travers son parcours de navigation sur le site, afin d’affiner au maximum les profils clients et les modèles comportementaux.
On identifie deux tendances dans le Web Usage Mining:
> Le General Access Tracking : analyse des fichiers logs pour comprendre les mécanismes d’accès et les tendances.
> Le Customized Access Tracking : analyse des tendances individuelles afin de personnaliser les sites en fonction des utilisateurs.
Les principales sources d’information du Web Mining :
Au-delà des données « classiques » (montant et détail de commandes, données sociodémographiques…), on collecte aujourd’hui des informations comportementales sur le web qui constituent de véritables « DataWebHouse ».
Ces informations récupérées grâce aux solutions d’analyse de logs, de cookies et tags sont nombreuses : la provenance de l’internaute (moteur de recherche, affiliation, emailing), centres d’intérêt (quelles pages a-t-il visité, sur quelles pages est-il resté assez longtemps et a-t-il porté un intérêt tout particulier, quelle est la fréquence de ses visites, …).
Comment appliquer le Web Mining à la connaissance client ?
Différentes méthodes statistiques sont utilisées dans le développement d’applications de Web Mining afin d’améliorer la connaissance client. Parmi elles, voici les plus fréquemment utilisées :
L’amélioration des segmentations clients et typologies existantes
Très répandues en offline, les segmentations et typologies clients peuvent être très largement appliquées au web. L’objectif consiste à créer des groupes de clients homogènes entre eux mais bien distincts afin de les animer de manière différenciée et adaptée.
Exemple d’une segmentation web dans le cadre d’un site e-commerce :
Sur une période d’étude fixée, chaque visiteur se voit attribuer une note pour chacune de ses visites. Cette note est fonction de la qualification de la visite (par exemple,note = 1 pour une visite entrante, note = 2 pour une visite comprenant au moins 10 pages vues, note = 3 pour une visite au cours de laquelle des produits auront été ajoutés
au panier…).
Pour chaque visiteur, on ajoute les notes obtenues pour chacune de ses visites.
L’analyse des combinaisons de scores va permettre d’identifier des groupes d’internautes aux comportements bien particuliers (gros consommateurs, petits consommateurs fidèles, …), pour lesquels on pourra par la suite adapter l’offre et le message.
L’anticipation des attentes clients par l’analyse des associations
L’objectif est de constituer des profils d’internautes partageant les mêmes centres d’intérêts pour recommander à un internaute certains produits qui ont satisfait d’autres utilisateurs au profil similaire. Ce type d’analyse a un fonctionnement asynchrone et fait appel la plupart du temps à des entrepôts de données sur lesquels les profils ont été préconfigurés.
Exemple d’une analyse des associations dans le cadre d’un site e-commerce :
L’exemple le plus simple concerne le développement d’offres croisées afin d’augmenter le panier moyen des internautes. Prenons un site de vente en ligne de livres qui veut construire un système de recommandation en fonction des livres dont l’internaute consulte la fiche produit.
Le principe consiste à calculer le nombre de fois où des livres X et Y auront été vus au cours de la même session.
Grâce à l’utilisation de trois indicateurs statistiques d’associations, il est possible d’extraire les combinaisons de livres les plus pertinentes :
>L’indice de confiance représentant la part de clients ayant vu les fiches produits X et Y parmi les clients ayant vu la fiche produit X
>L’indice de support désignant la part de clients ayant vu les fiches produits X et Y parmi la population totale (fréquence de l’association)
>Le taux d’amélioration confrontant l’indice de confiance à l’indice de support afin de mesurer la pertinence de l’association.
Sur chacune des fiches produits, une zone est réservée à l’affichage des recommandations et viendra automatiquement se baser sur le fichier des associations pertinentes. L’algorithme sera alors fréquemment rafraîchi et intégré au site pour suivre les évolutions comportementales.
Cette technique peut être étendue aux données de transactions : on s’intéressera alors aux livres ayant été achetés au cours d’une même commande.
La personnalisation
Véritable défi du Web Mining, la personnalisation comporte de multiples applications. Parmi elles, les ciblages emailing, les offres publicitaires personnalisées,le Behavioral Targeting.
Quelle évolution pour le Web Mining ?
La mise en place d’applications issues du Web Mining nécessite des ressources importantes, en termes de coûts et de compétences. Seuls les géants du e-commerce peuvent aujourd’hui bénéficier de telles applications. Toutefois,on peut s’attendre à une certaine démocratisation de ces techniques aux moyennes, voire même aux petites entreprises. En effet, les outils gratuits de web analytique commencent à proposer des applications d’optimisation de site (A/B Testing notamment), même s’ils ne permettent pas de conduire des analyses très complexes en matière
de Web Mining. Les solutions payantes, quant à elles, vont de plus en plus loin techniquement (certaines solutions proposent des applicatifs basés sur des algorithmes complexes de Web Mining, notamment en ce qui concerne les ventes croisées). De plus, les coûts de ces solutions payantes deviennent abordables, leurs tarifs étant calculés en fonction de la volumétrie des sites (notion de pages vues).
Le coût n’est donc plus l’obstacle principal au développement du Web Mining dans les entreprises. L’élément déterminant reste en effet les ressources, puisqu’une entreprise voulantpleinement bénéficier du Web Mining doit nécessairement avoir une équipe dédiée et experte dans le domaine, à moins de faire appel à un prestataire extérieur.
Autre changement : le domaine d’intervention du Web Mining. Aujourd’hui, les techniques de Web Mining sont principalement utilisées dans le cadre des sites e-commerce. Mais la récupération aisée des données web permet également leur application pour les blogs, sites communautaires, forums et autres. L’avènement du collaboratif et du participatif avec le Web 2.0 est donc
au coeur du sujet sur le Web Mining, certaines solutions venant d’ailleurs de voir le jour pour tracker l’intérêt des internautes, à l’article près !
Enfin, le Web Mining a un rôle très important à jouer dans le multicanal. Aujourd’hui, même si des stratégies se mettent en place sur les différents canaux de communication, rares sont les entreprises qui parviennent à suivre finement les comportements de leurs clients d’un canal à l’autre. Elles n’ont, la plupart du temps, qu’une vision morcelée du client. Or, pour s’inscrire dans une véritable problématique multicanale, il est indispensable de réaliser une intégration globale des différents canaux de contact : l’essor des solutions de web analytique d’une part, pour la
récupération des données web, et les techniques de Data Mining d’autre part, pour le traitement de l’information, vont enfin permettre la réalisation concrète d’études multicanales, avec une vision à 360° des clients sur l’ensemble des canaux de communication.
COMMENTENTAIRES
comments powered by Disqus