Le data marketing au service de la connaissance client

From MARKETING POUR UNE SOCIETE RESPONSABLE
Jump to navigation Jump to search

Caroline BAYART

Cette partie vise à expliquer les objectifs et les méthodes couramment utilisées en data marketing. De l’identification des données pertinentes à la visualisation et l’interprétation des résultats, l’apprenant pourra se familiariser avec les différentes étapes du processus permettant d’apporter des réponses précises aux décideurs marketing.

Questions

  • Pourquoi la data science est devenue incontournable pour les marques ?
  • Quels sont les différents types de données qui intéressent les marketers ?
  • A quels objectifs répondent les analyses menées en data marketing ?
  • Comment la data science change les métiers du marketing
  • Doit-on craindre le pouvoir des données ?

Les enjeux de la data science pour le marketing

Si l’analyse des données n’est pas une science nouvelle, la digitalisation de la société et l’augmentation croissante de la puissance de calcul des ordinateurs ont, depuis la fin du XXème siècle, révolutionné la data science. Ce constat va de pair avec l’avènement du marketing relationnel et le développement de relations étroites entre les marques et les consommateurs.

Qu'est-ce que le data marketing ? Le data marketing est fondé sur la collecte, le traitement et l’exploitation de données, afin de mieux connaître les clients, prédire leur comportement et les persuader d’acheter un produit ou un service (Avery et al., 2012).

Pourquoi un tel engouement pour le data marketing ?

Acquérir de la connaissance sur les consommateurs

Les technologies web et mobile permettent aux consommateurs d’entrer en contact directement avec les entreprises et génèrent une grande quantité d’informations sur leurs comportements, leurs habitudes et leurs préférences. Cette masse de données offre aux entreprises l’opportunité de créer de nouvelles offres, de segmenter plus finement le parcours clients, de développer les ventes, et représente donc un réel avantage concurrentiel (encadré 1). Les professionnels du marketing doivent donc travailler avec des data scientist pour extraire et analyser des données issues des différents canaux de vente et de communication.

Produire des contenus de qualité

Sur de nombreux marchés, l’enjeu n’est plus de collecter des données, mais de les exploiter pour personnaliser les interactions avec les consommateurs. Davantage informés et exigeants, ces derniers attendent des réponses pertinentes. Le marketing doit donc mettre en place des actions ciblées, envoyer le bon message au bon moment à la bonne personne. En utilisant les données disponibles, les entreprises peuvent produire des contenus adaptés afin de convertir plus rapidement les prospects (encadré 2) et proposer une offre et une expérience personnalisées aux clients fidèles. Ainsi, une marque de vêtements de sport pourra cerner les préférences des clients en termes de pratique sportive et n’enverra une offre promotionnelle sur chaussures de running qu’aux clients adeptes de ce sport. Ensuite, le suivi des codes de réduction lui permettra d’identifier ceux qui tirent profit de cette l’offre, le comportement des consommateurs devenant ainsi une source d’information pour le marketing.

Encadré 1 : Amazon Go, l’exploitation des données au cœur du développement de l’entreprise dans le secteur du commerce de détail Amazon Go est une chaîne de magasins de proximité automatisés et sans caisse, exploitée aux USA et au Royaume-Uni par Amazon. Le système de vision par ordinateur permet de suivre et estimer de manière transparente les intentions des consommateurs : le parcours dans le magasin, les différents articles vendus (détection de la présence et du poids des références mises dans le panier), les actions effectuées avec les bras dans un rayon (prise et pose d’un article). Le système prend en compte les achats collectifs, en créant une session qui relie toutes les personnes d'un groupe (famille, amis) au même compte, à leur arrivée dans le magasin. Grâce à ces prouesses technologiques, Amazon collecte de nombreuses données comportementales. La richesse de ces données, reliées au profil des consommateurs, qui payent avec leur compte « Amazon Prime », permet à l’entreprise d’acquérir une connaissance très fine de sa clientèle. Amazon Go est ainsi capable de déterminer les emplacements les plus attractifs, de cibler les meilleurs acheteurs, d’identifier les offres et les services qui offrent une plus grande valeur pour chaque ménage et d’adapter les assortiments de produits en magasin.

« Data » : de quoi parle-t-on ?

Les données nous entourent et peuvent prendre des formes très différentes : des nombres, des dates, mais aussi des mots, des images, des sons, etc. Le marketing a besoin de données sur les caractéristiques sociodémographiques des consommateurs (genre, âge, lieu de résidence, situation familiale et professionnelle, etc.), ses centres d’intérêt (couture, sport, etc.) et ses comportements (achats en ligne ou en magasin, panier moyen, date d’achat, mode de paiement, réaction aux codes promotionnels, etc.).

Des données de différentes natures

Plusieurs modes d’acquisition des données coexistent : on distingue les données issues de l'observation (ex : le nombre de personnes qui entrent dans un magasin) et les données qui sont générées, le plus souvent lors d’une enquête auprès des consommateurs. Ces données n'existent pas avant d’avoir été collectées (ex : intention d’achat d’une lessive bio). Une deuxième approche sépare les données quantitatives (ex : le prix d’un baril de lessive en euros) et les données qualitatives (ex : le type de lessive- poudre, liquide ou tablettes). Les données quantitatives sont très utilisées en data marketing, car les opérations mathématiques ont un sens. On peut facilement calculer la moyenne d’un prix de vente sur un parc de magasins ou son évolution sur une période donnée. Il est toutefois possible de calculer des proportions à partir d’une variable qualitative, comme la part des ventes représentée par la lessive en tablettes. Les données ordinales[1] sont, elles, des données qualitatives particulières, puisqu’il existe une hiérarchie entre les modalités. En marketing, elles sont souvent mesurées par des échelles dites de Likert (allant de « pas du tout d’accord » à « tout à fait d’accord »).

L’importance des systèmes de gestion de base de données (SGDB)

L’évolution des technologies de l’information et de la communication permet d’obtenir un nombre considérable de données sur les consommateurs et les produits. Ces données sont stockées dans des bases de données, des tableaux regroupant en ligne les individus statistiques et en colonne les différentes variables ou attributs qui les caractérisent. De nombreuses erreurs, valeurs aberrantes ou données manquantes nuisent à la qualité de la base de données et nécessitent un lourd travail d’apurement[2] avant de réaliser des analyses.

Qu'est ce qu'une base de données ? Une base de données (BDD) est un ensemble de données structurées et organisées, stocké électroniquement sur un ordinateur.

Ces données sont gérées grâce à un système de gestion de base de données. Les utilisateurs peuvent accéder en temps réel aux données pour les modifier (mise à jour, ajout, suppression) ou les partager.

Encadré 2 : Alibaba et les descriptions personnalisées de produits

La plupart des suggestions de produits faites sur les sites marchands sont élaborées grâce au Machine Learning à partir du comportement de navigation des internautes et de ce que les autres clients, qui ont les mêmes préférences, ont acheté récemment. En investissant plus d’un milliard de dollars dans les domaines de l'intelligence artificielle et de l’internet des objets dans le but d'améliorer le service client, Alibaba a pris une avance non négligeable sur ses concurrents. L’entreprise a développé son propre assistant vocal, AllGenie, pour aider les utilisateurs dans leurs achats. Plus récemment, grâce aux traces laissées en ligne (aussi appelées « cookies ») ou lors des achats effectués dans des magasins, les algorithmes peuvent rédiger en temps réel des descriptions personnalisées, qui correspondent parfaitement aux produits recherchés par les consommateurs.

Le data marketing s’intéresse à tous les types de données et pas seulement aux données structurées. La fouille de données textuelles (corps des emails, publications sur les réseaux sociaux) n’est pas traitée dans cette partie mais intéresse également le marketing.

De la collecte à l’analyse des données

Le data marketing, enjeu majeur dans la stratégie des entreprises, repose sur l’utilisation d’outils statistiques robustes.

Les principaux objectifs du data marketing

Les analyses menées en data marketing dépendent des objectifs visés. Le premier objectif consiste à réaliser une analyse descriptive des données. En effet, avant de mettre en relation plusieurs variables entre elles, il est nécessaire de bien comprendre ce qu’elles représentent. En analysant les données d’une chaine d’hypermarchés, il est facile de savoir comment ont évolué les ventes de couches le mois dernier (nombre d’unités vendues, prix moyen, etc.). Une vision plus spatiale consiste à comparer ces résultats dans les différentes régions où l’enseigne est présente. En adoptant une logique explicative, le data marketing se tourne vers le passé pour mieux comprendre la survenue de certains événements. Aux Etats-Unis un algorithme d’extraction de corrélations fréquentes, utilisé pour identifier les articles contenus dans un même panier, a montré que les clients qui achètent de la bière et des gâteaux achètent aussi des couches. Cette corrélation s’expliquerait par le comportement des jeunes parents. Après l’accouchement, c’est le papa qui effectue le plus souvent les courses : des couches pour le bébé, de la bière et des gâteaux pour le prochain match à la télévision (Agrawal et al., 1993). Un autre objectif du data marketing, aussi appelé approche prédictive, consiste à se tourner vers le futur pour anticiper au mieux les événements à venir. L’exemple célèbre du père de famille qui a appris que sa fille, adolescente, était enceinte lorsque cette dernière a reçu des coupons de réduction pour des articles de puériculture, permet de comprendre la portée des algorithmes en data marketing (encadré 3). Le dernier objectif c’est l’optimisation ou la recherche de la meilleure solution. A partir de données spatiales, un algorithme peut déterminer la tournée de livraison d’une entreprise de messagerie qui satisfait à l’objectif de minimisation des ressources (humaines, financières etc.).

L’importance des outils statistiques

Pour comprendre les dynamiques passées et tenter de prédire les comportements futurs, les professionnels estiment des modèles (représentation simplifiée d’une réalité complexe). Le cas le plus connu est celui de la régression linéaire, qui permet d’expliquer la variation d’un indicateur par un ensemble de variables, toutes quantitatives. Il est par exemple possible de modéliser la consommation d’électricité en fonction du nombre de personnes dans un ménage et de la superficie du logement, puis d’effectuer des prévisions selon les caractéristiques de ce ménage. Le data marketing mobilise également des notions de statistique inférentielle et a recours à des tests (par exemple le test de Student ou du khi-deux) pour valider les résultats. En effet, à la différence des affirmations de sens commun, l’analyste cherche à savoir si les différences observées sont arbitraires ou statistiquement significatives. Une p-valeur de 5% (5% de chance que la différence soit due au hasard) est communément admise. La maitrise d’un certain nombre d’outils quantitatifs est donc nécessaire pour faire du data marketing. Le choix du modèle est très important. Il va dépendre de l’objectif des analyses et de la nature des données (quantitatives ou qualitatives). Ensuite, il faut être capable de choisir le test approprié, de de vérifier ses conditions de validité et d’interpréter les résultats avant de pouvoir conclure. Si la plupart des analyses descriptives peuvent être effectuée avec un tableur (Excel, Numbers, Openoffice…), les tests d’hypothèse et les estimations de modèles mutivariés nécessitent la maitrise de logiciels de statistiques (xlstat, SPSS, Stata, R, Python)

La visualisation des données

Une fois les résultats validés, il est indispensable de les communiquer aux décideurs. L’objectif de la visualisation des données est de faire comprendre des situations complexes en un temps relativement bref, c’est-à-dire d’aller à l’essentiel pour faciliter la prise de décision. Les options sont nombreuses, mais il faut adapter les représentations graphiques en fonction du type de variables et du message à faire passer : des diagrammes circulaires ou des diagrammes en barres représentent des répartitions ou des effets de structure ; une courbe traduit une tendance ou une évolution et un nuage de points montre la position d’un individu statistique par rapport à deux variables. Quel que soit le type de graphique, il est possible d’ajouter une dimension en nuançant les couleurs. Ces illustrations sont couramment disponibles sur les logiciels spécialisés en analyse statistique cités ci-dessus. L’objectif est par exemple de visualiser les interactions entre les individus suite à une analyse des données échangées sur un réseau social ou de visualiser le résultat d’analyses multidimentionnelles (segmentation, typologie). Très souvent, les analystes n’utilisent pas un fichier unique, mais des bases de données relationnelles, c’est-à-dire plusieurs bases liées les unes aux autres par des variables communes. Maitriser un langage de programmation (ex : Python) est très utile pour exploiter les données collectées. Si l’accès est simple et gratuit (code open source), leur utilisation demande en revanche un certain temps d’apprentissage.

Encadré 3 : les outils de data marketing utilisés par les magasins Target pour anticiper les événements marquants Une équipe de data analystes de la chaine de magasins nord americaine Target a analysé l'historique des achats de toutes les femmes qui s'étaient inscrites dans le passé aux listes de naissance de l’enseigne. Ils ont découvert que ces femmes achetaient de plus grandes quantités de lotions non parfumées au début de leur deuxième trimestre de grossesse, et de nombreux compléments alimentaires au cours des 20 premières semaines de grossesse. Suite à ce constat, ils ont identifié environ 25 produits qui, analysés ensemble, permettaient d'attribuer à chaque cliente un score de "prédiction de grossesse". En poursuivant les analyses, ils sont également parvenus à estimer de manière assez fine la date d'accouchement. Les implications managériales sont évidentes : la chaine de magasin, capable d’envoyer de façon ciblée des coupons de réduction à des périodes clé de la grossesse, peut améliorer sa position concurrentielle sur le marché très convoité de la puériculture.

Activation de données et stratégie marketing

Marketing automation et personnalisation de l’offre

Personnaliser les relations avec les consommateurs est une priorité pour rester compétitif sur son marché.

L’avènement du marketing one-to-one

Le data marketing permet de suivre le consommateur au cours de son cycle de vie et de lui proposer des messages adaptés. Avec le « marketing automation », le consommateur reçoit des contenus spécifiques selon le stade de sa relation avec l’entreprise. Par exemple, un prospect recevra du contenu informatif sur le produit ou le service recherché (descriptif, tutoriel, etc.) pour l’inciter à l’achat ; un e-mail sera envoyé à un nouveau client pour l’inciter à compléter ses données de profil et une offre promotionnelle ciblera les clients dits « dormants » qui n’ont plus effectué d’achat depuis plusieurs semaines. Ces actions sont déclenchées automatiquement, selon des éléments appelés « triggers » : comportement du consommateur (consultation du site web, création d’un compte, appel du service client, achat, etc.), contexte (météo qui impacte les ventes) ou événements définis à l’avance (date d’anniversaire, nombre de jours depuis le premier ou dernier achat, franchissements d’un nombre de points de fidélité, etc.).

Les différentes facettes de la personnalisation

Depuis plusieurs années, les consommateurs reçoivent des e-mails personnalisés avec leurs données de profil (encadré 4). C’est ce qu’on appelle la personnalisation dynamique de contenu, qui permet par exemple à un vendeur automobile de proposer un produit ou un autre en fonction du genre (homme ou femme) du destinataire. Il est aussi possible de personnaliser des notifications. Un quotidien peut envoyer une newsletter mettant en avant des sujets économiques, sociaux ou politiques selon les centres d’intérêt des consommateurs. Les progrès de la technologie autorisent la personnalisation des sites web et applications en fonction du statut du consommateur (recommandation de nouveaux produits pour les clients fidèles et lien vers une fenêtre de dialogue pour les clients dits « dormants ») et une pratique courante concerne la relance de panier abandonné. Les raisons sont variées Les raisons pour lesquelles les internautes ne valident pas leur panier et ne finalisent pas leurs achats en ligne sont nombreuses (ergonomie du site, facilité du choix, perte de confiance lors du paiement, frais de livraison, etc.), mais les connaitre permet d’optimiser le taux de conversion. Ainsi, une analyse comparative de prix pourra rassurer des consommateurs hésitants, alors qu’un coupon de réduction valable sur les frais de livraison sera une bonne stratégie pour les plus économes.

Le potentiel des données de géolocalisation

Grâce à la diffusion du smartphone auprès de la population, les entreprises peuvent géolocaliser les consommateurs et leur proposer la bonne offre au bon endroit. Les données de géolocalisation sont très utilisées, mais recouvrent des technologies et des usages différents.

Collecter des données passives

Les données dites passives sont collectées à l’extérieur des magasins (« outdoor »), suite à un paiement par carte bancaire, lors d’une connexion sur internet ou grâce à l’activation du smartphone. Des capteurs WiFi ou Bluetooth autorisent également le suivi d’un consommateur dans des endroits clos (« indoor »). Dans les transports publics (tram, bus), ces dispositifs permettent de suivre le nombre de passagers pour adapter l’offre (augmenter la fréquence des métros, ajouter des lignes de bus, etc.). Le « geofencing » est une technique utilisée pour bâtir un mur virtuel autour d’un magasin. A l’entrée dans ce périmètre, le signal est capté par une application dédiée et déclenche des notifications sur le smartphone de l’utilisateur (offre spéciale). Ces actions ciblant un internaute via ses données de géolocalisation et l'incitant à se déplacer en magasin pour y effectuer un achat sont regroupées sou le terme « Mobile to store ». Le conseiller de clientèle peut aussi être destinataire de l’alerte à l’approche du client et proposer un service personnalisé (accueil des personnes en situation de handicap).

Accompagner les consommateurs

Sur le point de vente, l’utilisation de ces technologies simplifient l’expérience d’achat. Il est possible de guider le consommateur dans les rayons et de lui envoyer des informations adaptées ou des promotions contextualisées (25% de réduction sur le deuxième produit du rayon) au cours de sa visite. Ainsi, dans le secteur de la culture, certains musées apportent des explications sur les œuvres exposées, au fur et à mesure de la progression du visiteur. La gestion dématérialisée des tickets d’attente et le paiement par mobile (NFC) sont également proposés par les enseignes telles qu’Apple Store. Toutes ces actions sont qualifiées de « Mobile in store ».

Proposer de nouveaux services

Les données de géolocalisations peuvent être utilisées pour créer de nouveaux services, tels que YouDrive, l’offre d’assurance automobile connectée d’Axa Direct Assurance. En échange de la présence d’un boîtier dans le véhicule, qui collecte des données de conduite grâce au GPS, et d’un accéléromètre, l’assuré bénéficie d’un tarif préférentiel sur sa prime d’assurance et d’un retour sur son comportement de conduite. Avec une diminution du nombre d’accidents (donc du montant des dommages à rembourser), l’entreprise peut financer les réductions de cotisations et le coût du boîtier. Les informations collectées sont également utiles pour apprécier les risques pris au volant par chaque assuré et pouvoir proposer, dans le futur, des primes différentes selon le comportement des conducteurs.

Encadré 4 : les outils de data marketing utilisés par Airbnb pour améliorer l’offre de services Grâce aux informations collectées pour la plupart suite aux retours clients, Airbnb améliore son offre de services et propose une expérience client exclusive. Les analyses de régression permettent de rechercher les caractéristiques d’une annonce qui ont poussé les internautes à réaliser une réservation. L’analyse des photos via l’apprentissage automatique va encore plus loin, autorisant l’envoi de suggestions personnalisées aux hôtes, pour mettre en avant leur logement. L’entreprise utilise également les résultats de modèles prédictifs, pour connaître la probabilité qu’un logement soit réservé à un niveau de prix donné et accompagner les hôtes dans cette étape délicate. Se basant sur le principe du yield management[3], une fonctionnalité autorise la modification du prix de réservation en temps réel et selon le contexte (saison, localisation, commodités, etc.). Plus récemment, Airbnb exploite un outil basé sur l’intelligence artificielle, qui recherche sur Internet des indices indiquant qu’un individu n’est peut-être pas fiable. Divers éléments telles que les publications sur les médias sociaux permettent d’évaluer la probabilité d’avoir des traits de caractère « non fiables » pour rassurer et protéger les hôtes.

Comprendre les risques liés au data marketing

Si le potentiel du data marketing pour les entreprises a été démontré (personnalisation des interactions, ciblage des offres, etc.), la collecte croissante d’informations liées aux habitudes, préférences et attente des consommateurs présente des limites.

Des pratiques encadrées

Les contraintes légales (CNIL)

Les informations personnelles sont protégées par la CNIL, la Commission Nationale de l'Informatique et des Libertés été créée par la loi Informatique et Libertés du 6 janvier 1978. Cette autorité administrative indépendante est chargée de veiller à la protection des données personnelles contenues dans les fichiers et traitements informatiques. Lors des enquêtes auprès de leurs clients, les entreprises doivent ainsi garantir l’anonymisation des fichiers (des techniques de « hachage » sont utilisées pour ne pas conserver l’identité des répondants). La CNIL milite aussi pour la mise en place de mesures qui limitent l’exploitation commerciale des informations personnelles. Le règlement général européen sur la protection des données (RGPD), entré en vigueur le 25 mai 2018, a renforcé le rôle du consentement pour les traceurs publicitaires. A présent, les sites Internet doivent afficher un bouton « tout refuser » en face du bouton « tout accepter ».

L’éthique de l’entreprise

La situation est paradoxale : pour recevoir des communications et offres commerciales ciblées, les consommateurs acceptent de divulguer des informations personnelles et, par conséquent, une réduction de leur vie privée. Au centre de ce paradoxe, la question est de savoir si ces informations ont été fournies volontairement ou non par les intéressés. Les consommateurs fournissent souvent de leur plein gré des informations telles qu'un nom, une adresse électronique ou postale, dans le cadre d’un achat en ligne. Cependant, les limites concernant la volonté des consommateurs de fournir des informations personnelles deviennent rapidement floues. Le respect des lois et du règlement s’impose à toutes les entreprises, mais ne suffit pas, étant donné les compétences avérées des professionnels du marketing à obtenir des données de manière détournée (Aguirre et al. (2015). L'utilisation des cookies a ainsi donné lieu à un débat controversé, avant d’accorder aux spécialistes du marketing la possibilité de suivre les mouvements des internautes à grande échelle. Toutefois, la gestion de la confidentialité des données peut être une réelle stratégie d’entreprise, les consommateurs étant plus disposés à accorder aux entreprises la permission d'utiliser leurs informations personnelles lorsque les procédures apparaissent comme équitables (ce qu’on nomme la justice procédurale).

La perception des consommateurs sur l’utilisation de leurs informations personnelles par l’entreprise qui les collecte est donc un point sensible. Si la personnalisation peut conduire à un engagement accru, la collecte d'informations doit être transparente, afin que les consommateurs ne se sentent pas vulnérables. Tous ne souhaitent pas être « fliqués » en permanence, ni crouler sous les messages promotionnels, sur leur téléphone ou leur boîte e-mail. Plus grave, le sentiment que les informations personnelles sont exploitées de manière abusive pourrait nuire à la réputation de l’entreprise et briser la relation de confiance établie avec les consommateurs. Définir et mettre en avant une politique de protection et de confidentialité des données est donc indispensable pour rassurer les consommateurs, partagés entre les bénéfices offerts par les nouvelles technologies et le souci du respect de leur vie privée. Une bonne gestion de la confidentialité des données offre aux consommateurs une expérience positive de la marque, qui constitue un réel avantage concurrentiel (Goldfarb and Tucker (2013). Dans ce contexte, les entreprises ne doivent pas considérer les mesures de protection de la vie privée comme coûteuses ou contraignantes, mais saisir l’opportunité d'améliorer l'expérience client, afin de garantir la fidélité et renforcer les relations créées avec les consommateurs

Des dérives possibles

La sollicitation abusive des consommateurs

Le suivi de l’historique de recherche des consommateurs sur internet est rendu possible par les cookies. Ces petits fichiers (quelques ko) stockés sur l’ordinateur lors de la consultation d’un site web seront renvoyés lors d’une connexion ultérieure sur le même site. L’objectif est de reconnaitre le consommateur, de se souvenir de son historique de navigation et d’améliorer son expérience utilisateur (proposition de produits et services). Il existe également des cookies publicitaires, davantage montrés du doigt. Grâce à ces véritables traceurs, le consommateur reçoit des publicités sur les produits consultés récemment, même s’ils se trouve sur d’autres sites, et des algorithmes permettent d’envoyer directement des recommandations dans les boites de messagerie. Les sites concernés doivent obtenir le consentement des internautes pour utiliser des cookies, sauf s’ils sont indispensables à leur fonctionnement. Mais les consommateurs ne comprenant pas toujours l’enjeu de la démarche se retrouvent submergés par les sollicitations commerciales.

Le potentiel des objets connectés

Le développement des objets connectés, qui communiquent de façon autonome avec d’autres objets, offre de nouvelles perspectives. Il devient ainsi possible de suivre de manière fine et à leur insu le quotidien des consommateurs, qu’il s’agisse des aliments stockés dans leur réfrigérateur ou les heures d’entrée et de sortie du domicile. Par exemple, de nombreuses marques proposent des serrures connectées, permettant d’ouvrir les portes à l’aide d’un smartphone, à l’aide d’un simple protocole de communication (Bluetooth, wifi…). De même, les compteurs Linky collectent la signature électrique des différents appareils, ce qui renseigne précisément sur le mode de vie des individus (heures de repas, de détente, de toilette, etc.). De nombreuses entreprises collectent des informations sur les consommateurs. Prises indépendamment, ces données ne concernent qu’une partie du comportement des consommateurs, mais le croisement de différentes bases de données permet d’avoir une connaissance très fine de leurs habitudes.

La manipulation d’images

Avec les progrès de l'informatique et la diffusion des algorithmes au grand public, les mauvais usages sont potentiellement nombreux. La manipulation d'images est un sujet d'actualité, notamment suite au développement des deepfakes ou faux contenus, générées par des algorithmes de plus en plus perfectionnés (les « GANs » ou generative adversarial networks). Ils trompent les consommateurs puisqu’ils font dire ou faire à des individus des choses qu’ils n’ont jamais dites ou faite. Ces détournements sont d’autant plus dangereux qu’ils sont difficiles à repérer. Des sites tentent de sensibiliser le grand public à ces usages (encadré 5).

Encadré 5 : les photos de faux visages On peut recruter des profils et générer des photos à moindre coût. C’est ce que propose le site www.thispersondoesnotexists.com. A chaque visite sur le site, un nouveau visage apparaît, un visage qui n’existe pas. Ces visages artificiels sont générés par des algorithmes. Un premier réseau, dit générateur, créé une image à partir de données réelles (vrais visages) et un second, appelé discriminateur, décide si l'image respecte les critères fixés ou si une nouvelle doit être générée. Cette application semble particulièrement intéressante pour le secteur de la communication, de l’illustration ou du jeu vidéo, d’un point de vue économique (gain de temps et d’argent) et sociétal (photo d’enfants en un clic). Toutefois, en détournant l’utilisation de tels algorithmes, le risque d’usurpation d’identité ou de création de faux comptes en ligne n’est pas négligeable. Il devient alors possible à son auteur de lancer des campagnes d’harcèlement ou des propagandes.

Afin d’obtenir un avantage concurrentiel sur le marché, de nombreuses entreprises investissent massivement dans la connaissance des clients pour mieux comprendre leurs préférences, leurs goûts, leurs freins, mais aussi leurs attitudes, leurs opinions et leurs comportements. Des processus de collecte de données à grande échelle ont ainsi vu le jour, utilisant des technologies allant de la simple carte de fidélité au boitier GPS. Ces pratiques ont donné lieu à l'utilisation du big data en marketing. L’excès de confiance dans les algorithmes peut toutefois conduire à des choix erronés et entrainer une déqualification. De plus, le lien entre l’utilisation de la technologie et le gain de performance est difficile à mettre en évidence et la question du caractère privé des données est un vrai challenge. Le data marketing est donc un choix stratégique qui nécessite le recrutement de spécialistes et une conduite éthique dans la collecte et l’utilisation des données.

Références

  • Agrawal, R., Imieliński, T., Swami, A. (1993). Mining association rules between sets of items in large databases. SIGMOD Rec., 22 (2), 207-216.
  • Aguirre, E., Mahr, D., Grewel, D., Ruyter, K. D., & Wetzels, M. (2015). Unraveling the personalization paradox: The effect of information collection and trust-building strategies on online advertisement effectiveness. Journal of Retailing, 91, 34–59.
  • Avery, J., Steenburgh, T.J., Deighton, J., Caravella, M. (2012). Adding bricks to clicks: Predicting the patterns of cross-channel elasticities over time. Journal of Marketing, 76 (3), pp. 96-111
  • Carroll, J.D., Green, P.E. (1997). Mathematical Tools for Applied Multivariate Analysis, Academic Press.
  • Goldfarb, A., & Tucker, C. (2013). Why managing customer privacy can be an opportunity. MIT Sloan Management Review, 54, 10–12.

[1] Une variable ordinale est une variable qualitative dont les modalités sont définies par une relation d’ordre, sans qu’il existe d’intervalles égaux entre elles (Green and Green, 1997).

[2] L'apurement est une étape lors de laquelle le fichier de données de l'enquête subit une multitude de contrôles et de tests de cohérence afin d'en améliorer la qualité.

[3] Pratique commerciale qui permet d’optimiser le revenu global de l’entreprise en ajustant une capacité contrainte à une demande segmentée. Apparue initialement dans les secteurs du transport et du tourisme, cette technique a été ensuite été utilisée dans de nombreux autres secteurs.