Les nouvelles données du Big data

nouvelles données

Souriez vous êtes « tracké »!

C’est ce que l’on pourrait se dire en écoutant la conférence de Gilles Venturi (Soft Computing) lors de la conférence sur les nouvelles données du Big Data organisée par Marketvox, EACP et l’IESEG

On évoque souvent les volumes de données disponibles avec le Big Data et la vitesse à laquelle elles sont traitées.

Mais l’évolution majeure semble pourtant résider dans le nouveau gisement de données auquel le Big Data donne accès.

  • Il s’agit soit de données totalement nouvelles, le plus souvent issues d’Internet (les données fournies par les objets connectés par exemple)
  • soit de données déjà existantes que l’on ne songeait même pas à exploiter (la vitesse de passage de la souris sur une bannière)
  • soit encore des données que l’on regardait avec gourmandise, mais qui étaient inaccessibles

Le cas des données autrefois « inaccessibles » est parfaitement illustratif de l’évolution que nous observons.
Il y quelques années dans une grande banque française, j’avais souhaité étudier les comportements de retraits de billets dans les distributeurs automatiques. Je voulais comprendre quand et où les clients utilisaient ces distributeurs, à proximité de leur habitation, de leur travail, des commerces etc…

Cette étude n’a pas été possible, car nous étions dans l’incapacité de rapprocher les retraits (fichier des retraits au distributeur de billets) avec les comptes des clients. Le logiciel de gestion des distributeurs était conçu pour assurer la maintenance et évaluer la rentabilité des machines, pas pour suivre le comportement des clients.

Cet exemple illustre combien les choses ont changé en si peu de temps.

Aujourd’hui, il apparaîtrait comme une évidence d’associer les retraits au client dans le programme de gestion des distributeurs, et même si ce n’était pas le cas, les informations de géolocalisation des distributeurs et des clients, permettraient déjà de réaliser l’étude.

Les données nouvelles exploitent les progrès spectaculaires qui ont été faits dans le domaine de la compréhension du langage naturel, de l’analyse des photos et singulièrement de l’expression des visages (ainsi est-il possible de moduler l’affichage des publicités dans un centre commercial en fonction de l’humeur des clients ) etc…

l’intervention de Gilles Venturi (Soft Computing) invité lors de la conférence Eacp-Marketvox IESEG du 6 juin dernier donne un bon aperçu de cette transformation :

Publicités

Les métiers de la relation client bousculés par Internet

Les nouvelles technologies et leur influence sur les métiers de la relation client

Mon actualité du mois de mars, c’était l’animation d’une conférence organisée par l’Observatoire des Métiers et des Qualifications de l’Agirc- Arrco.

L’Observatoire des Métiers et des Qualifications a pour mission d’informer, d’éclairer et de conseiller les instances de la branche professionnelle et les groupes de protection sociale sur la nature et l’évolution des métiers de la retraite complémentaire et de la prévoyance.

Les Groupements de protection sociale effectuent une mutation importante en plaçant désormais la qualité de la relation client au sommet de leurs priorités. Or nous observons depuis quelques années une évolution spectaculaire des technologies de la relation client. Il s’agissait de s’interroger sur les conséquences de ces évolutions sur les métiers de la relation client et les métiers qui en sont très proches comme les métiers du marketing et les métiers d’expert.

Téléchargez le support de présentation :

les nouvelles technologies et les métiers de la relation client

 

Cherche ces mots ! cherche !

Cherche ces mots !..

… ou le Business Search au SEMO

search marketing

Le search marketing

Le SEMO (le salon des études) tenait sa 15è édition au Palais des Congrès le 2 et 3 Novembre 2011

Cette année le SEMO connaissait sa crise.

Le monde des études a connu son vent de révolte cette année avec la création du collectif « Re-Création » qui a fait sécession, quittant le SEMO pour organiser sa propre manifestation, « Le printemps des études » qui se tiendra le 5 et 6 avril 2012.

Résultat, les rangs étaient clairsemés et les allées du salon bien tristes (Repères, Harris Interactive, Stratégir, Mica Research entre autres ont déserté le SEMO pour Le Printemps des Etudes).

Ghislaine Chambrain (Groupe Tarsus France, organisateur du SEMO) déclarait: « Nous faisons tout pour avoir une manifestation petite mais de qualité ». L’objectif de faire une petite manifestation a bien était atteint, je confirme.

Ceci dit, quelques conférences valaient vraiment le déplacement.

L’une d’entre m’a ravi et inquiété.

La présentation du « Social Media Search » :

D’une manière générale, les outils du « Business Search » sont des applications qui analysent les données structurées et non structurées (photo, verbatim par exemple) du web pour restituer des informations sur la manière dont les avocats  ou les détracteurs de l’entreprise ou d’un produit s’expriment.

Les outils de « Search Marketing » font de gros progrès et leur intérêt devient de plus en plus évident en matière de perception des attentes des consommateurs.

La démarche est relativement simple.

1 – La première étape consiste toujours a bien identifier le problème, ex : mon produit plaît-il toujours au consommateur, malgré l’irruption d’un concurrent qui a beaucoup communiqué (l’exemple le plus intéressant portait sur une étude faite pour le compte d’un laboratoire pharmaceutique).

2 – On définit ensuite les sites Internet, les forums, les blogs, que l’on va visiter pour connaître l’avis des consommateurs. C’est l’étape d’indexation des sites à visiter.

C’est une étape importante, on peut facilement arriver au choix de plusieurs milliers de sites.

3 – Vient alors le choix des mots, des noms, des logos, des expressions que l’on va détecter pour constituer une base d’analyse.

Dans l’exemple proposé, il s’agissait de rechercher tout ce qui pouvait évoquer une prescription médicale « X » sur Facebook, Twitter, Youtube, sur les blogs, les forums etc…

Les forums sont une source particulièrement intéressante. Outre les sites traditionnels d’échange sur les effets des médicaments comme « doctissimo« , il y a de nombreux sites communautaires de personnes atteintes de certaines affections qui sont très riches en informations extrêmement précises.

On y ajoute ce que la société Lingway (qui propose une solution de Business Search) appelle de l’Open Web. C’est la  recherche de sites qui évoquent le sujet traité mais qui n’ont pas été indexés (on cherche par ce moyen de nouvelles sources d’informations, sources naissantes ou sites qui s’ouvrent au sujet de l’étude).

4 – On lance alors la recherche. C’est l’outil dénommé Crawler qui va lire toutes les pages qui nous intéressent et qui va « remonter » les informations utiles dans notre base de travail.

Un autre outil (textmining et moteur d’analyse sémantique) analyse ces informations, les trie et les ordonne.

L’outil de textmining va reconnaître la langue, les mots ou des expressions. Il doit être capable de tenir compte d’une utilisation plus ou moins libre de l’orthographe, s’affranchir des pièges de la typographie etc.

Interviennent ensuite les outils d’analyse syntaxique, puis l’outil d’analyse sémantique qui vont donner une valeur aux  informations collectées en les replaçant dans leur contexte.

Quand on aborde un sujet très technique, l’outil d’analyse sémantique va permettre de constituer un dictionnaire des mots du métier.

5 – Nous voilà prêt à construire une représentation statistique de ce qui se dit sur le web à propos de notre produit.

On peut utiliser ces techniques pour suivre sa réputation (ce que l’on dit sur ma marque), pour réaliser de la veille sur un sujet à l’étude (que pensent les consommateurs du partage de véhicule pour les déplacements urbains) ou tout simplement pour constituer un moteur de recherche interne dans la documentation d’une entreprise.

S’agissant de la présentation faite au SEMO, il était question d’apprécier la réputation d’un médicament. On va pouvoir déterminer  si les utilisateurs évoquent principalement les effets secondaires et dans quelle proportion ou si à l’autre extrême le médicament évoque le bien être par exemple.

L’intérêt de la méthode est bien évidemment de passer d’un ensemble de discours (données non structurées) à des données structurées que l’on va pouvoir ordonner, classer, évaluer, analyser à l’aide d’outils statistiques.

Il est possible de produire des tableaux de bord qui permettront de donner une représentation de la situation actuelle et de son évolution.

Il existe un grand nombre de solutions techniques permettant de réaliser ce type d’analyse.

Lingway présentait la sienne au SEMO, mais j’ai eu l’occasion de voir des démonstrations avec la solution Sinéqua qui est aussi particulièrement impressionnante pour analyser les sites dans de multiples langues, ce qui peut être un atout pour une entreprise qui a une présence internationale.

Bien entendu ces bijoux de technologie ont un prix, une licence d’un de ces outils sophistiqué peut dépasser les 25 à 30 000 euros, ce qui ne les met pas à portée de toutes les entreprises. Heureusement il existe des propositions moins sophistiquées et moins chères.

Mais revenons sur le témoignage des personnes qui partageaient leur expérience avec les visiteurs du SEMO.

On imagine bien tout l’intérêt d’une telle mise en oeuvre.

Toyota par exemple, l’utilise comme outil de veille pour collecter des commentaires sur ces modèles de voiture (avis sur la finition, la consommation, la tenue de route).

Le Laboratoire qui témoignait au SEMO l’utilise pour mieux connaître les effets secondaires de ces molécules.

Mais certaines utilisations font débat.

Témoin ces utilisation également proposée au SEMO.

1 – La mise en fiche des « influenceurs » :

Un prestataire utilise cet outil pour mettre à disposition de ces entreprises clientes une carte de ceux qui parlent de leurs produits.

Ceux qui s’expriment sur cette marque font l’objet d’une fiche présentant leur identité, le ou les sites sur lesquels ils s’expriment et une évaluation de leur capacité à influencer l’opinion. Sont particulièrement surveillés les Blogs et les Twitt.

Cette société utilise aujourd’hui 18 critères d’informations de ces acteurs du web.

S’agissant d’une entreprise française, je suis persuadé que cela se fait strictement dans le respect de la protection des données personnelles. Mais nous avons vu que ces outils sont multilingues et que n’importe quelle entreprise dans le monde peut réaliser ce « fichage » , y compris des entreprises qui n’ont pas la même déontologie ou les mêmes contraintes que nos entreprises nationales.

2 – L’aveuglement du Web :

Une entreprise témoignait sur une technique qui mérite également réflexion.

Face à une marée d’avis critiques sur un nouveau produit, elle identifie les sources de ces avis (dans le cas proposé il s’agissait de Facebook), puis elle organise l’inondation du web, par des avis positifs qu’elle fabrique sur les sites à l’origine du « Bad Buzz ».

Si j’admets qu’en cas de crise, il faut parfois savoir éteindre un incendie, une technique systématique d’extinction des critiques me semble sans intérêt.

Une entreprise a tout intérêt à écouter ses consommateurs et les « influenceurs » de son marché pour progresser.

Sachant que Lingway et Sinéqua font bien leur travail, je suis persuadé que leur marque ayant été citées, ils détecteront mon « post ».

Qu’ils sachent que je les remercie pour leurs explications patientes et éclairées. 

Vive le SEMO !