Mis en ligne le 03/07/2012
Le phénomène des big data touche toutes les entreprises

Claude Bernard, Directeur R&D Techonologies et Innovation chez Sage
Le phénomène des big data est en train d’exploser que ce soit dans la sphère privée ou publique. L’augmentation exponentielle des volumes de données à traiter et la multiplicité des sources expliquent ce fait. Toutefois, le terme même et ce qu’il implique dans la vie de l’entreprise peut rester nébuleux. C’est pourquoi, Claude Bernard, Directeur R&D Technologies et Innovation chez Sage, fait le point sur les big data.
Institut Sage : Comment définissez-vous les big data ?
Claude Bernard : Le terme vient d’un anglicisme. Il caractérise l’ensemble des données produites à partir de diverses sources se multipliant à l’infini. Internautes, entreprises, secteur public, associations… tous concourent à ce phénomène au travers des réseaux sociaux et des blogs. L’humain produit donc de l’information ; en parallèle, il existe une autre source d’alimentation massive : les machines comme les satellites, les capteurs divers ou la vidéoprotection par exemple. C’est ce qu’on appelle la source machine to machine, ou M2M, qui recueille des masses informatives pour les envoyer à d’autres machines à des fins d’analyse.
Toutes ces informations représentent un véritable trésor qui permet, une fois analysées, de répondre à différentes questions. En effet, les entreprises, de toutes tailles, les conservent et s’en servent en vue d’en faire des déductions. Il est possible aujourd’hui d’analyser des comportements et des usages au travers de l’historique des données comme la consommation en fonction des profils d’utilisateurs et de créer ensuite des produits et services adaptés aux différents usages. On peut juxtaposer des informations qui jusqu’alors n’étaient pas associées, voire créer des lois de coïncidence pour affiner et disposer d’une visibilité plus juste des activités que ce soit pour une entreprise ou une administration.
Institut Sage : Quelles implications sociales les big data entraînent-elles pour l’entreprise sur son organisation interne et la communication entre collaborateurs ?
Claude Bernard : Le phénomène big data soulève le sujet de la propriété de l’information. Il est important de connaître juridiquement à qui appartient l’information, qu’il s’agisse de l’individu en tant que salarié, consommateur, client, citoyen ou d’un organisme professionnel. Il devient également crucial de déterminer si les informations intègrent la sphère privée et quel est leur niveau de confidentialité On ne peut plus consommer de l’information de manière imprécise ou non contrôlée. Nous sommes par ailleurs attentifs aux directives européennes sur l’utilisation des données privées et des modifications à cet égard risquent de bouleverser le business model de certains acteurs.
Les big data entraînent également un changement majeur quant à la structuration de l’information. En effet, ce phénomène s’apparente à une auberge espagnole. Chaque entreprise doit établir une règle sur le rythme d’acquisition de l’information, ainsi qu’un contrôle de cohérence et d’utilisation de cette masse informative. Le système d’information doit ainsi être capable de savoir quand extraire l’information, la traiter et l’archiver afin d’effectuer ces opérations en toute intégrité et sécurité.
Institut Sage : Quel retour sur investissement attendre des big data ?
Claude Bernard : Le retour sur investissement est double. Selon une étude de McKinsey, tous les secteurs d’activité peuvent profiter des big data et améliorer de 60% leurs activités tout en réduisant leurs coûts de 10 à 15% ! Pour ma part, je suis assez d’accord avec cette vision, en premier lieu sur la réduction les coûts. Par exemple, lors d’un mailing, les big data permettent un ciblage accru grâce à un bon profilage et une meilleure qualification des données, de cette manière le coût d’échec est réduit.
En ce qui concerne le gain d’activité, il devient possible grâce à l’amélioration du business en raison du perfectionnement de la visibilité sur nombre de métiers de l’entreprise. Les coûts des big data s’avèrent hautement mutualisés, donc le prix s’en ressent à la baisse. Pour les entreprises de toute taille, le principe du cloud computing et sa consommation à la demande participe également à cette diminution. Mais améliorer son activité suppose d’opérer des investissements, par exemple en marketing, que les plus petites structures ne peuvent pas toujours supporter. En outre, cela est étroitement lié à l’âge des collaborateurs. Ainsi, les jeunes générations s’avèrent-elles déjà plus adeptes de cet univers. Il est enfin à noter que les bénéfices qu’on peut attendre des big data augmentent au fur et à mesure que les entreprises y adhèrent en masse.
Institut Sage : Et que pensez-vous justement de cette adhésion actuellement ?
Claude Bernard : L’adoption des big data arrive très vite et de toute part. A l’image des open data qui concernent le secteur public et s’ouvrent aux citoyens. Déjà de nombreuses communes mettent à disposition du public des données pour améliorer le déplacement des humains à pied, en voiture ou en vélo. Je pense que le retour sur investissement est encore devant nous. Il concerne également les PME et TPE qui vont voir dans les capacités du big data le moyen de mieux comprendre leurs marchés et les besoins de leurs clients. Nous ne sommes pas au bout de nos surprises !
Institut Sage : Quels risques les big data peuvent-elles engendrer ?
Claude Bernard : Le risque maximal porte sur un phénomène de krach global, où l’informatique mondiale céderait sous des volumes de données trop importants à gérer en même temps. Le pire n’est jamais certain et je ne voudrais pas jouer l’oiseau de mauvais augure. Le monde a déjà connu de nombreuses interruptions mais je ne crois pas au désastre global, plutôt à l’indisponibilité temporaire. Il faut noter que ce risque reste moindre dans une architecture de type cloud que dans une architecture privée traditionnelle grâce à ses redondances différentes sur des médias différents.
En revanche, je pense que les vrais risques sont ceux que nous connaissons actuellement comme les transgressions déontologiques avec les vols de mots de passe, les intrusions, les ruptures d’intégrité et les failles de sécurité des systèmes d’information. J’ai même l’impression que c’est un phénomène sans fin. Les systèmes mathématiques sont de plus en plus puissants pour pirater les big data mais sont nécessaires pour développer les technologies afférentes. C’est en même temps son antidote et son poison. L’autre problème majeur tourne autour des compétences dédiées aux big data. La recherche de compétences spécialisées dans les outils d’interfaçage, d’installation de base en-mémoire par exemple devient clé.
Institut Sage : Quels outils informatiques englobent les big data ?
Claude Bernard : Pour schématiser, les big data englobent les outils qui permettent de structurer, de compacter et d’analyser les informations mais avec une volumétrie très importante. En premier, cela concerne les infrastructures de stockage. Or, ils nécessitent des investissements colossaux qu’effectuent notamment des acteurs comme Oracle, Microsoft, Salesforce, Amazon ou Yahoo. Ils ont créé ces infrastructures pour leurs propres besoins et ensuite pour proposer des services particuliers. Ensuite interviennent les outils du décisionnel ou business intelligence comme le datamining, les bases de données, les outils de gestion de la qualité des données et les outils de requêtes par exemple. Enfin, les big data comprennent les outils de restitution et de visualisation qui demeurent assez traditionnels, mais doivent bénéficient d’interfaces simples et visuelles.