Home » Technologie » Big Data » Big data, big business

Big data, big business

Tech Page One

Après des mois d’euphorie, les technologies liées aux big data ont enfin passé le fameux cycle de la « hype » défini par l’institut Gartner. Elles offrent aujourd’hui des bénéfices concrets aux entreprises qui se les approprient.

Big data, big business

L’expression « big data » peut sembler rassurante tant elle est prisée actuellement. Mais elle ne facilite pas la tâche des services informatiques, qui ne savent pas exactement à quoi elle renvoie. Le big data est une invitation à accélérer les processus de décision en s’appuyant sur des données complexes mais la proposition ne semble pas toujours très concrète pour les organisations, qui ont d’abord choisi de ne pas investir dans les technologies associées.

Selon Frank Buytendijk, analyste du cabinet de Gartner, les discours marketing excessifs ont malheureusement tendance à masquer les avancées du big data dans les entreprises : il estime que 64 % des sociétés auraient déjà investi dans les technologies associées au big data ou se prépareraient à le faire dans 24 mois à venir. Le big data a en outre souffert des mêmes difficultés que le cloud computing à sa naissance : il n’est pas l’objet d’une définition standardisée et est trop souvent réduit à un large jeu de données. Une définition plus réaliste consiste à renvoyer l’expression à la collecte et à l’analyse de jeux de données hétérogènes (structurées et non-structurées) en vue de faciliter les processus de prise de décision particulièrement complexes. L’analyse peut porter sur tout type de données (chiffres de ventes, données émises par les objets connectés, métadonnées, vidéos, commentaires sur les réseaux sociaux….) et elle s’emploie à effectuer des rapprochements pour discerner de possibles facteurs explicatifs.

Croiser les informations collectées et créées

Les technologies liées aux big data partagent un même objectif consistant à se donner les moyens de respecter la règle des 3 V (vitesse, variété et volume). Et ce, en proposant des modes d’interrogation ultra-rapides de très vastes gisements de données stockées dans des silos épars… Si possible en analysant au préalable la « véracité » des données en question : on parle alors des 4 V.

La définition prend tout son sens avec la montée en puissance de l’internet des objets, qui s’apprête à produire une immense quantité de data structurées et/ou non-structurées. Toutes les organisations qui traitent historiquement de larges volumes de données sont concernées : les enseignes commerciales, les administrations locales ou bien encore les établissements de la santé…

“Les médecins pourront remédier à la forte propension des citoyens à minorer ou exagérer les informations communiquées.”

Dans la santé, le big data offre aux praticiens la possibilité de s’appuyer sur de nouveaux objets connectés pour évaluer en temps réel l’état de santé et les modes de vie des patients. Ils pourront peut-être ainsi remédier prochainement à l’une des principales difficultés auxquelles se heurtent quotidiennement les médecins : la forte propension des citoyens à minorer ou exagérer les informations communiquées concernant les unités d’alcool consommées, les injections d’insuline ou bien les exercices physiques réalisés… Grâce aux nouveaux capteurs, ils pourront aussi vérifier que les médications prescrites ont bel et bien été pris par le patient.

Mais la valeur des solutions tient surtout au croisement des informations collectées avec celles qui sont créées lors des examens plus classiques (tests sanguins, radios…). Seul bémol : ces informations étant le plus souvent stockées dans les cliniques ou les services hospitaliers, il n’est pas facile de les partager.

Autre exemple, dans le secteur de l’habillement, on peut imaginer d’utiliser les big data collectées par l’intermédiaire des réseaux sociaux ou des caméras de vidéosurveillance pour mieux cerner les comportements des clients et ajuster en conséquence la politique d’achats d’une enseigne ou bien ses pratiques de merchandising. L’institut McKinsey estime que les organisations qui appuient leurs décisions sur les big data enregistrent des gains de productivité de 5 % et des gains de profitabilité de 6 %.

Collecte et intégration

Les entreprises qui s’intéressent aux big data ont intérêt à toutes débuter leur voyage au même endroit : dans le datacenter. L’enjeu est de choisir le mode d’hébergement les plus adapté pour chaque structure. Les plateformes de cloud public ont l’avantage de pouvoir être automatiquement redimensionnées pour pouvoir absorber les pics de stockage ou de consultation des données. Mais pour les organisations qui sont amenées à manipuler des données personnelles et sensibles, le cloud hybride reste plus adapté : il permet de concilier des espaces publics et des cloud privatifs ultra-sécurisés, réservés à l’hébergement des informations les plus confidentielles.

“Les entreprises auraient tort de renoncer aux investissements déjà réalisés dans les data warehouses.”

Face à la multiplication des données remontées depuis l’internet des objets, les entreprises doivent aussi booster leurs capacités de stockage interne et s’équiper de logiciels permettant de sonder et de gérer de larges quantités d’informations. Les logiciels d’analytique client, notamment, permettent de cerner les préférences de chaque client et d’anticiper leurs futures réactions. Quant aux plateformes d’intégration et de gestion de données, elles sont respectivement le gage d’une consolidation rapide des multiples flux éparpillés (notes des médecins, données remontées par les objets connectés…) et de leur sauvegarde et archivage dans des entrepôts de données sécurisés dans les règles de l’art (on parle le plus souvent de « data warehouse » ou bien de solutions de « datawarehousing »).

Certains pensent que l’essor du big data rend inutiles les data warehouses. C’est inexact et les entreprises auraient tort de renoncer aux investissements qu’elles ont déjà réalisé dans ces technologies. Dell et Microsoft ont par exemple déjà mis au point une solution permettant aux entreprises de s’appuyer rapidement sur les ressources existantes pour créer un entrepôt (Data Warehouse Fast Track).

Identifier les risques d’infection

Le big data est parfois une question de vie ou de mort. Un hôpital américain (University of Iowa Hospitals and Clinics) exploite déjà les big data pour identifier au plus tôt les patients les plus exposés à des risques d’infection dans les blocs opératoires : le docteur John Cromwell estime que ces technologies ont aidé les chirurgiens à réduire de 58 % les infections, et à faire baisser de façon significative les coûts associés. Les data ont tout simple été agrégées dans une plate-forme d’analytique hébergée, accessibles depuis n’importe quel terminal connecté, y compris dans le bloc (où elles peuvent être croisées avec les données associées au patient pour faciliter le processus de décision sur chaque acte…).

« Nous sommes capables de prélever des informations dans les dossiers médicaux électroniques et dans d’autres sources, y compris celles qui nous sont remontées depuis la salle d’opération, pour déterminer les patients qui présentent des risques d’infection post-opératoires », affirme le docteur Cromwell. « Ces données nous permettent d’adapter et de personnaliser les soins apportés dans le bloc ».

 

Max Cooter

Max Cooter

Max est un journaliste indépendant qui s’intéresse à une grande variété de sujets liés à l’informatique. Il a été le rédacteur en chef et le fondateur de Cloud Pro, l'une des premières publications dédiées au cloud. Il a également fondé et écrivait pour Techworld d'IDG après avoir été le rédacteur en chef de Network Week. En tant que journaliste pigiste, il travaillait pour IDG direct, SC Magazine, Computer Weekly, Computer Reseller News, Internet magazine, PC Business World et bien d'autres. Il a également participé à de nombreuses conférences et a été commentateur de la BBC, ITN et de la version online de la chaîne CNBC.

Derniers articles:

 

Tags: Big Data, Technologie