Home »  Business » Esprit d’entreprise » Deezer : le big data à pleins tubes

Deezer : le big data à pleins tubes

Tech Page One

Les détracteurs du big data ont souvent mis en avant l’absence de projets concrets prouvant l’intérêt business du traitement de grands volumes de données. Pendant ce temps, d’autres entreprises sont passées à l’action et disposent aujourd’hui d’une infrastructure de stockage et d’analyse haute performance. Illustration avec le champion français de la musique en ligne.

Deezer : le big data à pleins tubes

6 millions d’abonnés payants répartis dans 180 pays, auxquels il faut offrir un accès parfaitement fluide à 40 millions de titres. C’est le quotidien de Deezer, acteur aujourd’hui incontournable de la musique en ligne. En quelques clics, il est désormais possible d’écouter de n’importe où, à n’importe quel moment et depuis n’importe quel appareil, la chanson de son choix. Cette révolution, c’est celle du software-as-a-service (SaaS). L’application et les données sont hébergées à distance et consommées via le réseau. Pour l’utilisateur, c’est la promesse d’une très grande flexibilité d’usage. Pour le fournisseur du service, c’est un véritable challenge technologique.

Les 3 V réunis

Premier défi : gérer la volumétrie des données. Si certains s’interrogent encore sur l’utilité des technologies big data, une entreprise comme Deezer saura leur apporter des éclaircissements. La société compte actuellement 3 pétatoctets de fichiers audio encodés dans différents formats (FLAC, MP3, AAC) et reçoit quotidiennement des maisons de disques pas moins de 15 000 nouveaux titres. Volume, variété, vélocité, toutes les caractéristiques d’un projet big data sont réunies. Non contente de devoir stocker ces volumes massifs de données, Deezer doit également disposer d’une solution de traitement hautement performante. Tout d’abord, les milliers de morceaux ajoutés au catalogue chaque jour doivent être encodés en quelques secondes. Ensuite, le site conserve également 1,5 téraoctets de logs par jour. Ces informations servent à calculer les sommes reversées aux artistes, mais aussi à analyser les préférences des internautes pour leur offrir des suggestions toujours plus personnalisées, ou simplement à réaliser des classements. La puissance de calcul offerte par l’infrastructure est donc un critère tout aussi important que la capacité de stockage pure.

“En 2006, je devais redémarrer manuellement le serveur
qui ne tenait pas la charge.” - Daniel Marhely, fondateur de Deezer.

De 1 à 700 serveurs en dix ans

Autre préoccupation majeure : la disponibilité. La partition doit être exécutée sans la moindre fausse note afin de ne pas voir les abonnés quitter la salle. L’infrastructure doit donc être solide, fiable et redondée pour faire face à tous les imprévus en évitant les interruptions, qu’elles soient dues à une panne de courant ou à un soudain pic de charge. Daniel Marhely, fondateur de Deezer, en sait quelque chose. « Nous avons démarré en 2006 avec un seul serveur pendant 8 mois, dont 6 mois pendant lesquels je devais redémarrer manuellement la machine qui ne tenait pas la charge », se souvent-il.

Pour réunir l’ensemble de ces critères, plusieurs scénarios sont possibles. Si le cloud public disposait des capacités nécessaires, le champion français de la musique en streaming a choisi de bâtir sa propre plateforme pour des raisons de coûts et de réversibilité. Accompagné d’un duo de partenaire composé de Dell et d’Iguane Solutions, Deezer déploie au fil des années plus de 700 serveurs haute densité pour soutenir son activité.

Du « cloud bursting » pour absorber les pics

Leader de son marché en France, Deezer compte néanmoins des utilisateurs partout dans le monde. Plus de 16 millions de personnes écoutent chaque mois de la musique sur son service web. C’est pourquoi les machines sont répartis dans 4 datacenters certifiés Tier 3 et connectés aux grands backbones internationaux. Deux sont situés en France pour couvrir la zone Europe, un est aux Etats-Unis et le dernier répond à la demande croissante en Asie. Pour plus de flexibilité, une partie de ces infrastructures reposent sur des technologies cloud privé. « Si nous nous comparons à d’autres concurrents ou d’autres services à taille comparable, nous avons une petite architecture mais très optimisée », souligne Daniel Marhely, qui ne s’interdit pas à l’avenir de mettre en place une stratégie cloud hybride en recourant à des solutions de débordement dans le cloud public en cas de besoin.

 

Denis Montillet

Denis Montillet

Actuellement en charge du marketing B2B chez Dell France, Denis Montillet pilote les initiatives stratégiques autour de la gestion des données, de la convergence, des technologies « software-defined » et du cloud.

Derniers articles:

 

Tags: Esprit d’entreprise,  Business