Doit-on s’intéresser au Big Data?
Le Big Data permet de dégager des schémas et des tendances à partir d’un très grand nombre de données produites en temps réel et en continu et provenant de diverses sources. Il aide les intervenants à personnaliser leur offre et à analyser leur réputation en ligne à partir de leur présence dans les médias sociaux. À ce titre, le Big Data améliore la compétitivité des entreprises.
Un raz-de-marée de données sur l’Internet
De plus en plus connectés, les individus génèrent des volumes de données phénoménaux. En 2011, on produisait en deux jours cinq exaoctets de données, soit l’équivalent de tout ce qui a été produit jusqu’en 2003; et en 2013, cela ne prendra pas plus de dix minutes. Voici un aperçu du déluge informationnel circulant sur le Web:
- 133 millions de blogues;
- 247 milliards de courriels envoyés chaque jour (80% sont des pourriels), dont 193 000 messages chaque seconde;
- le trafic Internet généré en une heure pourrait remplir environ sept milliards de DVD, soit sept fois la hauteur de l’Everest, une fois empilés;
- d’ici 2020, l’univers numérique sera 44 fois plus grand qu’en 2009.
Historiquement, la plupart de ces données étaient localisées dans des bases de données traditionnelles, accessibles et gérées avec un ensemble d’outils. La capacité de ces instruments a augmenté au fil du temps, mais il devient de plus en plus difficile de travailler avec des outils classiques de gestion de bases de données. Nous sommes entrés dans l’ère du Big Data, soit celle de l’analyse de données à grande échelle. Les premiers à avoir dû trouver des solutions ont été les spécialistes du Web (Yahoo, Google, etc.) puis, ceux du e-commerce (e-Bay, Amazon, etc.) et ensuite, des réseaux sociaux (Facebook, Twitter, Linkedin, etc.).
Comment définir le Big Data?
Trois critères essentiels ressortent des opinions exprimées par les analystes pour décrire le Big Data: volume, vitesse (ou vélocité) et variété. La combinaison de ces trois critères permet de définir ce qui est et ce qui n’est pas du Big Data.
- Volume. L’explosion du volume des données dans l’entreprise est évidemment le premier élément qui vient à l’esprit.
- Vitesse. De tels volumes imposent de traiter l’information au fur et à mesure afin de sélectionner celle qui devra être traitée. Le Big Data consiste donc également à analyser de gros volumes de données dans des délais très courts pour se rapprocher du temps réel.
- Variété. La variété des sources d’information est très disparate: blogues, senseurs RFID, réseaux sociaux, sites Internet, forums de discussion, téléphones mobiles, tablettes, etc. Les données proviennent de façon désordonnée et non prédictible. Elles sont à la fois semi-structurées (15%) ou non structurées (85%) comme des images, des vidéos, des fichiers audio, etc.
Le Big Data est aussi un ensemble de technologies, d’outils et de procédures qui permettent à une organisation de stocker, créer, manipuler, gérer et analyser très rapidement – voire en temps réel – ces grandes quantités de données et ces contenus hétérogènes, pour en extraire des informations pertinentes à la prise de décision.
À quoi sert le Big Data?
L’analyse de données à grande échelle — le Big Data — répond à deux problématiques: la première concerne les énormes volumes de données qui sont désormais créés au quotidien. La seconde porte sur la capacité à rechercher, à extraire et à analyser les informations non structurées qui représentent la très grande majorité de ces données. Elle rend l’information complexe compréhensible, utilisable, partageable et ouverte, et cela très rapidement. Mais encore faut-il savoir ce que l’on cherche. L’utilisation de ces données massives dépend donc essentiellement des besoins et de la stratégie de l’entreprise: optimiser des processus, comprendre des comportements, capter des tendances, analyser des opinions, créer de nouvelles opportunités de marché. Voici deux exemples d’application:
- Personnaliser l’offre. L’utilisation de logiciels d’analyse de données à grande échelle permet de rassembler les demandes d’informations de voyage, les recherches d’événements, de points d’intérêts et de géolocalisation des données sur les appareils mobiles afin de permettre aux intervenants d’améliorer la qualité globale de leurs services en personnalisant leur offre. Par exemple, les agences en ligne peuvent recommander à un voyageur particulier des vols, des destinations, des hôtels et d’autres produits en fonction de ses besoins personnels basés sur ses habitudes d’achat antérieures, un peu de la même façon qu’Amazon le fait avec ses recommandations de livres, de musique ou de jeux.
- Analyse de la réputation en ligne à partir de la présence dans les médias sociaux et la satisfaction globale générée par les commentaires en ligne. Les outils d’analyse de données à grande échelle comme Radian6 Insights, prennent en compte toute la dimension sociale du Web, des commentaires d’articles aux avis des voyageurs en passant par les blogues, Facebook, Twitter ou encore YouTube. Ils permettent aux entreprises d’analyser les sentiments, les intentions et les aspects démographiques (âge, genre, pays, région, etc.) dans les nombreuses langues qui composent les milliards de conversations sociales. Certains autres outils produisent des rapports sous forme de tableaux de bord détaillés résumant les avis, les affichages de photos et de vidéos par mois; les produits, les services et les tendances mensuelles par rapport au marché. Ces rapports peuvent être applicables à différents intervenants à travers l’industrie touristique. Les cadres et les gestionnaires d’hôtel bénéficient d’un tableau de bord récapitulatif de leur établissement; les agents de voyages peuvent obtenir une vue instantanée de n’importe quel hôtel d’intérêt; les offices de tourisme et les organisations de gestion de la destination peuvent voir les tendances et les classements et comparer leur ville ou leur destination à une autre.
Les défis à relever dans les années à venir
Le phénomène Big Data est considéré comme l’un des grands défis informatiques de la décennie 2010-2020. Au-delà des difficultés techniques que représentent la capture et le stockage des données, comprendre et interpréter cette montagne d’information suppose une expertise et une expérience que l’on ne trouve pas encore. On estime un déficit de 140 000 à 190 000 spécialistes en analyse de données d’ici à 2018, et ce, seulement pour les États-Unis.
La capacité à mobiliser des ressources et des compétences pour mettre en place les outils, les gérer et en tirer des informations utiles constitue un enjeu majeur. Accumuler de l’information est une chose, l’utiliser intelligemment en est une autre. Voilà pourquoi les entreprises doivent faire appel à des solutions spécialisées dans le Big Data comme Hadoop/MapReduce, qui a été popularisé par Google, ou à des systèmes de gestion de bases de données comme BigTable. Avant de se lancer dans l’analyse de données à grande échelle, les PME touristiques ont encore un «big» pas à franchir!
Sources:
– «How to unlock Big Data to make it big in value for the travel industry, Tnooz.com, 16 mai 2012.
– «What every marketer needs to know about Big Data in the travel industry», tnooz.com, 23 octobre 2012.
– Arnaud. «Radian6 relève le défi du Social Big Data», Travel on Move, 18 juillet 2012.
– Guillaume. «Big Data: Les données sont le nouvel or noir», Travel on Move, 21 septembre 2012.
– Kremer, Alex. «Big Data and the infinite possibilities for the travel industry», tnooz.com, 4 janvier 2012.
– Naj Group. «DMO’s Are Now Able to Use Big Data to Find New Channels to Target», etourismsummit, 26 septembre 2012.
– Nieuwbourg, Philippe. «Définition du big data», Decideo.fr, 13 mai 2012.
– Trace Media. «Le Big Data: une solution pour absorber la masse d’informations protéiforme», Telecom Review, consulté le 16 octobre 2012.
– «Mais à quoi bon le big data?», blogue Antidot,
Sites Internet:
Vous désirez diffuser cet article ? Voir notre politique de diffusion ›
Le Big data qui peut être utilisé par les entreprises d’ici est surtout pour les données non structuré provenant de sources diverses. Pour les données structuré, il est possible maintenant de traité de très gros volume de données presque en temps réel avec des serveurs exadata d’Oracle qui sont spécialisé pour les bases de données. Alors que depuis les débuts ont utilise des serveurs générique pour les bases de données, l’exadata permet de traiter plusieurs centaines de fois plus rapidement les données voir millier de fois…