À l'ère, du big data, deux modèles de gestion de l’information s'opposent sur le marché. On trouve d'une part le data wharehouse (entrepôt de données) dont la réputation n'est plus à faire, et d'autre part le data lake (lac de données) : outsider moderne dont l'implantation dans les SI est de plus en plus importante depuis 2010. Ici, nous ferons le point sur ces deux approches relatives au stockage de l’information :
Le data lake et le data warehouse se différencient par leur architecture. En effet, l’entrepôt de données se définit comme un ensemble d’informations structurées. Par structuration, on entend que le cadre permettant le stockage des données est défini en avance et que celui-ci est alors sans surprise pour les utilisateurs. Pour le data lake, il en est autrement avec des données qui sont stockées sous des formes brutes et sans traitement particulier. Pour faire une analogie avec la vie quotidienne, on peut les comparer avec les séjours organisés par des tour-opérateurs dans lesquels tout est compris et planifié en avance et les voyages pendant lesquels rien n’est prévu et dont les objectifs se décident au fil des jours. On comprendra donc tout à fait que ces deux modèles s'adressent à des activités différentes et qu'il faudra faire le point sur les besoins afin de choisir la solution la plus adaptée.
Comme nous venons de le voir, le data lake n'est donc pas une nouvelle version du data warehouse, et ces deux systèmes répondent à des besoins différents. On remarque par exemple que des secteurs comme les banques et les assurances ont tendance à opter pour des solutions structurées de type entrepôts de données. Tandis que pour des entreprises dont le cœur de métier touche à l'innovation, le lac de données est souvent le plus approprié en raison de sa modularité et de sa capacité à être facilement reconfiguré pour s'adapter à de nouveaux besoins.
Pour conclure, on note que ces deux approches opposées tendent finalement à se compléter. L'heure n'est plus à la sélection d'un système ou d'un autre, mais plutôt à la manière de les combiner pour répondre aux nouveaux besoins des entreprises.