« Où stocker ses données en 2023 ? »
16:10 - 17:00
Amphi 339

A Decathlon, la solution favorite pour stocker ses données est PostgreSQL.

Mais de plus en plus d'équipes ont des besoins qui sortent des capacités de Postgres:

  • volumétries extrêmes, que ce soit en nombre d'appels ou en quantité de données stockées. La seule solution que l'on a est de scaler verticalement (des plus gros serveurs), le sharding et le partitionnement pouvant être assez compliqué à gérer sur Postgres
  • très haute disponibilité: étant donné l'importance des plateformes pour le business, on veut être capable de continuer de fournir le service même en cas d'incident majeur sur une région entière. Postgres ne gère pas facilement le mode "actif-actif" sur deux régions.

Une équipe d'experts s'est montée pour investiguer l'état de l'art du stockage des données en 2023, notamment les bases de données distribuées et cette présentation est l'occasion de présenter cette étude:

  • une explication simple des contraintes et design des bases distribuées, à travers le théorème CAP
  • l'historique du développement des bases NoSQL puis NewSQL, avec l'échec des bases objets au début des années 2000 et comment le NoSQL est apparu
  • la notion de consistence éventuelle, ACID versus BASE
  • les différentes catégories de base NoSQL: orientée document, ou clé-valeur, colonnes ou graphe
  • les cas d'utilisation de chaque solution, avec une revue des principaux produits dans chaque catégorie (MongoDB, Couchbase, DocumentDB, Cassandra, Redis, Neo4J, Aurora, Spanner, AlloyDB…)