Iceberg, c'est le format qui résout les trois douleurs historiques des data lakes : pas de schema evolution propre, pas de snapshot isolation, et partitions qui partent en spaghetti dès qu'on ajoute une colonne. Ce projet te fait toucher Iceberg avec les mains, sur ton laptop, sans rien payer.
MinIO joue rôle de S3, catalogue REST Tabular joue rôle de Glue. Tu crées une table partitionnée par `year(event_time)` avec hidden partitioning,VRAIE compétence du projet. Une fois la table en place, tu charges 120k lignes, tu vérifies que les requêtes ne scannent que la partition cible, et tu prouves snapshot isolation en faisant deux writes concurrents.
À la fin, tu sais lire une time-travel query et expliquer pourquoi ton schéma n'a pas besoin d'une colonne `order_year` matérialisée.