Tu hérites d'une table Iceberg qui ingère 5 micro-batches par minute. Au bout d'une heure : 3 000 fichiers Parquet de 30 KB chacun. Tes dashboards Trino mettent 8 s à scanner ce qui devrait prendre 200 ms. C'est small files problem,piège storage le plus fréquent en lakehouse production.
Ton job : appliquer `rewrite_data_files` avec une target size de ~128 MB, un sort_order par `(tenant_id, event_time)`, et prouver gain mesurable. CI ne te croit pas sur parole : elle compte les fichiers avant/après et mesure les bytes scannés sur une requête de référence.
Bonus senior : tu prouves que ta compaction respecte snapshot isolation. Un canary append pendant rewrite ne doit pas être perdu,c'est bug classique de quelqu'un qui fait `overwrite(scan_result)` au lieu de `rewrite_data_files`.