Сравнительный анализ открытых табличных форматов: Apache Iceberg, Apache Hudi, Delta Lake, Apache Paimon
Автор: Иевлев К.О., Городничев М.Г.
Рубрика: Информатика и вычислительная техника
Статья в выпуске: 1, 2026 года.
Бесплатный доступ
В статье исследуются открытые табличные форматы (Open Table Formats), формирующие технологическую основу хранилищ данных Data Lakehouse. Рассмотрена эволюция подходов к хранению данных – от классических хранилищ (Data Warehouse) через озёра данных (Data Lake) к гибридной модели Data Lakehouse. Проанализированы архитектурные решения и функциональные особенности Apache Iceberg, Apache Hudi, Delta Lake и Apache Paimon. Представлен сравнительный анализ форматов и рекомендации по их применению в зависимости от характера нагрузки.
Открытые табличные форматы, Apache Iceberg, Apache Hudi, Delta Lake, Apache Paimon, Data Lakehouse, ACID, эволюция схемы
Короткий адрес: https://sciup.org/148333231
IDR: 148333231 | УДК: 004.624 | DOI: 10.18137/RNU.V9187.26.01.P.170
Comparative analysis of modern open table Formats: Apache Iceberg, Apache Hudi, Delta Lake, Apache Paimon
The article examines open table formats that form the technological foundation of Data Lakehouse architecture. The evolution of data storage approaches from classical Data Warehouses through Data Lakes to the hybrid Data Lakehouse model is reviewed. Architectural solutions and functional features of Apache Iceberg, Apache Hudi, Delta Lake and Apache Paimon are analyzed. A comparative analysis of formats and recommendations for their application depending on workload characteristics are presented.