Эффективное сжатие без потерь больших массивов информационных данных
Автор: Бакулина Марина Павловна
Журнал: Проблемы информатики @problem-info
Рубрика: Прикладные информационные технологии
Статья в выпуске: 4 (57), 2022 года.
Бесплатный доступ
Рассматривается задача эффективного сжатия без потерь больших информационных массивов. Использование эффективного кодирования для таких данных позволяет не только уменьшить их физический размер и объем занимаемой ими оперативной памяти, но и увеличить скорость выполнения запросов. В данной работе предлагается алгоритм кодирования, позволяющий эффективно сжимать встречающиеся в массиве как числовые, так и строковые данные. Проведен эксперимент, подтверждающий увеличение степени сжатия и скорости кодирования и декодирования больших информационных массивов при использовании предложенного метода по сравнению с ранее известными методами.
Кодирование без потерь, информационный массив, коэффициент сжатия, время кодирования, эффективность метода
Короткий адрес: https://sciup.org/143179785
IDR: 143179785 | УДК: 519.722 | DOI: 10.24412/2073-0667-2022-4-63-69
Efficient lossless compression of large information arrays
The problem of efficient lossless compression of large information arrays is considered. The use of efficient coding for such data allows not only to reduce their physical size, but also to increase the speed of query execution speed. In this paper, a new coding large information data arrays is offered.lt allows you to efficiently compress both numeric and string data. An experimental data confirm of compression increase and coding speed increase of the proposed method.
Список литературы Эффективное сжатие без потерь больших массивов информационных данных
- Бакулина М. П. Использование закона Ципфа для сжатия текстов // Дискретный анализ и исследование операций, 2007. Серия 2. том 14. № 2. С. 3-13.
- Рябко Б. Я. Эффективный метод кодирования источников информации, использующий алгоритм быстрого умножения // Проблемы передачи информации, 1995. Т. 31. выпуск 1. С. 312.
- Li J., Rotem D., Wong H. A New Compression Method with Fast Searching on Large Databases // Proceedings of 13th International Conference on Very Large Data Bases, Brighton, 1987. P. 311-318.
- Eggers S., Sliosliani A. Efficient Access of Compressed Data Performance // Proc. VLDB, Montreal, 1980. P. 205.
- Eggers S., Olken F., Shoshani A. A Compression Technique for Large Statistical databases // Proc. VLDB Conf, 1981. P. 114.
- Li J., Rotem D., Wong H. A New Compression Method with Fast Searching on Large Databases // Proceedings of 13th International Conference on Very Large Data Bases, Brighton, 1987. P. 311-318.
- Ziv J., Lempel A.Compression of individual sequences via variable-length coding // IEEE Trans. Inform. Theory, 1978. V. IT-24. N 5. P. 530-536.
- Elias P.Interval and recency rank source encoding: two on-line adaptive variable-length schemes // IEEE Trans. Inform. Theory, 1987. V. 33. N 1. P. 3-10.
- Bell T. C., Cleary J. H., Witten I. H. Text Compression. Prentice Hall. Englewood Cliffs, 1990.
- Zipf G. K. Human behavior and the principle of least effort. Cambridge: Addison Wesley, 1949.