Программный комплекс обработки изображений на основе модели зрения человека
Автор: Маштаков Алексей Павлович, Путинцева Ксения Александровна
Журнал: Программные системы: теория и приложения @programmnye-sistemy
Рубрика: Методы оптимизации и теория управления
Статья в выпуске: 4 (43) т.10, 2019 года.
Бесплатный доступ
Рассматривается задача компьютерного моделирования методов обработки изображений, основанных на принципах работы зрительной системы человека. Предложена структура программного комплекса (ПК), моделирующего первые этапы обработки зрительного сигнала мозгом человека: сглаживание изображений (удаление шума), выделение границ объектов (контуров изображения) и ориентационный анализ (определение угла наклона контуров). Эти этапы моделировались с помощью фильтров Гаусса для сглаживания и представления изображения, аппарата гауссовых производных для выделения границ и фильтра Габора для определения ориентаций. На языке Си, tcl/tk с использованием библиотек http://www.libpng.org/pub/png/libpng.htmllibpng, https://www.gnu.org/software/gsl/libgsl разработан ПК Visual Processing, выполняющий следующие функции: размытие изображений по Гауссу; дифференцирование изображений с помощью гауссовых производных, выделение границ объектов с помощью лапласиана гауссиана (LoG фильтра); определение направления контуров и подъем изображения на группу Ли $SE_2$ с помощью фильтров Габора. ПК основан на принципах открытой архитектуры и является платформой для реализации и тестирования алгоритмов обработки изображений в сфере математического моделирования зрения.
Обработка изображений, модель зрения, зрительная система человека, гауссовы производные, фильтр габора, группа движений плоскости
Короткий адрес: https://sciup.org/143169804
IDR: 143169804 | DOI: 10.25209/2079-3316-2019-10-4-111-139
Список литературы Программный комплекс обработки изображений на основе модели зрения человека
- T. Iijima. “Basic theory on normalization of a pattern (in case of typical one-dimensional pattern)”, Bulletin of Electrical Laboratory, 26 (1962), pp. 368-388 (in Japanese).
- J.J. Koenderink. “The structure of images”, Biological Cybernetics, 50:5 (1984), pp. 363-370. DOI: 10.1007/BF00336961
- B. M. ter Haar Romeny. Front-end vision and multi-scale image analysis. Multi-scale computer vision theory and applications, written in mathematics, Computational Imaging and Vision, vol. 27, Springer, Dordrecht, 2003, DOI: 10.1007/978-1-4020-8840-7 ISBN: 978-1-4020-1503-8
- G.C. DeAngelis, I. Ohzawa, R.D. Freeman. “Receptive-field dynamics in the central visual pathways”, Trends Neurosciences, 18:10 (1995), pp. 451-458. DOI: 10.1016/0166-2236(95)94496-R
- J.P. Jones, L.A. Palmer. “An evaluation of the two-dimensional Gabor filter model of simple receptive fields in cat striate cortex”, Journal of Neurophysiology, 58:6 (1987), pp. 1233-1258. DOI: 10.1152/jn.1987.58.6.1233
- R. Duits, M. Felsberg, G. Granlund, B. Romeny,. “Image analysis and reconstruction using a wavelet transform constructed from a reducible representation of the Euclidean motion group”, International Journal of Computer Vision, 72:1 (2007), pp. 79-102.
- DOI: 10.1007/s11263-006-8894-5
- J. Petitot. “The neurogeometry of pinwheels as a sub-Riemannian contact structure”, Journal of Physiology-Paris, 97:2-3 (2003), pp. 265-309.
- DOI: 10.1016/j.jphysparis.2003.10.010
- G. Citti, A. Sarti. “A cortical based model of perceptual completion in the roto-translation space”, Journal of Mathematical Imaging and Vision, 24:3 (2006), pp. 307-326.
- DOI: 10.1007/s10851-005-3630-2
- U. Boscain, J.-P. Gauthier, R. Chertovskih, A. Remizov. “Hypoelliptic diffusion and human vision: a semidiscrete new twist”, SIAM J. Imaging Sci., 7:2 (2014), pp. 669-695.
- DOI: 10.1137/130924731
- A. P. Mashtakov, A. A. Ardentov, Yu. L. Sachkov. “Parallel algorithm and software for image inpainting via sub-Riemannian minimizers on the group of rototranslations”, Numerical Mathematics: Theory, Methods and Applications, 6:1 (2013), pp. 95-115.
- DOI: 10.4208/nmtma.2013.mssvm05
- E. J. Bekkers, R. Duits, A. Mashtakov, G. R. Sanguinetti. “A PDE Approach to Data-driven Sub-Riemannian Geodesics in SE(2) ”, SIAM Journal on Imaging Sciences, 8:4 (2015), pp. 2740-2770.
- DOI: 10.1137/15M1018460
- F. R. Amthor, N. M. Grzywacz. “Nonlinearity of the inhibition underlying retinal directional selectivity”, Visual neuroscience, 6:3 (1991), pp. 197-206.
- DOI: 10.1017/S0952523800006210
- M.J. Berry, I.H. Brivanlou, T.A. Jordan, M. Meister. “Anticipation of moving stimuli by the retina”, Nature, 398:6725 (1999), pp. 334-338.
- DOI: 10.1038/18678
- V. Torre, T. Poggio. “A synaptic mechanism possibly underlying directional selectivity to motion”, Proceedings of the Royal Society of London. Series B. Biological Sciences, 202:1148 (1978), pp. 409-416.
- DOI: 10.1098/rspb.1978.0075
- S.D. Wilke, A. Thiel, C.W. Eurich, M. Greschner, M. Bongard, J. Ammermüller, H. Schwegler. “Population coding of motion patterns in the early visual system”, Journal of Comparative Physiology, 187:7 (2001), pp. 549-558.
- DOI: 10.1007/s003590100227
- J. Hérault, B. Durette. “Modeling visual perception for image processing”, Lecture Notes in Computer Science, vol. 4507, Springer, Berlin-Heidelberg, 2007, , pp. 662-675.
- DOI: 10.1007/978-3-540-73007-1_80 ISBN: 978-3-540-73006-4
- C.A. Morillas, S.F. Romero, A. Martínez, F.J. Pelayo, E. Ros, E. Fernández. “A design framework to model retinas”, Biosystems, 87:2-3 (2007), pp. 156-163.
- DOI: 10.1016/j.biosystems.2006.09.009
- A. Wohrer, P. Kornprobst. “Virtual retina: a biological retina model and simulator, with contrast gain control”, J. Comput. Neurosci., 26:2 (2009), pp. 219-249.
- DOI: 10.1007/s10827-008-0108-4
- A. Benoit, A. Caplier, B. Durette, J. Herault. “Using Human Visual System modeling for bio-inspired low level image processing”, Computer Vision and Image Understanding, 114:7 (2010), pp. 758-773.
- DOI: 10.1016/j.cviu.2010.01.011
- P. Martínez-Cañada, C. Morillas, J.L. Nieves, B. Pino, F. Pelayo. “First stage of a Human Visual System simulator: the retina”, Lecture Notes in Computer Science, vol. 9016, Springer, Cham, 2015, , pp. 118-127.
- DOI: 10.1007/978-3-319-15979-9_12 ISBN: 978-3-319-15978-2
- В. М. Смирнов, С. М. Будылина. Физиология сенсорных систем и высшая нервная деятельность, 4-е издание, стер., Издательский центр «Академия», М., 2009, , 336 с.
- ISBN: 978-5-7695-5592-3
- M. F. Land. The Eye: A Very Short Introduction, Oxford University Pres, 2014, , 128 pp.
- ISBN: 978-0199680306
- D.H. Hubel, T.N. Wiesel. “Receptive fiedls, binocular interaction and functional architecture in the cat's visual cortex”, J. Physiol., 160:1 (1962), pp. 106-154.
- DOI: 10.1113/Fjphysiol.1962.sp006837
- B. M. ter Haar Romeny, L. M. J. Florack. “Front-end vision: a multiscale geometry engine”, Lecture Notes in Computer Science, vol. 1811, Springer, Berlin-Heidelberg, 2000, , pp. 297-307.
- DOI: 10.1007/3-540-45482-9_29 ISBN: 978-3-540-67560-0
- Л. Шапиро, Дж. Стокман. Компьютерное зрение, БИНОМ. Лаборатория знаний, М., 2006, , 752 с.
- ISBN: 5-94774-384-1
- V. Markasheva, A. Mashtakov. “Existence of global fundamental solution to a class of Fokker-Planck equations”, Program Systems: Theory and Applications, 8:4 (2017), pp. 149-162.
- DOI: 10.25209/2079-3316-2017-8-4-149-162