Исследование применения сверточных нейронных сетей для решения задач семантической сегментации изображений
Автор: Широкова В.Н., Ушанкова М.Ю.
Журнал: Сетевое научное издание «Системный анализ в науке и образовании» @journal-sanse
Статья в выпуске: 2, 2024 года.
Бесплатный доступ
Семантическая сегментация - операция в компьютерном зрении, заключающаяся в классификации и попиксельной локализации объектов на цифровом изображении. Данная статья содержит в себе обзор существующих модификаций классической архитектуры сверточной нейронной сети, направленных на решение проблемы искажения информации с исходного изображения. Проведено сравнение эффективности рассмотренных моделей в условиях бинарной и множественной семантической сегментации. Статья может быть полезной для ML/DL-разработчиков, желающих изучить проблематику сегментации изображений в рамках своей предметной области.
Нейронные сети, сверточные нейронные сети, сегментация изображений, семантическая сегментация
Короткий адрес: https://sciup.org/14130980
IDR: 14130980
Список литературы Исследование применения сверточных нейронных сетей для решения задач семантической сегментации изображений
- Лукашик Д. В. Анализ современных методов сегментации изображений // Экономика и качество систем связи. - 2022. - №2. - С. 57-65. EDN: OGMOGV
- Monteux A. Metrics for semantic segmentation // Excursions in data: [сайт]. - Angelo Monteux, 2019 - Дата публикации: 10.05.2019. - URL: https://ilmonteux.github.io/2019/05/10/segmentation-metrics.html (дата обращения: 23.05.2024).
- Ronneberger O., Fischer P., Brox T. U-net: Convolutional networks for biomedical image segmentation // Medical image computing and computer-assisted intervention-MICCAI 2015: 18th international conference, Munich, Germany, October 5-9, 2015, proceedings, part III 18. - Springer International Publishing, 2015. - P. 234-241.
- Badrinarayanan V., Kendall A., Cipolla R. Segnet: A deep convolutional encoder-decoder architecture for image segmentation // IEEE transactions on pattern analysis and machine intelligence. - 2017. - Vol. 39, No. 12. - P. 2481-2495.
- Rethinking atrous convolution for semantic image segmentation / L. Chen, G. Papandreou, F. Schroff, H. Adam // arXiv preprint. [2017]. - arXiv:1706.05587.
- Caltech-UCSD Birds-200-2011 (CUB-200-2011) [: Dataset] / C. Wah, S. Branson, P. Welinder [et al.]; California Institute of Technology // Perona Lab. - URL: https://www.vision.caltech.edu/datasets/cub_200_2011/(дата обращения: 23.05.2024).
- Brostow G. J., Fauqueur J., Cipolla R. Semantic object classes in video: A high-definition ground truth database // Pattern recognition letters, 2009. - Vol. 30. - №. 2. - P. 88-97.
- PyTorch documentation // pytorch.org. - URL: https://pytorch.org/docs/stable/index.html (дата обращения: 23.05.2024).