Оценка целесообразности применения нейронных сетей в ГИС

Автор: Тесленок С.А., Федосеева У.С.

Журнал: Огарёв-online @ogarev-online

Статья в выпуске: 10 т.12, 2024 года.

Бесплатный доступ

В данной статье описывается имеющийся опыт и потенциальные возможности применение искусственных нейронных сетей (ИНС) в геоинформационных системах (ГИС). В целом, статья демонстрирует потенциал ИНС при анализе пространственно привязанных геоинформационных данных и возможности их применения в различных смежных с ГИС и геоинформационными технологиями областях.

Геоинформационные системы, искусственные нейронные сети, картографирование, классификация, многослойная инс, обнаружение паттернов, обучение, предобработка данных, прогнозирование, эрозия

Короткий адрес: https://sciup.org/147250452

IDR: 147250452   |   УДК: 00.4:004.9:528:528.711:911.3:911.9:504:502:332.3

Assessment of feasibility of using neural networks in GIS

This article describes the experience and potential application of artificial neural networks (ANN) in geoinformation systems (GIS). In general, the article demonstrates the potential of neural networks in the analysis of spatially linked geoinformation data and the possibilities of their application in various fields related to GIS and geoinformation technologies.

Текст научной статьи Оценка целесообразности применения нейронных сетей в ГИС

В последние десятилетия наблюдается растущий интерес к использованию ИНС (ANN, ANNs) в различных областях, включая обработку и анализ пространственно привязанных геоинформационных данных. Технологии глубокого обучения и ИНС обладают потенциалом для автоматизации процессов анализа пространственных данных, классификации изображений, прогнозирования и обнаружения паттернов в геоинформационных приложениях.

Оценка целесообразности применения ИНС в ГИС представляет значимый интерес для научного сообщества и практических областей, таких как экология, природопользование, обработка данных дистанционного зондирования, сельскохозяйственное производство, геология, градостроительство, общественная безопасность и др. [5; 7; 8; 10–13]. Понимание перспектив и оценка эффективности использования ИНС в ГИС могут привести к разработке инновационных методологий анализа пространственных данных, оптимизации процессов картографирования, прогнозирования и анализа рисков природных и антропогенных явлений.

ИНС – это математические модели, а также их программные или аппаратные реализации, вдохновленные биологическими нейронными сетями – сетями нервных клеток живого организма [5].

ИНС представляют собой систему, состоящую из взаимодействующих между собой простых процессоров – нейронов. Каждый нейрон в такой сети занимается обработкой и передачей сигналов другим нейронам, и, благодаря такому взаимодействию, сеть способна выполнять сложные задачи. С точки зрения машинного обучения, нейронная сеть действительно может быть рассмотрена как частный случай методов распознавания образов, дискриминантного анализа, методов кластеризации и других. Это связано с тем, что нейронные сети обучаются извлекать важные признаки из входных данных, что полезно для решения задач, связанных с классификацией, регрессией и кластеризацией. С математической точки зрения обучение нейронных сетей представляет собой многопараметрическую задачу нелинейной оптимизации. Это означает, что при обучении нейронной сети мы настраиваем множество параметров (весов и смещений) таким образом, чтобы минимизировать функцию потерь, отражающую ошибку предсказания сети. Для этого применяются различные методы оптимизации, такие как градиентный спуск, стохастический градиентный спуск, методы второго порядка и другие. С точки зрения кибернетики, нейронные сети находят применение в задачах адаптивного управления и являются важными алгоритмами для робототехники. Их способность к обучению и адаптации делает их ценным инструментом для создания систем, способных самостоятельно принимать решения в изменяющейся среде. С точки зрения развития вычислительной техники и программирования, нейронные сети действительно представляют интерес как способ решения проблемы эффективного параллелизма. Их параллельная структура и возможность выполнения сложных вычислений в десятки и сотни тысяч нейронов делают их объектом для разработки и оптимизации вычислительных алгоритмов. Таким образом, моделирование биологических нейронных сетей в виде искусственных систем стало стратегически важным для разработки технологий, включая машинное обучение, робототехнику, автономные системы и многое другое.

Нейронная сеть и математическая модель имеют схожий этап сбора и предобработки данных, однако отличаются в специфике создания моделей. В обоих случаях ключевым моментом является сбор и подготовка данных. Это включает в себя работу с источниками данных, их предварительную обработку для использования в моделировании. Однако, при создании ИНС важным этапом является определение структуры сети, включая выбор типов слоев, их последовательность, настройку функций активации и оптимизаторов. Значительное внимание также уделяется работе с изображениями в ИНС, что делает процесс более комплексным в контексте работы с пространственными данными. В отличие от этого, 2

создание математической модели склоняется к работе с абстрактными концепциями, где внимание направлено на разработку уравнений и функций, соответствующих теоретическим моделям, исходя из природы исследуемых данных.

К примеру, в статье [13] описывается процесс обучения сверточной нейронной сети (Convolutional Neural Networks, далее – CNN) на примере обработки данных землетрясений в ГИС (рис. 1). Авторы статьи использовали оригинальный набор данных Венчуанского землетрясения в Китае и провели предварительную обработку данных, включая нормализацию и преобразование входных данных в формат, пригодный для обучения CNN.

а

б

Рис. 1. Процесс обучения до и после предварительной обработки данных:

(а) кривая обучения, (б) кривая функции потери перекрестной энтропии [13].

Для обучения CNN использовались алгоритмы L2-регуляризации, стохастического градиентного спуска и оптимизации ADAM (алгоритм ADAM – Adaptive Moment Estimation). В процессе обучения CNN данные, используемые для обучения, итерировались в одном цикле, называемом эпохой. Авторами анализируемой статьи [13] проведено обучение CNN на 10 эпохах на графическом процессоре 1080ti, что заняло 15 минут. В процессе обучения была достигнута средняя точность расчетов более 95%. После обучения CNN была протестирована на 8 800 образцах из тестового набора данных. Результаты показали, что образцы могут быть распознаны менее чем за 20 секунд, а точность расчетов составила 94,7%.

В контексте ГИС ИНС могут быть использованы в различных геоинформационных проектах [9] для классификации и сегментации изображений: например, для распознавания и классификации объектов на спутниковых снимках [12]. Исследование, описываемое в статье [1], рассматривает использование сверточных нейронных сетей для сегментации объектов на изображениях. В данной технологии CNN применяются для выделения конкретных объектов на изображениях, например, выделение животных на фотографиях. Авторы исследования стремились создать нейросетевую модель, которая автоматически и точно определяет, и выделяет животных на изображениях. В контексте ГИС, возможности использования подобной технологии для сегментации объектов на изображениях огромны. Например, в области автоматизированного геоинформационного картографирования [9; 10] CNN может использоваться для автоматического выделения дорог, рек, озер и других географических объектов на спутниковых снимках или аэрофотоснимках [12]. Это позволяет обрабатывать огромные объемы геопространственных данных и автоматически вести создание или обновление карт [12].

ГИС ArcGIS предлагает возможность использовать предварительно обученные модели глубокого обучения или обучать собственные модели с помощью различных инструментов и платформ, в частности для анализа изображений [16]. В рамках ГИС ArcGIS также есть возможность интеграции со сторонними фреймворками глубокого обучения. В рабочих процессах глубокого обучения в ГИС ArcGIS используются следующие шаги:

  • 1.    Создание обучающих выборок с помощью инструментов редактирования в ГИС ArcGIS.

  • 2.    Обучение модели глубокого обучения с использованием ArcGIS Pro, ArcGIS Image Server для ArcGIS Enterprise или ArcGIS API for Python.

  • 3.    Использование обученной модели для извлечения конкретных особенностей на изображениях с помощью инструментов ArcGIS Pro, ArcGIS Image Server для ArcGIS Enterprise, ArcGIS Online или ArcGIS API for Python.

Помимо этого, ИНС широко используются для моделирования и прогнозирования тенденций или изменений, таких как погода и климатические изменения.

К примеру, в статье [3], был представлен разработанный плагин для ГИС QGIS, который обрабатывает информацию, получаемую с сети метеорологических станций, расположенных в Новосибирской области, и использует многослойную ИНС для прогнозирования количества осадков на этой территории. Для этого проводилась предобработка данных и использовались различные алгоритмы и методы обучения ИНС.

Основной проблемой, с которой сталкиваются при разработке таких систем, является ограниченность данных, особенно при прогнозировании осадков. В базе данных ГИС могут присутствовать только записи о дате и месте осадков, но не о других факторах, таких как температура, влажность или атмосферное давление. Однако благодаря предобработке данных и обучению ИНС на основе доступных данных удалось достичь факта прогнозирования количества осадков. Важным фактором для успешного применения ИНС является наличие достаточного объема данных для обучения и соответствие этих данных требованиям исследуемой задачи.

В другой статье [14] представлено прогнозирование и моделирование эрозии на побережье Коста-да-Капарика в Лиссабоне (Португалия) с помощью комбинации ГИС и ИНС. Для этого используется методика, основанная на анализе данных о погоде, приливах, волнении и других факторах, которые влияют на эрозию побережья. Эти данные обрабатываются и анализируются с помощью ГИС, а затем используются для обучения ИНС. Обученные нейронные сети затем используются для прогнозирования изменений в эрозии на побережье в будущем (см. рис. 2).

Результаты исследования показали, что комбинация ГИС и ИНС является мощным инструментом для анализа и прогнозирования динамики эрозии на побережье Коста-да-Капарика в Лиссабоне (Португалия). Использование модели GIS-ANN позволило получить высокую точность прогнозирования изменений в эрозии на побережье в будущем. Было выявлено, что наибольшее влияние на эрозию оказывают антропогенные факторы, такие как неправильное использование земли, строительство и транспортное движение на побережье. Результаты исследования могут быть использованы для разработки политик, направленных на сохранение окружающей среды и управление побережьем.

Прогнозы могут быть использованы для планирования городского развития, оценки воздействия на окружающую среду и других целей. Так, модель преобразования земель (Land Transformation Model, LTM) [15] использует ГИС и ИНС для прогнозирования изменений землепользования. Для прогнозирования урбанизации в водосборе Grand Traverse Bay в Мичигане, LTM использует данные о землепользовании, климатические данные, данные о дорожной инфраструктуре, населении и другие факторы. Прогнозирование происходит путем анализа исторических данных и использования модели для прогнозирования будущих изменений землепользования.

Рис. 2. Результат прогнозируемых значений для выходных данных в виде карты районов, подверженных эрозионным изменениям в 2021 г. [14].

В статье [4] описывается использование ИНС для прогнозирования загрязнения воздуха в городской среде. Ее авторы рассматривают данные о загрязнении атмосферного воздуха и метеорологические данные, которые используются для обучения нейронных сетей. В статье описывается методика расчета концентраций загрязняющих веществ в атмосфере с помощью программы УПРЗА «Эколог», которая позволяет рассчитать приземные концентрации загрязняющих веществ в атмосфере в соответствии с [2].

Для обучения ИНС использовались данные мониторинга атмосферного воздуха г. Таганрога. Вектор входных данных содержал более 1 000 примеров. Результаты исследования показали, что ИНС могут быть эффективно использованы для прогнозирования загрязнения воздуха в городской среде. Применение ИНС позволило построить прогностическую модель (рис. 3) распределения загрязнителей в атмосферном воздухе при учете различных метеорологических условий и вклада промышленных предприятий в загрязнение воздушного бассейна города [4].

Рис. 3. Прогностическая модель распределения загрязнителей в атмосферном воздухе [4].

Несмотря на все плюсы ИНС, важно осознавать и находить решения для проблем, с которыми мы сталкиваемся при ИНС в ГИС.

  • 1.    Недостаточная объяснимость результатов. ИНС, особенно глубокие, могут быть

  • 2.    Недообучение или переобучение моделей. ИНС могут столкнуться с проблемой недообучения, если данные недостаточно разнообразны или недостаточны, что может привести к неправильным выводам. С другой стороны, переобучение может привести к неправильной генерализации модели на новые данные. Это может быть особенно критично в ГИС, где точность предсказаний имеет большое значение.

  • 3.    Высокая вычислительная сложность. Некоторые типы ИНС, особенно глубокие конволюционные нейронные сети, требуют значительных вычислительных мощностей для обучения и применения. В ГИС, особенно в реальном времени, это может вызвать проблемы с производительностью.

  • 4.    Безопасность и конфиденциальность. ИНС подвержены риску атак, таких как внедрение шума в данные (адверсариальные атаки) или извлечение конфиденциальной информации из моделей (например, инференсия на основе моделей). Эти риски могут усугубиться в ГИС, где данные могут быть особенно чувствительными (например, геолокационные данные).

сложными, сложно интерпретируемыми моделями, что затрудняет объяснение причинноследственных связей в полученных результатах. Это особенно важно в ГИС, где требуется понимание процессов и принятие обоснованных управленческих решений на основе получаемых данных.

Все эти риски важно учитывать при разработке и применении ИНС в ГИС. Хорошо разработанные технические и организационные меры могут помочь снизить эти риски и обеспечить более безопасное и надежное использование ИНС в данной области.

К примеру, ИНС могут использоваться для защиты ГИС и пространственных данных [6]. В частности, ИНС может использоваться для обнаружения распределенных атак типа DDoS, целью которых является отказ в обслуживании и препятствование доступу легитимных пользователей к атакуемому приложению. Нейронная сеть может работать в двух режимах обучения: без учителя (самообучаемая) и с учителем, что дает пользователю возможность задавать начальные веса либо загружать файл с готовой базой знаний. Результаты работы показывают, что ИНС является одним из механизмов обнаружения потенциально опасных угроз в ГИС для поддержки принятия управленческих решений. При использовании ИНС и других существующих методов защиты данных в совокупности в будущем возможно многократное повышение степени обнаружения потенциально опасных угроз в ГИС для поддержки формулирования и принятия управленческих решений [7; 8; 10; 11], что, в свою очередь, позволит построить эффективную и надежную систему обеспечения информационной безопасности данных.

Несмотря на потенциальные риски, эффективное использование ИНС в ГИС имеет огромный потенциал для улучшения процессов анализа пространственных данных, оптимизации процессов картографирования, прогнозирования и анализа рисков природных и антропогенных явлений и процессов. Критически важно учитывать и снижать эти риски, но применение ИНС в ГИС обещает значительные выгоды для современных геопространственных приложений.