Оценка целесообразности применения нейронных сетей в ГИС

Автор: Тесленок С.А., Федосеева У.С.

Статья в выпуске: 10 т.12, 2024 года.

Бесплатный доступ

В данной статье описывается имеющийся опыт и потенциальные возможности применение искусственных нейронных сетей (ИНС) в геоинформационных системах (ГИС). В целом, статья демонстрирует потенциал ИНС при анализе пространственно привязанных геоинформационных данных и возможности их применения в различных смежных с ГИС и геоинформационными технологиями областях.

Геоинформационные системы, искусственные нейронные сети, картографирование, классификация, многослойная инс, обнаружение паттернов, обучение, предобработка данных, прогнозирование, эрозия

Короткий адрес: https://sciup.org/147250452

IDR: 147250452

Текст научной статьи Оценка целесообразности применения нейронных сетей в ГИС

В последние десятилетия наблюдается растущий интерес к использованию ИНС (ANN, ANNs) в различных областях, включая обработку и анализ пространственно привязанных геоинформационных данных. Технологии глубокого обучения и ИНС обладают потенциалом для автоматизации процессов анализа пространственных данных, классификации изображений, прогнозирования и обнаружения паттернов в геоинформационных приложениях.

Оценка целесообразности применения ИНС в ГИС представляет значимый интерес для научного сообщества и практических областей, таких как экология, природопользование, обработка данных дистанционного зондирования, сельскохозяйственное производство, геология, градостроительство, общественная безопасность и др. [5; 7; 8; 10–13]. Понимание перспектив и оценка эффективности использования ИНС в ГИС могут привести к разработке инновационных методологий анализа пространственных данных, оптимизации процессов картографирования, прогнозирования и анализа рисков природных и антропогенных явлений.

ИНС – это математические модели, а также их программные или аппаратные реализации, вдохновленные биологическими нейронными сетями – сетями нервных клеток живого организма [5].

ИНС представляют собой систему, состоящую из взаимодействующих между собой простых процессоров – нейронов. Каждый нейрон в такой сети занимается обработкой и передачей сигналов другим нейронам, и, благодаря такому взаимодействию, сеть способна выполнять сложные задачи. С точки зрения машинного обучения, нейронная сеть действительно может быть рассмотрена как частный случай методов распознавания образов, дискриминантного анализа, методов кластеризации и других. Это связано с тем, что нейронные сети обучаются извлекать важные признаки из входных данных, что полезно для решения задач, связанных с классификацией, регрессией и кластеризацией. С математической точки зрения обучение нейронных сетей представляет собой многопараметрическую задачу нелинейной оптимизации. Это означает, что при обучении нейронной сети мы настраиваем множество параметров (весов и смещений) таким образом, чтобы минимизировать функцию потерь, отражающую ошибку предсказания сети. Для этого применяются различные методы оптимизации, такие как градиентный спуск, стохастический градиентный спуск, методы второго порядка и другие. С точки зрения кибернетики, нейронные сети находят применение в задачах адаптивного управления и являются важными алгоритмами для робототехники. Их способность к обучению и адаптации делает их ценным инструментом для создания систем, способных самостоятельно принимать решения в изменяющейся среде. С точки зрения развития вычислительной техники и программирования, нейронные сети действительно представляют интерес как способ решения проблемы эффективного параллелизма. Их параллельная структура и возможность выполнения сложных вычислений в десятки и сотни тысяч нейронов делают их объектом для разработки и оптимизации вычислительных алгоритмов. Таким образом, моделирование биологических нейронных сетей в виде искусственных систем стало стратегически важным для разработки технологий, включая машинное обучение, робототехнику, автономные системы и многое другое.

Нейронная сеть и математическая модель имеют схожий этап сбора и предобработки данных, однако отличаются в специфике создания моделей. В обоих случаях ключевым моментом является сбор и подготовка данных. Это включает в себя работу с источниками данных, их предварительную обработку для использования в моделировании. Однако, при создании ИНС важным этапом является определение структуры сети, включая выбор типов слоев, их последовательность, настройку функций активации и оптимизаторов. Значительное внимание также уделяется работе с изображениями в ИНС, что делает процесс более комплексным в контексте работы с пространственными данными. В отличие от этого, 2

создание математической модели склоняется к работе с абстрактными концепциями, где внимание направлено на разработку уравнений и функций, соответствующих теоретическим моделям, исходя из природы исследуемых данных.

К примеру, в статье [13] описывается процесс обучения сверточной нейронной сети (Convolutional Neural Networks, далее – CNN) на примере обработки данных землетрясений в ГИС (рис. 1). Авторы статьи использовали оригинальный набор данных Венчуанского землетрясения в Китае и провели предварительную обработку данных, включая нормализацию и преобразование входных данных в формат, пригодный для обучения CNN.

Рис. 1. Процесс обучения до и после предварительной обработки данных:

(а) кривая обучения, (б) кривая функции потери перекрестной энтропии [13].

Для обучения CNN использовались алгоритмы L2-регуляризации, стохастического градиентного спуска и оптимизации ADAM (алгоритм ADAM – Adaptive Moment Estimation). В процессе обучения CNN данные, используемые для обучения, итерировались в одном цикле, называемом эпохой. Авторами анализируемой статьи [13] проведено обучение CNN на 10 эпохах на графическом процессоре 1080ti, что заняло 15 минут. В процессе обучения была достигнута средняя точность расчетов более 95%. После обучения CNN была протестирована на 8 800 образцах из тестового набора данных. Результаты показали, что образцы могут быть распознаны менее чем за 20 секунд, а точность расчетов составила 94,7%.

В контексте ГИС ИНС могут быть использованы в различных геоинформационных проектах [9] для классификации и сегментации изображений: например, для распознавания и классификации объектов на спутниковых снимках [12]. Исследование, описываемое в статье [1], рассматривает использование сверточных нейронных сетей для сегментации объектов на изображениях. В данной технологии CNN применяются для выделения конкретных объектов на изображениях, например, выделение животных на фотографиях. Авторы исследования стремились создать нейросетевую модель, которая автоматически и точно определяет, и выделяет животных на изображениях. В контексте ГИС, возможности использования подобной технологии для сегментации объектов на изображениях огромны. Например, в области автоматизированного геоинформационного картографирования [9; 10] CNN может использоваться для автоматического выделения дорог, рек, озер и других географических объектов на спутниковых снимках или аэрофотоснимках [12]. Это позволяет обрабатывать огромные объемы геопространственных данных и автоматически вести создание или обновление карт [12].

ГИС ArcGIS предлагает возможность использовать предварительно обученные модели глубокого обучения или обучать собственные модели с помощью различных инструментов и платформ, в частности для анализа изображений [16]. В рамках ГИС ArcGIS также есть возможность интеграции со сторонними фреймворками глубокого обучения. В рабочих процессах глубокого обучения в ГИС ArcGIS используются следующие шаги:

1. Создание обучающих выборок с помощью инструментов редактирования в ГИС ArcGIS.
2. Обучение модели глубокого обучения с использованием ArcGIS Pro, ArcGIS Image Server для ArcGIS Enterprise или ArcGIS API for Python.
3. Использование обученной модели для извлечения конкретных особенностей на изображениях с помощью инструментов ArcGIS Pro, ArcGIS Image Server для ArcGIS Enterprise, ArcGIS Online или ArcGIS API for Python.

Помимо этого, ИНС широко используются для моделирования и прогнозирования тенденций или изменений, таких как погода и климатические изменения.

К примеру, в статье [3], был представлен разработанный плагин для ГИС QGIS, который обрабатывает информацию, получаемую с сети метеорологических станций, расположенных в Новосибирской области, и использует многослойную ИНС для прогнозирования количества осадков на этой территории. Для этого проводилась предобработка данных и использовались различные алгоритмы и методы обучения ИНС.

Основной проблемой, с которой сталкиваются при разработке таких систем, является ограниченность данных, особенно при прогнозировании осадков. В базе данных ГИС могут присутствовать только записи о дате и месте осадков, но не о других факторах, таких как температура, влажность или атмосферное давление. Однако благодаря предобработке данных и обучению ИНС на основе доступных данных удалось достичь факта прогнозирования количества осадков. Важным фактором для успешного применения ИНС является наличие достаточного объема данных для обучения и соответствие этих данных требованиям исследуемой задачи.

В другой статье [14] представлено прогнозирование и моделирование эрозии на побережье Коста-да-Капарика в Лиссабоне (Португалия) с помощью комбинации ГИС и ИНС. Для этого используется методика, основанная на анализе данных о погоде, приливах, волнении и других факторах, которые влияют на эрозию побережья. Эти данные обрабатываются и анализируются с помощью ГИС, а затем используются для обучения ИНС. Обученные нейронные сети затем используются для прогнозирования изменений в эрозии на побережье в будущем (см. рис. 2).

Результаты исследования показали, что комбинация ГИС и ИНС является мощным инструментом для анализа и прогнозирования динамики эрозии на побережье Коста-да-Капарика в Лиссабоне (Португалия). Использование модели GIS-ANN позволило получить высокую точность прогнозирования изменений в эрозии на побережье в будущем. Было выявлено, что наибольшее влияние на эрозию оказывают антропогенные факторы, такие как неправильное использование земли, строительство и транспортное движение на побережье. Результаты исследования могут быть использованы для разработки политик, направленных на сохранение окружающей среды и управление побережьем.

Прогнозы могут быть использованы для планирования городского развития, оценки воздействия на окружающую среду и других целей. Так, модель преобразования земель (Land Transformation Model, LTM) [15] использует ГИС и ИНС для прогнозирования изменений землепользования. Для прогнозирования урбанизации в водосборе Grand Traverse Bay в Мичигане, LTM использует данные о землепользовании, климатические данные, данные о дорожной инфраструктуре, населении и другие факторы. Прогнозирование происходит путем анализа исторических данных и использования модели для прогнозирования будущих изменений землепользования.

Рис. 2. Результат прогнозируемых значений для выходных данных в виде карты районов, подверженных эрозионным изменениям в 2021 г. [14].

В статье [4] описывается использование ИНС для прогнозирования загрязнения воздуха в городской среде. Ее авторы рассматривают данные о загрязнении атмосферного воздуха и метеорологические данные, которые используются для обучения нейронных сетей. В статье описывается методика расчета концентраций загрязняющих веществ в атмосфере с помощью программы УПРЗА «Эколог», которая позволяет рассчитать приземные концентрации загрязняющих веществ в атмосфере в соответствии с [2].

Для обучения ИНС использовались данные мониторинга атмосферного воздуха г. Таганрога. Вектор входных данных содержал более 1 000 примеров. Результаты исследования показали, что ИНС могут быть эффективно использованы для прогнозирования загрязнения воздуха в городской среде. Применение ИНС позволило построить прогностическую модель (рис. 3) распределения загрязнителей в атмосферном воздухе при учете различных метеорологических условий и вклада промышленных предприятий в загрязнение воздушного бассейна города [4].

Рис. 3. Прогностическая модель распределения загрязнителей в атмосферном воздухе [4].

Несмотря на все плюсы ИНС, важно осознавать и находить решения для проблем, с которыми мы сталкиваемся при ИНС в ГИС.

1. Недостаточная объяснимость результатов. ИНС, особенно глубокие, могут быть
2. Недообучение или переобучение моделей. ИНС могут столкнуться с проблемой недообучения, если данные недостаточно разнообразны или недостаточны, что может привести к неправильным выводам. С другой стороны, переобучение может привести к неправильной генерализации модели на новые данные. Это может быть особенно критично в ГИС, где точность предсказаний имеет большое значение.
3. Высокая вычислительная сложность. Некоторые типы ИНС, особенно глубокие конволюционные нейронные сети, требуют значительных вычислительных мощностей для обучения и применения. В ГИС, особенно в реальном времени, это может вызвать проблемы с производительностью.
4. Безопасность и конфиденциальность. ИНС подвержены риску атак, таких как внедрение шума в данные (адверсариальные атаки) или извлечение конфиденциальной информации из моделей (например, инференсия на основе моделей). Эти риски могут усугубиться в ГИС, где данные могут быть особенно чувствительными (например, геолокационные данные).

сложными, сложно интерпретируемыми моделями, что затрудняет объяснение причинноследственных связей в полученных результатах. Это особенно важно в ГИС, где требуется понимание процессов и принятие обоснованных управленческих решений на основе получаемых данных.

Все эти риски важно учитывать при разработке и применении ИНС в ГИС. Хорошо разработанные технические и организационные меры могут помочь снизить эти риски и обеспечить более безопасное и надежное использование ИНС в данной области.

К примеру, ИНС могут использоваться для защиты ГИС и пространственных данных [6]. В частности, ИНС может использоваться для обнаружения распределенных атак типа DDoS, целью которых является отказ в обслуживании и препятствование доступу легитимных пользователей к атакуемому приложению. Нейронная сеть может работать в двух режимах обучения: без учителя (самообучаемая) и с учителем, что дает пользователю возможность задавать начальные веса либо загружать файл с готовой базой знаний. Результаты работы показывают, что ИНС является одним из механизмов обнаружения потенциально опасных угроз в ГИС для поддержки принятия управленческих решений. При использовании ИНС и других существующих методов защиты данных в совокупности в будущем возможно многократное повышение степени обнаружения потенциально опасных угроз в ГИС для поддержки формулирования и принятия управленческих решений [7; 8; 10; 11], что, в свою очередь, позволит построить эффективную и надежную систему обеспечения информационной безопасности данных.

Несмотря на потенциальные риски, эффективное использование ИНС в ГИС имеет огромный потенциал для улучшения процессов анализа пространственных данных, оптимизации процессов картографирования, прогнозирования и анализа рисков природных и антропогенных явлений и процессов. Критически важно учитывать и снижать эти риски, но применение ИНС в ГИС обещает значительные выгоды для современных геопространственных приложений.

Статья научная