Опыт оцифровки гербарных данных и разработка базы данных локалитетов растений
Автор: Санданов Д.В., Шишмарева М.Л., Астраханцева Е.П., Кожевникова А.В., Гальчеева М.А.
Журнал: Природа Внутренней Азии @nature-inner-asia
Рубрика: Биология
Статья в выпуске: 1 (30), 2025 года.
Бесплатный доступ
Начата оцифровка данных гербария Института общей и экспериментальной биологии СО РАН (UUH). На текущий момент в базу данных внесено 6 009 записей, для которых приведено 5 227 геопривязок. Из общего массива 4 889 записей (81,3 %) содержат привязки средней и высокой точности. Наибольшая часть данных в массиве представлена гербарными сборами с территории Республики Бурятия и включает 5 036 образцов с 4 724 геопривязками. На основе имеющихся данных проанализировано пространственное распределение сосудистых растений в Байкальской Сибири, выявлены основные коллекторы гербария, отмечены сборы с особо охраняемых природных территорий и редкие виды растений.
Оцифровка гербарных данных, местонахождения растений, распространение видов, электронные гербарные этикетки
Короткий адрес: https://sciup.org/148331744
IDR: 148331744 | УДК: 581.9+502.75 | DOI: 10.18101/2542-0623-2025-1-53-63
Текст научной статьи Опыт оцифровки гербарных данных и разработка базы данных локалитетов растений
Исследование выполнено за счет средств гранта Российского научного фонда № 24-2400154,
В современной биологии исследователи оперируют большими массивами данных. Разработка различных ботанических баз данных и веб-сервисов является актуальной задачей, так как они позволяют систематизировать имеющую информацию по распространению видов растений, составлять предварительные прогнозы по динамике ареалов изучаемых видов, открывают возможности для комплексного анализа их ареалов [Санданов, 2019]. В последние годы в России проводится большая работа по созданию региональных баз данных по биоразнообразию [Верхозина, 2016; Санданов, 2016; Филиппова и др., 2017; Kislov et al., 2017].
При разработке баз данных основополагающим и трудозатратным первым этапом является оцифровка и стандартизация (нормализация) данных. Это создание единого структурированного массива данных, происходящих из разнородных источников. Для применения методов анализа данных с помощью количественных методов необходимо пройти этап оцифровки — ручного и полуавтоматического ввода в базу данных сведений о биоразнообразии территории.
Актуальность перевода материалов естественно-научных коллекций в цифровой формат связана со многими важными аспектами. Cегодня гербарные коллекции являются наиболее массовым и надежным источником данных о разнообразии растений. Электронный гербарий — это цифровая база данных, содержащая информацию о растениях, включая изображения, ботаническое описание, местонахождение вида, характеристику его местообитаний и другие метаданные. Такие базы данных предлагают множество преимуществ по сравнению с традиционными гербариями в научном, образовательном и практическом плане.
В последние годы на территории Байкальской Сибири активизировались исследования по оцифровке гербарных коллекций. Это в первую очередь связано с тем, что рассматриваемый регион является важным фитогеографическим узлом, где соединены евросибирские и восточноазиатские, североазиатские высокогорные, бореально-таежные и центральноазиатские аридные флористические комплексы. Здесь также встречается большое число эндемичных видов и родов. Поэтому вопросы систематизации, оцифровки и научной обработки накопленной ботанической информации являются важными и актуальными направлениями, которые в конечном итоге могут обеспечить эффективный мониторинг состояния экосистемы оз. Байкал.
Самой крупной коллекцией Республики Бурятия является гербарий Института общей и экспериментальной биологии СО РАН (ИОЭБ). Он начал формироваться с 1951 г. в рамках созданной ботанической группы при Бурятском комплексном НИИ СО АН СССР (г. Улан-Удэ), возглавляемой М. А. Рампиловой [Пыхалова и др., 2005]. Начиная с 2003 г. гербарий ИОЭБ СО РАН имеет официальный акроним UUH (Ulan-Ude Herbarium) в международной базе данных Index Herbariorum. Главная цель работы гербария — сбор и хранение информации по биологическому разнообразию растительного мира Республики Бурятия, Байкальской Сибири и сопредельных территорий [Чимитов, Аненхонов, 2023].
С марта 2024 г. нами начаты работы по оцифровке данных гербария ИОЭБ СО РАН. Важно отметить, что такие исследования проводятся впервые. Основная часть фондов ИОЭБ СО РАН приурочена к территории Республики Бурятия, поэтому сведения, полученные при оцифровке данных, послужат основой для подготовки следующего издания «Определителя растений Бурятии», например, при указании флористических районов распространения видов. Помимо этого все доступные сведения гербарной коллекции будут представлены в электронном виде, что облегчит поиск и анализ необходимой информации.
Материалы и методы
База данных реализована с помощью пакета Microsoft Excel и состоит из различных колонок с информацией: название вида, шкала погрешности; широта и долгота; семейство и род; регион; высота над уровнем моря; местонахождение и местообитание; дата и год сбора; входящий номер; баркод (при наличии); ФИО исследователя, собравшего гербарий; ФИО определившего данный вид; примечания; ООПТ; ссылки (табл. 1).
В созданной таблице можно выполнять сортировку данных по полям, для чего используются различные макросы MS Excel. Пользователь может создавать, редактировать и просматривать свои записи в таблице.
Исходные местонахождения видов согласно тексту гербарных этикеток были сгенерированы с помощью интернет-сервиса «Яндекс-карты». В дальнейшем местонахождения были уточнены и отредактированы с использованием программы сервиса Google «Планета Земля». Все материалы были импортированы в подготовленную ГИС-основу для создания итоговой картосхемы.
Если на этикетках не была указана координатная привязка, тогда геоданные привязывали, опираясь на текстовые описания. Точки находок, которые не удавалось привязать с заданной точностью, исключались.
Таблица 1
|
Название колонки |
Примечания |
|
Название вида на латинском |
Использовалась номенклатура по Конспекту флоры Азиатской России (2012) |
|
Шкала точности, в метрах и километрах |
Согласно работе В. В. Чепиноги с соавторами (2017) |
|
Широта и долгота, d.dddd |
Приводится в формате «градусы с десятичными долями» |
|
Семейство и род на латинском языке |
Использовалась номенклатура по Конспекту флоры Азиатской России (2012) |
|
Регион |
Для России были указаны республика, край, область, автономный округ. Для зарубежных стран только название страны |
|
Высота над уровнем моря, м |
При отсутствии информации в гербарной этикетке определяли в сервисе Google «Планета Земля» |
|
Местонахождение и местообитание |
Были дословно набраны в базу данных, как указано в гербарных этикетках |
|
Дата и год сбора |
- |
|
Полевой номер |
Идентификационный номер гербарного листа или номер геоботанических описаний |
|
ФИО исследователя, собравшего гербарий |
- |
|
ФИО исследователя, определившего данный вид |
- |
|
Примечания |
Любые дополнительные заметки, отмеченные на гербарной этикетке |
|
ООПТ |
Отметки о местонахождении вида на территории особо охраняемой природной территории |
|
Ссылки |
Ссылки на фото гербарных листов, интернет-источники, публикации |
Структура базы данных локалитетов видов
В базе данных использованы диапазоны точности, предложенные в публикации В. В. Чепиноги с соавторами (2017): ±0,1 км (главным образом точки, привязанные с использованием спутниковых навигаторов или GPS-приемника мобильного телефона); ±1 км (указания координат с точностью до минут); ±3 км (окрестности поселков); ±5 км (небольшие локальные флоры); ±10 км (если в гербарной этикетке указано расстояние до 20 км); ±15 км и выше (приблизительные геопривязки).
Результаты
Проведена оцифровка данных этикеток, представленных на 6 009 гербарных листах с 5 227 геопривязками (сведения на 1 ноября 2024 г.). Из общего массива 1 097 записей (18,3 %) содержат точные географические координаты со спутниковых навигаторов или геопозиционирование с мобильных телефонов. Доля геоданных с точностью от 1 до 5 км довольно велика и составляет 3 792 пар координат, что составляет 63 % всех геопривязок. Все это свидетельствует о наличии большого числа геоданных хорошего разрешения, что, несомненно, будет важно для последующего пространственного анализа.
Проведена ревизия имеющихся коллекций следующих семейств: Alismataceae, Aspleniaceae, Athyriaceae, Aspidiaceae, Butomaceae, Ceratophyllaceae, Cupressaceae, Dryopteridaceae, Ephedraceae, Equisetaceae, Hydrocharitaceae, Hypolepidaceae, Huperziacaceae, Juncaginaceae, Lycopodiaceae, Najadaceae, Onocleaceae, Ophio-glossaceae, Pinaceae, Poaceae, Polypodiaceae, Potamogetonaceae, Salviniaceae, Selaginellaceae, Sinopteridaceae, Scheuchzeriaceae, Sparganiaceae, Thelypteridaceae, Typhaceae, Woodsiaceae. Дополнительно внесены сведения по электронным гербарным этикеткам для некоторых видов из других семейств, включая и каталог по семейству Chenopodiaceae [Найданов, 2023]. В фонде UUH имеются дублетные материалы из гербариев IRK, IRKU, MW, NSK, TK, UUDE, VLA.
Пространственное распределение имеющихся данных в подготовленном массиве в целом отображает основные направления и географию исследований лаборатории флористики и геоботаники ИОЭБ СО РАН (рис.).
Рис. Распространение сосудистых растений на территории Байкальской Сибири (предварительный массив данных гербария ИОЭБ СО РАН — UUH)
Большинство ботанических исследований проводилось на территории Республики Бурятия. В основном они охватывают долины рек Селенги и Уды, побережья Байкала (включая территории Баргузинского и Байкальского заповедника, Забайкальского национального парка), Баргузинскую (территория Джергин-ского заповедника), Еравнинскую и Тункинскую котловины (территория Тун-кинского национального парка). Отдельным кластером выделились гербарные сборы О. А. Аненхонова, К. И. Осипова, И. Р. Сэкулич с Витимского плоскогорья (Баунтовский и Еравнинский районы Бурятии).
Наибольшая часть сборов за авторством О. А. Аненхонова (1495 записей, с 1965 по 2022 г.). В период с 1970 по 1998 г. активно собирался герабрий за авторством Т. Г. Бойкова (440 записей), Т. Д. Пыхаловой (427 записей, в основном сборы с хребта Улан-Бургасы), Н. К. Бадмаевой (249 записей), И. Р. Сэкулич (227 записей), К. И. Осипова (113 записей). На начальном этапе формирования гербария ИОЭБ СО РАН большую роль сыграли многие известные ботаники: М. А. Рещиков (28 записей, 1951–1972 гг.), М. А. Рампилова (13 записей, 1958– 1961), П. И. Петрович (41 запись, с 1961 по 1976 г.), Н. И. Эмедеева (101 запись, 1965–1966 гг.), Е. А. Судакова (78 записей, 1965–1968 гг.), Ю. Д. Харитонов (8 записей, 1966–1968 гг.).
В имеющемся массиве самый старый гербарный образец 1894 г. — Carex norvegica Retz., коллектор И. Чистяков, собран в окрестностях с. Анаш Енисейской губы. Также имеются образцы, датированные 1910 годом и собранные известным ученым и краеведом П. С. Михно. Из современных гербарных сборов больше всего образцов за авторством Д. Г. Чимитова (618 записей), А. В. Суткина (494), Б. Б. Найданова (397), Л. В. Кривобокова (310).
Редко, но все же встречаются гербарные листы, не несущие информативной нагрузки. Это те листы, у которых частично (присутствует только название вида и/или информация о том, кто определил данный образец) или полностью отсутствует гербарная этикетка. Данные листы учитывались для вычисления объема гербарного фонда, но исключались при обработке данных.
В таблице 2 приведены сведения по Республике Бурятия, Иркутской области и Забайкальскому краю.
Таблица 2
Сведения по регионам Байкальской Сибири в массиве данных
|
Регион |
Всего |
Гербарий UUH |
Дублеты |
Геопривязки |
Точные привязки |
|
Республика Бурятия |
5 412 |
5 036 |
118 |
4 724 |
859 |
|
Иркутская область |
193 |
67 |
123 |
193 |
43 |
|
Забайкальский край |
112 |
71 |
34 |
111 |
42 |
Здесь также отмечается наибольшая доля гербарных образцов, собранных на территории Бурятии. Соседние регионы (Иркутская область и Забайкальский край) исследованы в меньшей степени и характеризуются схожим объемом гербарных листов. В имеющемся массиве отмечено 275 дублетов.
Природно-заповедный фонд в Республике Бурятия представлен двумя биосферными и одним природным заповедником, двумя национальными парками, шестнадцатью заказниками, природным парком, 59 памятниками природы. Такое большое количество ООПТ как федерального, так регионального и местного значения объясняется уникальным сочетанием географического положения, горно-котловинного рельефа, климата и многообразия типов растительности. В массиве данных отмечено 573 образца, собранных в ООПТ Республики Бурятия (табл. 3). Необходимо отметить, что также имеются сборы с ООПТ Забайкальского края: Даурского заповедника, Сохондинского заповедника и национального парка « Алханай » .
Представленность гербарных сборов с особо охраняемых природных территорий Республики Бурятия
Таблица 3
|
ООПТ |
Всего гербарных листов |
Годы |
Коллекторы |
|
Байкальский государственный природный биосферный заповедник |
25 |
1983–2023 |
Бойков Т. Г., Буинова М. Г., Пыхалова Т. Д., Гамова Н. С., Сэкулич И. Р., Суткин А. В., Коротков Ю. Н. |
|
Баргузинский государственный природный биосферный заповедник |
143 |
1962–2011 |
Аненхонов О. А., Кривобоков Л. В., Лагутская Л. И., Любина Г., Тутубалина Н., Сипливинский В. Н. |
|
Государственный природный заповедник «Джергинский» |
84 |
1995–2000 |
Аненхонов О.А. |
|
Верхне-Ангарский заказник |
1 |
2011 |
Дулепова Н. А. |
|
Забайкальский национальный парк |
116 |
1984–2018 |
Аненхонов О. А., Бадмаева Н. К., Бойков Т. Г., Пыхалова Т. Д. |
|
Кабанский заказник |
7 |
2011 |
Аненхонов О. А. |
|
Тункинский национальный парк |
197 |
1968–2022 |
Аненхонов О. А., Бадмаева Н. К., Бойков Т. Г., Верхозина А. В., Казановский С. Г., Найданов Б. Б., Рещиков М. А., Рупышев Ю. А., Санданов Д. В., Холбоева С. А., Чепинога В. В, Чимитов Д. Г., Швецова Н. Е. |
Наибольшая представленность гербарных образцов отмечена для Тункинского национального парка, Баргузинского заповедника и Забайкальского национального парка. В этих ООПТ продолжительное время работали большие научные коллективы, проводились комплексные и отдельные ботанические экспедиции. Примечательно, что на охраняемых территориях отмечено и большее число гербарных сборов редких растений. В целом в имеющемся массиве данных отмечен 341 образец для 63 видов, включенных в четвертое издание Красной книги Республики Бурятия (2023). По предварительным сведениям, чаще всего отмечены следующие виды: Stipa pennata (37 листов), Krascheninnikovia ceratoides (27), Stipa glareosa (19), Stipa klemenzii (14), Corispermum ulopterum (15), Peganum nigellastrum (11), Camptosorus sibiricus (11), Festuca extremiorientalis (10), Ceratoides papposa (10), Carex capricornis (10).
Обсуждение
Базы данных могут способствовать получению более рациональных вариантов решения и обеспечить проверку достоверности информации с использованием количественных методов [Санданов, 2019]. Активные ботанические исследования в современный период в значительной степени способствовали уточнению информации о распространении видов [Санданов и др., 2024]. Ежегодно публикуются многочисленные флористические находки, новые местонахождения видов растений фиксируются в разных базах данных, в сети Интернет отмечаются фотографии видов с геолокацией. Поэтому массив современных данных по распространению растений становится гораздо более полным.
В настоящее время геопривязки являются цифровыми источниками информации местообитаний видов. В имеющемся массиве данных есть координаты и точности привязок для каждого местонахождения, что позволяет оценить качество имеющихся геоданных. При необходимости создания карты более крупного масштаба локалитеты с низкой точностью можно отфильтровать и использовать только местонахождения хорошего разрешения. Навигаторы, использующие системы GPS и ГЛОНАСС, позволяют проводить привязку местонахождений на местности с высокой точностью [Чепинога и др., 2017]. Однако для бoльшей части гербарных коллекций приходится осуществлять геопривязку на основе имеющейся информации. Точность такой привязки существенно ниже. Предварительный анализ геопривязок гербария показал, что большинство данных (81,3 %) характеризуется высокой и средней степенью точности. Пространственное распределение гербарных сборов обозначило основные территории, где проводились интенсивные полевые работы. Примечательно, что даже на небольшом массиве данных можно отследить историю и географию ботанических исследований в регионе. Помимо охвата разных районов Бурятии много ботанических экспедиций проходило в особо охраняемых природных территориях. В частности, по результатам многолетних исследований сначала была опубликована флора Забайкальского национального парка [Бойков и др., 1991], а позднее аннотированный список сосудистых растений этой ООПТ [Аненхонов, Пыхалова, 2010]. Сегодня гербарий ИОЭБ СО РАН является региональным центром хранения информации и в значительной мере отражает таксономическое разнообразие, географические, экологические, морфологические особенности флоры Байкальского региона, которые служат научной базой для охраны и использования растительных ресурсов [Пыхалова и др., 2005].
Структура базы данных гербария ИОЭБ СО РАН позволяет проводить ареало-гический анализ, понять экологию и географию видов, оценить характеристики их местообитаний. Наличие большого числа точных географических привязок позволяет проводить крупномасштабное картографирование, что является хорошей базой для разработки охранных мероприятий для редких и исчезающих видов. Информация из базы данных легко интегрируется в ГИС-программы и картографические пакеты (DMap), мобильные приложения для смартфонов (ObsMapp, GeoODK, Geopaparazzi, FloraApp, EpiCollect), а также другие программы по моделированию распространения растений (BIOCLIM, GARP, MaxEnt и др.).