Проблема автоматизации дендрохронологических измерений: современные подходы к решению
Автор: Уткин М.В., Филатова М.О.
Журнал: Проблемы археологии, этнографии, антропологии Сибири и сопредельных территорий @paeas
Рубрика: Археология эпохи палеометалла средневековья и нового времени
Статья в выпуске: т.XXIX, 2023 года.
Бесплатный доступ
В данной работе рассматривается проблема автоматизации дендрохронологических измерений. Древесно-кольцевой анализ требует предварительного определения границ годичных колец, что традиционно выполняется вручную с использованием стереоскопа, подвижного стола и регистратора данных. Однако этот процесс отнимает много времени и очень обременителен, особенно в случае наличия длинных древесно-кольцевых рядов. Разработка полностью автоматического, универсального метода определения границ годичных колец представляет собой сложную задачу, связанную с разнообразием типов анатомических структур разных видов деревьев. Существует несколько подходов к автоматическому обнаружению границ колец; однако они используют базовые методы обработки изображений (основанные на первой производной изображения): фильтр Собеля, детектор границ Кэнни и др. В результате их точность ограничена, а их применение возможно только для древесины хвойных пород, где границы годичных колец четко определены. Также существует коммерческое программное обеспечение, однако ни одно не является универсальным, поскольку они не работают применительно к кольцесосудистым породам древесины. Недавние разработки в области машинного обучения все больше доказывают, что ручной выбор признаков может быть успешно заменен автоматическим. В частности, в нескольких зарубежных работах стали успешно применять сверточные нейронные сети (CNN) в идентификации, распознавании и обучении признаков, в чем они продемонстрировали довольно высокую производительность. Более того, поскольку CNN способны идентифицировать функции, недоступные человеческому восприятию, в некоторых приложениях изученные функции позволяют превзойти человеческую точность. Кроме того, их применение не требует априорных знаний о внешнем виде границ годичных колец, что делает метод универсальным для любой породы древесины. Единственным их недостатком является тот факт, что обучение нейронных сетей занимает довольно много времени. Однако следует помнить, что данный процесс необходимо проводить только один раз.
Дендрохронология, измерение ширины годичных колец, автоматизация измерений, сверточные нейронные сети
Короткий адрес: https://sciup.org/145146730
IDR: 145146730 | DOI: 10.17746/2658-6193.2023.29.0937-0943
Текст научной статьи Проблема автоматизации дендрохронологических измерений: современные подходы к решению
Дендрохронология – научная дисциплина, занимающаяся датировкой годичных колец древесины и связанных с ними событий [Шиятов и др., 2000, с. 6]. Традиционно измерение ширины годичных колец в дендрохронологии производится на полуавтоматической установке Lintab (стереоскопа с подвижной платформой и регистратором данных) специально обученным человеком. Подобный метод измерений является самым популярным, благодаря своей точности и надежности; но в то же самое время он является и довольно обременительным, поскольку требует больших временных затрат (т.к. годичные кольца приходится измерять вручную одно за другим). Это ограничивает его применимость, особенно в случае исследования длинных рядов годичных колец.
Несмотря на это, область применения метода измерений годичных колец на основе изображений по-прежнему довольно ограничена по причине их зависимости от ряда дополнительных факторов: подготовки образцов, разрешения (качества) изображения, а также от типа исследуемой древесины. Из-за этого существующее программное обеспечение часто не может определить границы годичных колец, даже если они легко различимы для эксперта.
Разработка полностью автоматизированного универсального способа обнаружения годичных колец на основе изображений является чрезвычайно сложной задачей. Помимо того, что существуют три основных типа пород древесины, кардинально отличающихся по анатомическому строению друг от друга (хвойные, кольцесосудистые и рассеянососудистые деревья), зачастую строение древесины значительно различается и между породами одной группы. Более того, довольно часто можно наблюдать существенные различия между годичными кольцами одного и того же вида деревьев (в зависимости от условий окружающей среды, в которых деревья проживали) и даже между кольцами внутри одного конкретного дерева. Все эти различия выражаются в огромном разнообразии характеристик изображений древесной поверхности [Pan, Kudo, 2011, p. 250–260], что, в свою очередь, приводит к необходимости использования различных подходов к обнаружению годичных колец для разных пород и видов.
Преобладающее количество исследований, связанных с выявлением годичных колец в образцах древесины, относится к породам хвойного типа древесины с относительно простым анатомическим строением годичных колец, которое на отсканированном изображении выглядит как совокупность более светлых (ранняя древесина) и более темных (поздняя древесина) участков площади поверхности [Borianne, Pernaudat, Subsol, 2011; Cerda, Hitschfeld-Kahler, Mery, 2007; Conner et al., 1998; Soille, Misson, 2001; Fabijanska, Danek, 2018; Rigozo et al., 2004; Sheppard, Graumlich, 1994; Sioma, Socha, 2016; Zhou et al., 2012].
Гораздо меньше исследований посвящено другим типам древесины с более сложной структурой древесины: рассеянососудистой [Entacher, Planitzer, Uhl, 2007; Latte et al., 2015] и кольцесосудистой [Lara, Bravo, Sierra, 2015; von Arx, Dietz, 2005]. Однако следует отметить, что в большинстве упомянутых работ используемые методы автоматизации измерений были протестированы на одном или нескольких видах, что, в свою очередь, свидетельствует о том, что поиск универсального метода, который бы работал для любого вида анатомической древесно-кольцевой структуры или даже для одного типа древесины, является невероятно сложной задачей.
Данная статья является обзором имеющихся на данный момент научных работ по внедрению частично и полностью автоматизированных измерений древесных колец в дендрохронологическую практику.
Получение цифровых изображений древесины
Первым шагом в процедуре обнаружения годичных колец является получение их изображений. В исследованиях, связанных с обработкой изображений годичных колец, наиболее популярными являются изображения поперечных срезов древесины [Kennel, Borianne, Subsol, 2015; Myglan et al., 2020]. Для их получения могут применяться как обычные фотокамеры высокого разрешения (камеры с большим увеличением, либо же подключенные к цифровым микроскопам, позволяющие производить макроснимки), так и всевозможные сканирующие устройства.
Главным недостатком использования стандартных сканирующих устройств является ограниченное разрешение получаемых изображений (как правило, до 1800 dpi), что в свою очередь может привести к искажению информации об узких годичных кольцах, которые впоследствии могут быть пропущены при изучении. Именно поэтому подавляющее число исследователей пользуются специализированными сканерами высокого разрешения. Так, напр., Сибирской дендрохронологической лабораторией (СФУ, Красноярск) была проведена датировка деревянных построек г. Енисейска (выполненная с помощью анализа плотности годичных колец методом «blue intensity») с использованием сканера Epson Perfection V850 Pro с разрешением 2400 dpi [Мыглан и др., 2018]. На базе дендрохронологической лаборатории ИГ РАН (Москва) для проведения древесно-кольцевого анализа активно используются изображения, созданные при по- мощи сканера высокого разрешения Epson Perfection V700 с разрешением 3200 dpi [Семеняк и др., 2022].
Еще одним методом получения изображения, описанным в работе Б. Вагнера и его коллег, является лазерное сканирование древесины при помощи портативного лазерного 3D-сканера Faro ScanArm; однако широкое применение подобного способа кажется мало возможным из-за дороговизны как самого сканера, так и эксплуатации [Wagner et al., 2011, p. 201–210].
Помимо использования сканирующих устройств, создающих изображения поверхности древесины, все большую популярность среди исследователей набирают и изображения внутреннего строения древесины, полученные с помощью рентгеновских лучей (денситометрия, томография). Первой успешной датировкой деревянного объекта на основе компьютерной томографии было произведенное в 2006 г. исследование рукояти инструмента, сделанной из дуба [Grabner, Salaberger, Okochi, 2009, p. 349–352]. После публикации данной работы дендрохронологи по всему миру, один за одним, начали предпринимать успешные попытки использования X-ray томографов в своих исследованиях [Уткин, Филатова, 2021].
В российской дендрохронологии также предпринималась попытка применения компьютерной томографии при исследовании древесины: в 2010 г. совместными усилиями сотрудников ИАЭТ и ИЯФ СО РАН было проведено исследование деревянного изделия методом рентгеновской томографии [Гольдберг, Купер, Слюсаренко, 2010, с. 176–180]. Экспериментальным образцом послужила деревянная бляха в форме усеченного конуса со сквозным отверстием в центре, которая являлась деталью колчана и происходила из кург. 1 могильника Ак-Алаха-1 [Полось-мак, 1994, с. 30]. Однако несмотря на столь активное и достаточно успешное применение описанных выше методов получения цифровых изображений древесины (как ее внешней поверхности, так и внутреннего строения), наиболее распространенным способом получения изображений все еще является использование цифровых фотокамер высокого разрешения (в основном из-за доступности и относительно низкой стоимости необходимого оборудования) [Helama et al., 2016; von Arx and Dietz, 2005].
Исключением не стала и отечественная дендрохронология, где цифровая макрофотосъемка также применяется достаточно активно. Так напр., в 2016 г., сотрудниками ИГ и ИА РАН было проведено исследование трех икон XV–XVII вв., в котором активно применялась макрофотосъемка зачищенных поперечных сечений панелей икон [Matskovsky, Dolgikh, Voronin, 2016].
В 2023 г. на базе Сибирской дендрохронологической лаборатории (Красноярск) была разработана новая методика пробоподготовки поверхности древесных углей и создания древесно-кольцевых хронологий по их цифровым изображениям (древесные угли фотографировались в отраженном свете при ×30 увеличе- нии с помощью микроскопа Zeiss AXIO Zoom. V16, оснащенного моторизированным предметным столиком) [Мыглан и др., 2023].
Ручное и автоматизированное обнаружение годичных колец
На данный момент в распоряжении дендрохронологов существует несколько программных инструментов, способных в некоторых случаях автоматизировать обнаружение и измерение годичных колец. Эти инструменты включают как коммерческое программное обеспечение (напр., функция автоматического распознавания колец в программе CooRecorder), так и авторские узкоспециализированные программы (SigmaScan, measuRing и т.д.), разработанные исследовательскими группами с использованием инструментов и языков программирования с открытым исходным кодом [Hietz, 2011; Lara, Bravo, Sierra, 2015; Maxwell, Larsson, 2021]. Тем не менее применение данного программного обеспечения по-прежнему требует значительного взаимодействия с пользователем. Кроме того, точность этого программного обеспечения часто ограничивается образцами древесины определенного анатомического типа, подготовленными с использованием определенных процедур (напр., заполнения мелом или шлифования). В противном случае программа часто не может обнаружить границы годичных колец, даже если они явно видны.
Большинство существующих подходов к обнаружению краевых сегментов (границ) годичных колец по-прежнему основано на базовых методах обработки изображений. В них используются вручную заданные функции: специальный набор дескрипторов, полученных на основе анатомических характеристик и внешнего вида годичных колец. К ним относятся: расположение сердцевины [Borianne, Pernaudat, Subsol, 2011], ширина годичных колец [Wang et al., 2010, Zhou et al., 2012], оптическая плотность ранней и поздней древесины [Lara, Bravo, Sierra, 2015; Sioma, Socha, 2016] и некоторые другие характеристики. Такой способ выбора признаков всегда сомнителен, поскольку годичные кольца различаются в зависимости от типа и породы древесины. Даже в случае одной породы деревьев внешний вид годичных колец может существенно различаться у разных образцов, причем порой даже у образцов, взятых с одного и того же ствола дерева. В результате точность и применимость существующих методов существенно ограничена.
Стандартные (т.е. основанные на производных изображениях) детекторы границ являются ядром многих алгоритмов обнаружения границ годичных колец деревьев. В частности, для распознавания границ годичных колец наиболее активно применяются: детектор границ Кэнни, Собеля, Превитта и Робертса [Cerda, Hitschfeld-Kahler, Mery, 2007; Entacher, Planitzer, Uhl, 2007]. Данные алгоритмы имеют ряд недостатков (напр., чувствительность к шуму, низкая точность в случае малоконтраст- ных краев) и, т.о., часто дают низкую точность в распознавании границы годичных колец. Поэтому после этапа обнаружения краевых сегментов требуется их связывание с другими сегментами, принадлежащими одному древесному кольцу. Для этого применяются более сложные подходы. Например, в работе Х.Дж. Вана и др. для получения точного количества границ годичных колец использовалась обработка линейного расширения (LEP). В подходе LEP сначала подсчитывается количество пикселей заданной яркости в векторе пикселей. Затем, если это число больше или равно заданному порогу, обнаруживается край [Wang et al., 2010]. В 2018 г. в работе А. Фабиянски и др. был предложен подход к автоматическому обнаружению годичных колец, основанный на ручном отборе признаков [Fabijanska et al., 2017]. Идея метода заключалась в том, чтобы поместить сегменты линий в локальные пики градиента, представляющие границы годичных колец. Такой подход практически безукоризнен в случае с хвойной древесиной, где границы годичных колец проявляются в виде четких тонких линий на контрастном фоне. В случае с рассеянососудистой древесиной результаты все еще были достаточно хорошими. Однако в случае древесины лиственных пород метод столкнулся со значительными проблемами и не смог обнаружить около 50 % годичных колец. Аналогичное наблюдение было сделано в работе С.Л. Мэйс и др., которая показала, что ограниченная точность на древесине лиственных пород также характерна и для других существующих способов автоматического обнаружения годичных колец [Maes et al., 2017]. Несмотря на то, что описанные в этих работах алгоритмы в некоторых случаях показывали достаточно большой потенциал (вплоть до 99 % эффективности для хвойных пород деревьев), их низкая точность в анализе других типов древесины ставила перед исследователями совершенно новую проблему, решить которую существующими на тот момент инструментами не представлялось возможным.
Применение сверточных нейронных сетей (CNN) в обнаружении границ древесных колец
Недавние разработки в области машинного обучения все больше доказывают, что ручной выбор признаков может быть успешно заменен автоматическим. В нескольких зарубежных работах стали успешно применять сверточные нейронные сети (далее – CNN) в идентификации, распознавании и обучении признаков, в чем они продемонстрировали довольно высокую производительность [Fabiyanska et al., 2017]. Более того, поскольку CNN способны идентифицировать функции, недоступные человеческому восприятию, в некоторых приложениях изученные функции позволяют превзойти человеческую точность. Поэтому в новейших исследованиях CNN применяют для автоматической идентификации и изучения особенностей, связанных с границами годичных колец в кольцесосудистой древесине, а затем их использовании для разграничения годичных колец на изображениях сердцевины древесины. При всем этом и обучение сети, и обнаружение годичных колец выполняются без взаимодействия с пользователем.
Данный, отно сительно новый подход к обнаружению годичных колец был протестирован в исследовании 2017 г. [Fabijanska et al., 2017] на ядровой древесине 12 пород деревьев, представляющих каждый из трех основных типов. Примененный метод очень хорошо себя зарекомендовал для хвойных пород деревьев. Относительно хорошие результаты были получены и для рассеянососудистых пород. Результаты для двух пород с кольцесосудистым типом строения древесины (дуб и ясень) оказались неудовлетворительными, т.к. по результатам было выявлено лишь ок. 50 % древесно-кольцевых границ. Авторы пришли к выводу, что в большей степени это связано с особенностями границы годичных колец в этих породах древесины, определяемыми рядом относительно крупных округлых пор.
Полученные в данной работе результаты заставили авторов данного исследования искать другой подход, который хорошо работал бы для кольцесосудистой древесины. В связи с чем в 2018 г. авторами из того же коллектива было представлено исследование [Fabijanska, Danek, 2018], в котором они успешно применили CNN для обнаружения границ годичных колец в древесных ядрах, представляющих кольцесосудистый тип древесины. Анализ в нем проводился уже на трех породах деревьев, представляющих данный тип анатомического строения: дуб ( Quercus sp.), ясень обыкновенный ( Fraxinus excelsior L.) и вяз ( Ulmus sp.). Всего в этом исследовании использовался набор данных из 75 различных изображений кернов древесины (33 дуба, 31 ясеня и 11 вяза), содержащий в общей сложности 5 373 годичных кольца. Пространственное разрешение изображений варьировалось от 2 281 × 172 пикселей до 13 975 × 172 пикселей. Изображения представляли собой цветные изображения RGB, хранящиеся в файлах png. Для обучения нейронной сети использовались участки изображений размером 128 × 128 пикселей. В общей сложности было использовано 80 000 участков при условии, что из каждой обучающей части изображения было выбрано равное количество участков. Части изображений были получены путем разделения исходных изображений (полос) на непересекающиеся тайлы размером 600 × 172 пикселя. 80 % участков изображений использовались для обучения, а оставшиеся 20 % – для проверки. К обучающей выборке не применялись методы искусственного увеличения данных.
Наилучшие показатели были отмечены у ясеня обыкновенного (97 % точность в выявлении границ годичных колец), а наименьшая частота выявления годичных колец (92 %) – у вяза. Эти результаты, по-видимому, связаны с размером обучающих баз данных, использованных для каждой рассматриваемой породы деревьев. Тем не менее использованный авторами подход хорошо идентифицирует границы колец у кольцесосудистых пород деревьев.
В целом предложенный авторами подход позволяет успешно обнаруживать древесно-кольцевые границы разной ширины, структуры и ориентации, достигая конечной степени обнаружения древеснокольцевых границ на уровне более 95 %. Ключевым преимуществом метода является то, что полученные границы годичных колец точно совпадают с реальными и требуют лишь ограниченного количества ручных исправлений, которые требуются в основном вокруг сердцевины, где границы годичных колец слабые и имеют различный наклон и ориентацию.
Заключение
Разработка полностью автоматического, универсального метода определения границ годичных колец представляет собой сложную задачу, связанную с разнообразием типов анатомических структур разных видов деревьев. Глаз опытного специалиста, вооруженный микроскопом, по-прежнему остается наиболее точным способом исследования годичных колец. Однако такой подход чреват человеческим фактором и требует много времени, что может значительно растянуть процесс анализа, особенно в случае крупномасштабных исследований.
Поиск надежного и универсального метода автоматического определения годичных колец ведется уже несколько десятилетий (с середины 90-х гг.). С тех пор проблема автоматического обнаружения годичных колец рассматривалась несколькими авторами. Однако до настоящего времени проблема не решена комплексно. Одним из возможных способов решения проблемы автоматизации измерений является внедрение в повседневную практику CNN, анализирующих изображения практически автономно, без настройки каких-либо дополнительных параметров. Кроме того, их применение не требует априорных знаний о внешнем виде границ годичных колец, что делает метод универсальным для любой породы древесины. Единственным их недостатком является тот факт, что обучение CNN занимает довольно много времени. Однако следует помнить, что данный процесс необходимо проводить только один раз. Обнаружение границ годичных колец обученной сетью происходит довольно быстро (в описанном выше исследовании на каждый образец керна древесины уходило в среднем менее одной секунды, что несомненно несравнимо быстрее, чем обнаружение границ годичных колец вручную или полуавтоматическим способом).
Работа выполнена в рамках проекта НИР ИАЭТ СО РАН № FWZG-2022-0010 «Палеоэкология человека и реконструкция природных условий Евразии в четвертичном периоде».
Список литературы Проблема автоматизации дендрохронологических измерений: современные подходы к решению
- Гольдберг Е.Л., Купер К.Э., Слюсаренко И.Ю. Предварительные результаты использовния метода вычислительной рентгеновской томографии для анализа археологических деревянных изделий // Проблемы археологии, этнографии, антропологии Сибири и сопредельных территорий. - Новосибирск: Изд-во ИАЭТ СО РАН, 2010. - Т. XVI. - С. 176-180. EDN: OXDXLF
- Карпухин А. А. Дендрохронология в археологии: методические аспекты // Междисциплинарная интеграция в археологии (по мат-лам лекций для аспирантов и молодых сотрудников). - М.: Изд-во ИА РАН, 2016. - С. 52-68. EDN: ZFOCPX
- Мыглан В. С., Агатова А.Р, Непоп РК., Тайник А.В., Филатова М. О., Баринов В.В. Новый подход к изучению древесных углей из археологических памятников на примере металлургических печей Юго-Восточного Алтая // Археология, этнография и антропология Евразии. - 2023. -№ 2. - С. 74-84. DOI: 10.17746/1563-0102.2023.51.2.074-084 EDN: WMNFNL
- Мыглан В.С., Жарников З.Ю., Сидорова М. О., Баринов В.В., Тайник А.В. Применение метода blue intensity для датирования памятников деревянного зодчества Сибири // Археология, этнография и антропология Евразии. - 2018. -№ 4. - С. 109-113. DOI: 10.17746/1563-0102.2018.46.4.109-113 EDN: YRPXBB
- Полосьмак Н.В. Стерегущие золото грифы. - Новосибирск: Наука, 1994. - 125 с.