Столетие биометрии в России

Бесплатный доступ

Рассмотрена история применения математических методов в биологических исследованиях.

Короткий адрес: https://sciup.org/148197689

IDR: 148197689

Текст научной статьи Столетие биометрии в России

Ботанический институт им. В.Л. Комарова РАН, г. Санкт-Петербург

Рассмотрена история применения математических методов в биологических исследованиях.

"…и я не вижу, почему бы в этом отношении именно биологам должны быть предоставлены особые льготы: напротив, и биологами статистический метод, где это необходимо по ходу работы, должен быть применяем в наиболее утонченной его форме…"

А.Я. Гордягин (1907, с. VI)

Седьмого августа 2003 г. исполняется 100 лет со дня начала биометрических работ в России. Именно 25 июля (по старому стилю) 1903 г. Андрей Яковлевич Гордягин начал свои наблюдения над числом краевых цветков у Chrysanthemum sibiricum (DC) на Ледяной горе около г. Кунгура Пермской губернии, которые он продолжал до 1906 г. Сбор материала производился ежегодно на южном и юго-восточном склонах Ледяной горы в период цветения C. sibiricum c августа по сентябрь. Было исследовано 6783 соцветия. Вскоре он опубликовал в трудах общества естествоиспытателей Казанского университета обстоятельную работу [8], в которой исследовал изменчивость числа краевых цветков и некоторые другие морфометрические показатели. Гордягин сразу заметил, что верхушечное соцветие обыкновенно имеет краевых цветков больше, чем ближайшие головки второго порядка, и установил коррелятивность этих двух показателей. Анализируя распределения числа краевых цветков, он подтверждает правило, подмеченное Людвигом в 1895 г. на C. leucanthemum, совпадения максимумов частоты с числами ряда Фибоначчи, и закладывает традицию обращения к ряду Фибоначчи у коллег, начинающих заниматься поиском количественных закономерностей. В своей статье Гордягин анализирует сезонную и годовую динамику числа краевых цветков, устанавливает превышение средне- го числа краевых цветков в колониях южного склона над средним числом краевых цветков в колониях юго-восточного склона и пытается разрешить альтернативу, сформулированную до него Клебсом в 1903 г.: "…либо замеченные различия вызваны неодинаковостью в условиях жизни на обоих местонахождениях, либо зависят от специфического различия форм, населяющих эти местонахождения" [8, с.13]. После наблюдений 1903 г. Гор-дягин был склонен предполагать существование на юго-восточном склоне особой "числовой" расы C. sibiricum. Но в конце концов он мастерски убеждается в причинной связи пониженного числа краевых цветков "числовой" расы с неблагоприятной жизненной обстановкой юго-восточного склона. Самостоятельный интерес представляет критика Гордягиным центрального примера В. Иоган-сенна со стороны вариационной статистики. В своей работе Гордягин сравнивает средние, вычисляет коэффициенты корреляции и использует критерий согласия Пирсона. Единственное чего он не знает к 1907 г. ‒ это критерия Стьюдента сравнения средних, предложенного в 1904 г., и, соответственно, он не знаком с понятием "уровня значимости". Но тот, кто упрекнет в этом Гордягина, будет сам обязан знать современные математические работы не старше 5 лет и предвидеть их будущее развитие… В годы исследования Гордягина не были еще созданы очень мно- гие статистические методы, и только начинала развиваться теория проверки статистических гипотез. Тем не менее, работа Гор-дягина с C. sibiricum 1903-06 гг. содержала средние, ошибки средних и число произведенных наблюдений. Это позволяет произвести необходимые сравнения, опираясь на развитые к сегодняшнему дню статистические методы анализа данных. Поэтому работа А.Я. Гордягина до сегодняшнего дня выделяется как образец анализа и изложения количественных данных.

Пальму первенства России в привлечении биометрических методов к исследованию биологических проблем у Общества естествоиспытателей Казанского университета по праву может оспаривать Общество естествоиспытателей при Юрьевском университете и Московское математическое общество. В трудах Юрьевского университета в 1906 г. была опубликована статья проф. Г. Колосова с очень многообещающим названием: "Математическая теория эволюции видов по трудам проф. K. Pearson’a" [21]. С нашей стороны было бы завышенным требованием ожидать от Колосова полной характеристики эволюционных и генетических воззрений Ф. Гальтона и К. Пирсона. Изложение биометрических и эволюционных идей этих двух замечательных ученых было дано позже Ю.А. Филипченко [42] в своей книге "Изменчивость и методы ее изучения (основы биологической вариационной статистики)", написанной весной 1918 г. в пустынном Петрограде. Колосов посвятил свою статью главным образом математическим идеям вывода типов кривых распределения Пирсона. В конце своей статьи Колосов привел пример обработки данных Н.И. Кузнецова по числу листьев в мутовке Paris quarifolia .

Еще раньше статьи Г. Колосова в Московском математическом обществе 26 ноября (по старому стилю) 1903 г. был заслушан доклад Л.С. Лахтина о математических идеях Ф. Гальтона и К. Пирсона и возможности применения теории вероятностей к анализу биологических данных, который был опубликован в 1904 г. в Математическом сборнике [23]. Но в статье Лахтина не приводилось каких- либо биологических данных и только указывалось на перспективы применения в биологии теории вероятностей. Поэтому, можно присоединиться к мнению К. Фляксбергера [43] о приоритете А.Я. Гордягина в использовании методов математической статистики в отечественной биологии.

Русские биологи не были пионерами в применении в своих исследованиях вариационной статистики. Первенство, по-види-мому, принадлежит двоюродному брату Ч. Дарвина ‒ Френсису Гальтону и его ближайшему сотруднику ‒ Карлу Пирсону. Именно Гальтон в 1899 г. предложил биологическую дисциплину, использующую методы теории вероятностей и математической статистики именовать "биометрией". К началу проникновения биометрии в Россию [9] в 1899 г. в Германии уже вышло руководство Г. Дун-кера, а в 1904 г. в североамериканских штатах ‒ Давенпорта. Очень большое влияние на осознание необходимости использовать методы биометрии оказала книга 1903 г. В. Иогансенна.

Вскоре по примеру А.Я. Гордягина к биометрическим исследованиям приступили Н. Скалозубов и К. Фляксбергер [37], Р. Регель [31] и В.Н. Сукачев [38]. Уже за год до августовского выстрела в Сараево "…при исследованиях над изменчивостью и наследственностью организмов стало почти невозможным обходиться без математической обработки данных наблюдений" [9]. Поэтому, не было ничего удивительного в том, что А.О. Сапегин уже в самом начале своих знаменитых экспериментов по естественному отбору, которые он мужественно проводил в течение 10 лет, начиная с 1913 г., использовал методы вариационной статистики.

Немногим позже к биометрическим методам обратились зоологи. В 1916 г. вышла работа Ю.А. Филипченко [41], посвященная статистическому различению видов херме-сов. Зоологи, наверное, смогут указать и на свои более ранние биометрические исследования, но, по-видимому, им придется признать первенство ботаника А.Я. Гордягина в деле применения биометрических методов.

События первой мировой войны, пос- ледовавшие за выстрелом в Сараево, надолго задержали в России проникновение вариационной статистики и математических методов в биологические исследования. Тем не менее, в начале 20-х годов, кроме книги Ю.А. Филипченко и очень четкого введения в биометрию А.О. Сапегина [34], в 1922 г. появилось и руководство Г. Левитского "Элементы биометрики". Вслед за Сапегиным В.Н. Сукачев и его ученики в своих экспериментах по борьбе за существование между растениями активно привлекают статистические методы анализа данных.

Проникновение математической статистики в биологию и дальнейшее применение математических методов в биологии обязано не только проблеме изменчивости и наследственности, но и проблемам роста, размножения и развития. Осознание роста и размножения организмов как динамического процесса уже характерно для времени зарождения биометрии. Поэтому, благодаря последней проблеме применение математики в биологии быстро перестало ограничиваться статистическими методами. В одном из первых номеров "Ботанического журнала" Л.Г. Раменский [30], благодаря идеям А.А Еленкина [13], предлагает линейное дифференциальное уравнение для описания роста линейного размера лишайников. Стационарное решение этого уравнения содержало алгебраические соотношения Еленкина. В 1914 г. микробиолог М.А. Егунов [12] на основе серии экспериментов с грибными и бактериальными колониями на агаризированных средах переоткрыл динамическую модель роста Раменского и предложил оригинальный подход математического описания размножения, который и сегодня заслуживает самого внимательного к себе отношения. Работы А.А. Еленкина, Л.Г. Раменского и М.А Егунова не были своевременно замечены.

Только после первой мировой войны, когда в США в 1920 г. Р. Пирлом и Л. Ридом была переоткрыта логистическая модель Фер-хюльста роста численности популяции, наметился большой интерес к динамическим моделям, который поддержали наши исследователи Г.Ф. Гаузе и В.В. Алпатов [7]. Увле- чение логистической моделью привело молодого Гаузе к экспериментальной проверке математических моделей А. Лотки и В. Воль-терра экологических взаимодействий популяций [5]. До сегодняшнего дня слабо осознается методология экспериментальной проверки математических моделей, которая была использована Гаузе в своих работах [6]. В 1980 г. эта методология была блестяще применена Д. Тилманом при экспериментальной проверке модели Н.С. Абросова [1] конкуренции популяций за минеральные ресурсы питания.

К развитию подходов Вольтерра к моделированию экологических взаимодействий видов приступает наш соотечественник, ‒ ученик Вернадского ‒ В.А. Костицын. Именно ему было суждено в 1935 г. предложить первую модель эволюции биосферы [22]. Обобщение вольтерровской модели "хищник-жертва" в 1936 г. предложил и исследовал А.Н. Колмогоров [19]. Даже через несколько десятилетий можно было встретить работы, в которых переоткрывались результаты, полученные А.Н. Колмогоровым в этой статье. В 1937 г. А.Н. Колмогоров, И.Г. Петровский и Н.С. Пискунов [20] доказали существование волнового решения в модели логистического роста численности популяции на бесконечном одномерном ареале. История влияния уравнения Колмогорова-Петровс-кого-Пискунова на различные области естествознания была кратко изложена Ю.М. Свирежевым [35].

Интерес к динамической стороне явлений проявился и в популяционной генетике, которая делала первые шаги благодаря работам Р.А. Фишера, Дж.Б.С. Холдена, С. Райта, С.С. Четверикова [44] и А.О. Сапегина [34]. Попытка вероятностного описания динамики частот генов в популяции впервые была предпринята в 20-х годах в работах Райта и Фишера. Немногим позже Н.П. Дубинин и Д.Д. Ромашев [11], пользуясь дружескими консультациями Колмогорова, рассмотрели первые имитационные модели генетического дрейфа популяций. В дальнейшем под влиянием идей Дубинина, Ромашева и А.А. Малиновского была написана заметка А.Н. Кол- могорова [16], которая привела к понятию ветвящегося случайного процесса. Приятно отметить, что на развитие теории случайных процессов, одного из наиболее крупных достижений математики XX столетия, существенное влияние оказали именно стохастические проблемы популяционной генетики.

Во второй половине ХХ века сначала В. Феллер, а затем А.Н. Колмогоров [18] подняли вопросы обоснования диффузионных уравнений генетического дрейфа, связанные со сходимостью ветвящихся процессов к диффузионным. Круг этих проблем слабо осознается как краеугольный камень в логических основаниях теории нейтральной эволюции [15]. Стохастиче ское описание популяционных генетических процессов не сводиться только к эффекту Хагедоорнов и модели генетического дрейфа, и может составить широчайшее поле деятельности. Это особенно хорошо видно благодаря работам Н.П. Дубинина, Д.Д. Ромашева [10,11,33] и теории стабилизирующего отбора И.И. Шмальгаузена [46].

Вклад отечественных исследователей в развитие математической генетики не ограничился моделями генетического дрейфа. С критикой подхода Р. Фишера, Д. Холдена и С. Райта к описанию динамики частот генов в популяции в 1937 г. выступил В.А. Костицын и предложил свою модель описания динамики частот генотипов в популяции. В отечественной литературе работы В.А. Костицына по популяционной генетике изложены в монографиях [2, 36]. О критике Костицыным фишеровского подхода европейскими и американскими коллегами принято умалчивать, но она была воспринята у нас и привела к разграничению областей применимости различных математических моделей популяционной генетики [4].

Влияние биологических проблем на развитие теории вероятностей и математической статистики не ограничилось только теорией случайных процессов. Именно проблемы систематики развили дискриминантный анализ, и в значительной мере для нужд экспериментальных биологических задач был развит дисперсионный анализ. Но в 1930-50

гг., пожалуй, только А.А. Любищев применял методы дисперсионного и дискриминантного анализа в своей повседневной работе [25, 28]. Можно горько сожалеть, что работа А.Н. Колмогорова [17] по раскрытию смысла дисперсионного анализа Р. Фишера не была своевременно замечена нашими и зарубежными биологами; но она была воспринята [32] и развита математиками [45].

Стремление к точному описанию не ограничилось построением первых динамических моделей. Развивая термодинамические подходы к анализу биологических явлений, Э.С. Бауэр [3] предложил принцип устойчивого неравновесия . Следствием этого принципа является отрицание возможности динамического равновесия живых систем. Представление о динамическом равновесии лежит в основе моделирования биологических систем. Поэтому, согласование современных подходов к моделированию динамических биологических систем с принципом Бауэра ‒ будущая, и, по-видимому, неизбежная задача.

Не смотря на сопротивление проникновению математических методов в биологию [29], мастерские подмены понятий [24] и навязанные дискуссии (август, 1948 г.), течение времени властно заставляло обращаться не только к математической статистике, но и другим самым разнообразным областям математики для решения фундаментальных биологических проблем [14, 39]. Со второй половины 50-х годов благодаря усилиям А.А. Ляпунова, А.И. Берг, Р.Л. Берг, П.В. Терентьева, Л.С. Каминского, П.Ф. Рокицкого, В.Ю Урбаха, Н.А. Плохинского и многих других применение биометрических методов стало, если не обязательным, то, по крайней мере, желательным элементом биологических исследований. Начиная с 60-х годов, внедрение математических методов шло, главным образом, в связи с развитием математического моделирования. И здесь мы видим имена Ю.М. Свирежева, В.П. Пасекова, Н.Н. Моисеева и Б.С. Флейшмана (Москва), Р.А. Полуэктова и В.В. Меншуткина (Ленинград), И.А. Полетаева и В.А. Ратнера (Новосибирск), Р.Г. Хлебопроса, И.А. Терскова и Н.С. Абросова

(Красноярск), А.М. Молчанова и А.Д. Базы-кина (Пущино), А.Б. Горстко (Ростов-на-Дону), А.П. Шапиро (Владивосток), В.И. Беляева (Севастополь), Ю.С. Колесова (Ярославль), Г.С. Розенберга (Уфа, Тольятти). Список коллег можно продолжать и продолжать - пусть не считают себя забытыми те, кто не был упомянут в этом списке. На общественных началах долгие годы действовала комиссия по математической геоботанике Всесоюзного ботанического общества (председатель В.И. Василевич), биометрический семинар под руководством О.А. Калинина и А.Г Барта (ЛГУ), группа "альфа" по теоретической биологии под руководством А.П. Левича (МГУ), семинар по теоретической и математической биологии под председательством Л.Н. Серавина и А.Г. Боголюбова (ЛГУ).

Каковы причины того, что слова А.Я. Гордягина, вынесенные в эпиграф, даже и в наши дни остаются чрезвычайно актуальными. Эти причины лежат в области общенаучной подготовки биологов, частью которой является математическое образование. Традиции преподавания приложений математики к биологии закладывались вначале С.С. Четвериковым (Москва), Ю.А. Филипченко (Ленинград) и А.О. Сапегиным (Харьков), а затем А.А. Малиновским (Одесса), В.В. Алпатовым и Ю.А. Урбахом (Москва), П.Ф. Рокиц-ким (Минск), П.В. Терентьевым, Н.С. Ростовой, Л.С. Каминским и В.И. Василевичем (Ленинград), А.А. Любищевым и В.С. Шустовым (Ульяновск), Б.М. Миркиным (Уфа). К сожалению, проблемы математической и "биометрической" подготовки биологов, о которых писал еще 40 лет назад П.В. Терентьев [40], так и не решены. В наше время вдумчивое и осторожное применение математических методов анализа данных часто неоправданно заменяется компьютерными средствами визуализации, хранения и передачи информации и сопровождается ошибками применения математики в биологии [26,27]. К сожалению, распространено отношение к использованию математической статистики в биологических исследованиях как досадному требованию редакций и ученых советов, а к математической модели или фор- муле - как привлекательному и солидному украшению.

В самом деле, нужна ли математическая статистика в биологических исследованиях? Все познается в сравнении. Измерение - это сравнение с эталоном. Например, измерение любой протяженности, массы и т.д. - это сравнение с эталоном, хранящемся в палате мер и весов в Париже. Составление флористического (или фаунистического) списка - это тоже измерение, так как здесь производится сравнение растений (животных), обитающих в некоторой связной области земной поверхности, с принятой классификацией изучаемой группы видов. В этом контексте работа систематиков - это создание эталонов для сравнения биологических объектов. Здесь мы имеем две сложности. Во-первых, сравнение образцов при создании классификации определенной группы всегда отражает наши представления о классифицируемых видах и разновидностях. Поэтому, биологические классификации, в отличие от эталонов Палаты мер и весов, постоянно изменяются. Во-вторых, мы не умеем оценивать статистическую ошибку определения видовой принадлежности отдельного экземпляра. Создание классификаций с наименьшей статистической ошибкой определения видовой принадлежности может составить некоторый новый класс задач при внедрении математических методов в систематику. Сравнение биологических объектов только с эталонами "Парижской палаты мер и весов" не может сильно нам помочь в их изучении. Хотя без этого сравнения невозможны количественные методы исследования, преимущество которых основано на постоянстве эталонов. Заметим, что именно постоянство эталонов Парижской палаты облегчает оценивание ошибки количественных наблюдений.

Можно только присоединиться к мнению И.И. Шмальгаузена [47, с. 204] о сравнении как первой стадии научного изучения: "Дальше следует изучение связей, зависимостей в распределении или последовательности явлений". Если нет проверки содержательной гипотезы или не предлагается какая-либо концепция, то сравнение объектов по исследуемым показателям только загромоздит журналы наблюдениями. Но коль скоро мы применяем математику для анализа своих данных, то, почему бы, не опереться на ее эвристическую силу при построении теоретической картины явлений. Соглашаясь с эвристической силой математических средств познания, мы приступаем к математическому моделированию, и неизбежно подходим к вопросам соответствия между моделями и наблюдениями. И снова нам необходим инструмент сомнения - математическая статистика. Здесь нас ждут два мало разработанных вопроса. Первый - о соотношении между содержательной гипотезой, которая может быть дедуктивным следствием из математической модели, и нулевой гипотезой, которая стоит в применяемом статистическом критерии. Второй вопрос относится к экспериментальной проверке математической модели. Экспериментальная проверка математических моделей, как правило, отчетливо показывает их методическую ценность. Именно модель указывает на характеристики, которые следует измерить, и часто подсказывает способы их измерения. Тем самым, мы приходим к еще одному способу сравнения.

Краткий исторический очерк применения математики в биологии, по-видимому, показывает, что значительная часть истории отечественной биологии написана языком математики. Придерживаясь биометрической методологии, восходящей к работе А.Я. Гор-дягина (1903-1907 гг.), работы, в которых не оценивались ошибки измерений, не применялись статистические критерии проверки гипотез, и тем самым суждения не подвергались сомнению, мы не можем считать достоверными. Но данная методология научного поиска, несмотря на ее продуктивность, не может быть еще распространена на все области биологических исследований. В частности, теоретико-вероятностное и статистическое обоснование флористических и фаунистических методов исследования - одна из будущих и многообещающих задач.

Статья научная