Изучение матстатистики студентами-геологами: необходимый минимум
Автор: Ткачев Ю.А.
Журнал: Вестник геонаук @vestnik-geo
Рубрика: Научные статьи
Статья в выпуске: 11 (239), 2014 года.
Бесплатный доступ
Дано обоснование наиболее важных для студентов-геологов тем по теории вероятностей и математической статистике. Проведен анализ фактического преподавания математических дисциплин, который показал полное неиспользование их в геологии и, соответственно, отсутствие у большинства студентов существенных остаточных знаний (по данным тестирования). Обращено внимание на правильный выбор рекомендуемых для изучения и использования программных комплексов, тесно связанных с наиболее вероятными областями деятельности выпускников-геологов. Актуальность статьи заключается в обосновании выбора наиболее важных разделов математической статистики, знание которых требуется будущим геологам в практической работе и научных исследованиях.
Вузовское образование, математическая статистика, геология, программные комплексы, проверка статистических гипотез в геологии
Короткий адрес: https://sciup.org/149128612
IDR: 149128612
Текст научной статьи Изучение матстатистики студентами-геологами: необходимый минимум
Геологические процессы происходят под влиянием многочисленных причин, которые мы не в состоянии учесть в совокупности. Геологические объекты характеризуются признаками, которые невозможно предсказать точно. По этой причине геолого-математические модели должны включать, прямо или косвенно, вероятностные параметры. Однако выводы по результатам геологических исследований до сих пор формулируются как детерминистские, в лучшем случае сопровождаемые оговорками типа «вероятно», «по всей видимости», «не исключено», «по нашему мнению» и т. д. Эти оговорки не заменяют вычисленных оценок степени надежности выводов .
Отчеты, статьи изобилуют выводами, а диссертации — защищаемыми положениями — либо неточными, либо вовсе ошибочными, «подтвержденными» лишь общими рассуждениями без проведения проверки четко сформулированных статистических гипотез . В итоге среди декларированных наблюдается большой процент ошибочных «достижений», информационного мусора.
Такое положение наблюдается во всех естественных науках: биологии, лесоведении, медицине, сельскохозяйственных науках и др., но геология находится в самом худшем положении. Если в медицине или фармакологии новые методы лечения или раз работанные лекарства до тех пор не будут допущены к употреблению, пока с помощью проверки статистических гипотез об их полезности и безопасности не будет получен положительный вывод с высоким уровнем значимости , или если в семеноводстве новый сорт не будет рекомендован к возделыванию после такой же проверки, то в геологии присутствует сколько угодно выводов и рекомендаций сомнительной надежности.
Существует по крайней мере три причины такого положения:
-
1. Геология охватывает очень широкий круг природных явлений, содержащих много неучтенных причин их появления.
-
2. В геологии мало выработанных требований на уровне ГОСТов, регламентирующих геологические исследования и обработку результатов, исключая, может быть, подсчет запасов и геолого-экономическую оценку месторождений.
-
3. В геологию идут преимущественно романтики, для которых дым костра и гитара важнее математики. Впрочем, здесь причина может заключаться в более слабых требованиях на вступительных экзаменах по математике.
К этому можно добавить местную, касающуюся лично нас, студентов и преподавателей, причину: 30 часов на требующуюся геологу каждодневно употребляемую математическую статистику против 550 часов на абстрактную высшую математику, применить которую едва ли случается хоть раз в будущей геологической деятельности.
Рассмотрим кратко геологические темы, в которых требуется знание математической статистики, в частности методы проверки статистических гипотез.
Представление результатов анализов и измерений
Форма представления данных должна соответствовать фактической погрешности оценки того объекта, который оценивается (анализируется, измеряется).
Если данные представляют собой единичную пробу, проанализированную в лаборатории на несколько компонентов, то необходимо узнать у аналитиков погрешность анализа на каждый компонент, которая измеряется средним квадратическим отклонением анализа (сигма, о ) в вариантах воспроизводимости и сходимости . Сигма должна быть округлена до двух значащих цифр (в десятеричной системе), а результат округлен так, чтобы номер крайнего правого разряда результата совпадал с номером крайнего правого разряда сигмы, например: 4.31 ± ± 0.25 мм, что означает: измеряемый объект имеет длину (ширину, толщину) 4.31 мм со средней квадратической погрешностью четверть миллиметра (т. е. измеряется не обычной линейкой, а чем-то более точным).
Другой пример:
Au = 1.53 ± 0.11 г/т = 0.00000153± ± 0.00000011 %.
Весьма желательно узнать в аналитической лаборатории или исследовать самостоятельно и указать, каков закон распределения погрешностей анализа (измерения). Обычно он гауссовский (нормальный, N) реже — логнормальный (LN). Без этих данных ваши данные подобны образцам-со-бакитам, годным только для мощения дорожек на дачах. Верхом метрологической безграмотности являются нередко встречающиеся случаи представления результатов с 7—8, а иногда и с 12—15 цифрами, какими они берутся из компьютера после какой-либо обработки.
Свертка информации, средние, дисперсии, меры зависимости
Если данные включают совокупность проанализированных проб, характеризующих какое-либо явление или объект, то они представляют непреходящую ценность и должны приводиться в отчетных и публикуемых документах все до единого. В добавление к требованиям по представлению отдельных результатов здесь необходимо обобщение и «уплотнение» результатов, нужное для придания или увеличения их наглядности, но главным образом для решения специальных задач. Необходимы расчет среднего по объекту, расчет среднего квадратического отклонения по объекту , установление закона природного распределения изучаемых величин по объекту (не путать с законом распределения погрешностей), проверка гипотезы однородности совокупности и в случае неоднородности устранение сильно отклоняющихся из нее значений. Далее, как правило, проводится корреляционно-регрессионный анализ , заключающийся в расчете линейных коэффициентов корреляции и уравнений регрессии между переменными и в проверке гипотезы их значимости. В более сложных случаях может потребоваться факторный анализ , заключающийся в переходе от наблюденных величин к меньшему числу неких безымянных факторов , с помощью которых объясняются наблюдаемые корреляционные зависимости. Если корреляционные зависимости не укладываются в линейную схему, проводится анализ нелинейных корреляционных отношений . Корреляционный анализ проводится между каждой парой признаков (расчет парных коэффициентов корреляции) для установления прочности связи между признаками ( R-модификация корреляционного и факторного анализов ) и для установления степени близости по составу между пробами, рассматриваемыми в качестве объектов (Q-модификация).
Зависимость может быть установлена не только между числовыми ( количественными ), но и между так называемыми номинативными (назывательными) признаками , например: красный, синий, голубой или тонко-, средне- и грубослоистый, или валун-ник, конгломерат, гравелит, песчаник, алеврит. Однако в геологических работах в редчайших случаях можно встретить разработанный специально для этих целей известный метод сопряженности признаков .
Наилучший способ придания наглядности — исследование графиков: гистограмм, кривых распределения, точечных диаграмм зависимостей .
Сходство и различие признаков и объектов
Можно утверждать, что в геологии на каждом шагу возникают задачи сравнения объектов по какому-нибудь признаку с получением выводов типа больше — меньше — равно . Имеется целый ряд статистических гипотез, дающих строгий ответ на эти вопросы, гипотез, базирующихся на многочисленных критериях (Стьюдента, Фишера и др.). Они мало знакомы геологам, которые заменяют их оценками на глазок и свято верят, что если х хоть в десятом разряде больше у , то это так и есть независимо от степени изменчивости сравниваемых объектов каждого в отдельности.
Сравнению могут подвергаться не только средние значения признаков, но и их дисперсии , асимметрия распределения и его эксцесс , без которых не может быть составлена объективная количественная модель явления. Разработаны методы сравнений по комплексу признаков в их взаимосвязи с использованием ковариационных матриц (коэффициент расового сходства, обобщенное расстояние Махала-нобиса, хи-квадрат и др.).
В геологии подавляющее большинство данных, как количественных, так и наблюдательных , являются либо координатно-зависимыми, либо топологическими , описывающими взаимное расположение объектов, типа над, под, около, внутри, пересекаясь , вокруг . Типичным примером может служить анализ последовательности напластования литотипов в литологии. Существуют методы проверки гипотез о наличии цикличности в последовательности или её отсутствии и об определенном строении цикла, основанные на анализе цепей Маркова .
Картирование значений признаков
Многие геологические и геофизические задачи состоят в картировании количественных признаков, и множество компьютерных программ используются для этой цели. В зависимости от свойств картируемых признаков в них используются разнообразные методы: тренды, аппроксимация различными функциями, сплайны ( бикубические и натуральные ), крайгинг ( кригинг ) — метод геостатистики и т. д. Владеть всеми этими методами сразу нет необходимости, но геолог должен знать свойства получаемых поверхностей и решать, совместимы ли они со свойствами картируемых признаков.
Анализ пространственного расположения объектов
Особую область математической статистики представляет комплексный анализ расположения в пространстве геологических объектов, прежде всего точечных. Содержательная сторона этого вопроса изучается много десятков и сотен лет различными разделами геологии. Изучение же формальной логико-математической стороны сильно отстает. До сих пор мы не можем доказательно, на заданном уровне значимости утверждать, действительно ли наблюдаемое расположение объектов подчиняется предполагаемой закономерности. Эта область представляет собой сплошную целину. Она чрезвычайно важна для анализа металлогени-ческих, геохимических карт , карт прогноза полезных ископаемых . Главными задачами здесь являются установление меры упорядоченности расположения, выявление тенденций к равномерному рассеиванию объектов вплоть до регулярного или тенденции к группировке , установление размеров, формы и расположения групп . Эта задача тесно связана с давно, но не очень успешно развивающейся междисциплинарной проблемой кластеризации групп объектов, а также с проблемой пространственной коррелированности друг с другом объектов разных типов . Критерии проверки гипотез в этой области находятся в стадии разработки. По существу, здесь пока используются только критерии размещения точек по равным ячейкам на основе закона Пуассона.
Интерпретация «процентных» величин Специальной и практически очень важной темой является обработка и интерпретация процентных данных, т. е.
данных о составах. Более века назад было установлено, что корреляция между компонентами проб, выраженная в процентах (от суммы в 100 %) является несостоятельной, ложной. В дальнейшем выяснилось, что и другие характеристики состава (средние, дисперсии, функции распределения, их асимметрия и эксцесс) в системе процентных величин ложны или сомнительны. Поэтому многие выводы, сделанные в отношении процентных величин, также либо неточны, либо ошибочны и требуют пересмотра. Актуальной задачей является предупреждение дальнейших ошибок в этой области. Простой пример: распределение содержаний малых элементов подозрительно часто обнаруживает правую асимметричность (как в логнормальном распределении), и для объяснения этого факта выдвинуто несколько моделей, тогда как эта асимметричность является всего-навсего следствием процентного пересчета. Напротив, распределения породообразующих элементов обнаруживают левую асимметрию, которую никак не могли объяснить; но и эта асимметрия всего лишь следствие процентного пересчета.
Другой пример. Два преобладающих компонента пробы почти всегда оказываются в отрицательной корреляционной зависимости (больше одного — значит, меньше другого). Если удалять из проб все другие компоненты, то коэффициент корреляции между преобладающими (допустим, это Mn и Fe) неизбежно становится равным — 1 (минус единице). На этот счет выдвигались совершенно ложные концепции о якобы резком изменении геохимических свойств и, соответственно, изменении корреляции этих элементов на противоположную, когда их содержания велики. С такими и им подобными артефактами геологи должны быть знакомы, чтобы не попасть в ловушку.
Теория информации — альтернатива математической статистики?
В рамках означенной дисциплины (курс статистических методов в геологии с упором на проверку статистических геологических гипотез) не обойтись без краткой характеристики теории информации. В последнее время все чаще наблюдаются попытки решать задачи геологии статистического характера с помощью информационных мер. Эти попытки основаны на концепции, что в природе взаимосвязь между явлениями (объектами, процессами) осуществляется с помощью об- мена между ними информацией. На первый взгляд эта идея кажется вполне здравой, поскольку количество информации можно измерять, а количество требующейся информации можно контролировать. Но из этого отнюдь не следует, что информационные методы подходят для изучения природы лучше, чем методы математической статистики. Параллельно существующим выстраиваются другия физика и химия, в которых вместо полей, сил, частиц действуют «излучатели» и «приемники» сигналов — носителей информации. На эту тему появилось много публикаций, в которых результаты статистических исследований переиз-лагаются в терминах теории информации. И хотя иногда получаются эквивалентные результаты, но в целом эта концепция глубоко ошибочна.
В природе взаимодействие между её частями-объектами осуществляется с помощью сил, а силы порождаются свойствами различных физических полей , которыми заполнено пространство Вселенной. Физики на фундаментальном уровне успешно изучают эти свойства и совершенно не нуждаются в идее об обмене информацией между объектами. В терминах философии информация есть понятие гностическое, а не оптическое , ибо в Природе без человека никакой информации нет. Понятие информации возникло только тогда, когда у людей возникла необходимость передавать друг другу сведения о силах и других атрибутах природы.
Рассмотрим следующий пример. Излюбленный вопрос, которым задаются приверженцы информационного подхода: какое количество информации заключается в данном разрезе осадочной породы. Ответ на этот вопрос зависит, главным образом, увы, не от свойств разреза, а от установок исследователя. Он должен определить, сколько литотипов следует различать в разрезе, допустим, пять или двадцать пять, какую необходимо выбрать минимальную мощность прослоя для выделения его в качестве самостоятельного литотипа, какое количество компонентов состава следует учитывать (например, 10 компонентов силикатного анализа или же 40—50 компонентов эмиссионного спектрального анализа), с какой точностью и т. д. и т. п. В зависимости от выбранных установок количество информации в описанном разрезе будет изменяться в сотни и тысячи раз. Нужны ли эти сведения и для чего? Конечно, нужны — но только для сугубо технической надобности: чтобы предусмотреть необ- ходимый объем памяти компьютера или пропускную способность каналов связи по формулам Шеннона.
Но статистическое исследование преследует иные цели, его задача — выяснить, надежно ли идентифицированы литотипы, с какой точностью оценены мощности литотипов, каков закон распределения содержаний того или иного компонента состава, их средние значения и степень изменчивости — средние квадратические отклонения, имеются ли зависимости между признаками, каковы многие другие параметры из арсенала математической статистики.
О теории размытых (нечетких) множеств
Другая модная новация, о которой полезно знать, — так называемая теория размытых множеств . В классической теории Георга Кантора множества состоят из элементов , принадлежность которых к данному множеству определяется правилом , некоторым условием . Все вводимые в рассмотрение множества строго определены, а их элементы четко зафиксированы необходимыми и достаточными условиями. Допустим, «красный». Как определить, «красный» ли это элемент, в теории множеств не рассматривается — это уже задано заранее.
Однако геологам давно знакома ситуация, когда условие принадлежности к множеству , например к множеству нефтеносных антиклинальных структур, не может быть установлено надежно . Существуют методы проверки статистических гипотез принадлежности данного объекта к некоторому классу объектов, с помощью которых можно рассчитать ошибку принадлежности данного объекта к данному множеству. С позиций классической теории множеств они могут содержать элементы, ошибочно к ним отнесенные, и эта ошибка измеряется вероятностью, что элемент на самом деле «не свой».
В теории размытых (нечетких, fuzzy) множеств каждому элементу изначально приписывается вероятность его принадлежности к этому множеству. Для ее расчета приходится в конце концов использовать те же методы, что и прежде, и получать те же результаты, что и в прежних методах расчета ошибок классификации. Однако геологи, соблазненные модной теорией, якобы дающей простые решения, связывают вероятность принадлежности лишь со значением какого-либо параметра — монотонной функцией от него. Дело в том, что в теории размытых множеств нет условия принадлежности, а есть эмпирическая функция принадлежности, оцениваемая по частотам встречаемости. Предполагается также, что по мере увеличения степени изученности элемента функция его принадлежности изменяется в меньшую или большую сторону. Основная сложность оценки вероятности принадлежности данного объекта к искомому множеству заключается в корректном использовании нескольких параметров с различной степенью коррелированности между собой, тогда как обычные методы математической статистики позволяют это сделать без проблем.
О геостатистике
Наконец, следует рассмотреть сравнительно новую отрасль математической статистики — геостатистику , созданную в основном трудами Ж. Матерона по мотивам его предшественника Д. Крайга, с которыми советских геологов впервые познакомил один из основателей количественной оценки запасов месторождений урана в СССР Ю. В. Рощин, — своими переводами с французского и собственными оригинальными трудами.
Геостатистика — это математическая статистика пространственных величин , т. е. величин, привязанных к координатам проб. Основным результатом геостатистической обработки является карта изучаемого признака, в основном карта содержаний и карта мощностей. Картирование содержит две творческие проблемы: 1) выбор методов интерполирования; 2) сглаживание. Простейшим методом интерполирования и сглаживания одновременно является известный всем геологам метод скользящего окна. В нем значение в центре окна получают как среднее арифметическое из значений в точках, попавших в окно. По существу это вырожденный метод среднего взвешенного , когда все весовые коэффициенты для точек окна равны. Прекрасные результаты дает интерполирование с весовыми коэффициентами, обратно пропорциональными расстоянию до точек (в плоскости) или квадрату расстояний (в объеме). Они реализуют общий принцип природы — равномерного ослабления влияния соседних точек по мере их удаления от точки расчета.
В геостатистике реализуется универсальный, наиболее сложный мате-роновский метод интерполирования — крайгинг (kriging) * . В нем оптимальное содержание X вычисляется как средневзвешенное величин х. (содержаний в n пробах):
х = ) а, • х, i=i ’ где ai —весовые коэффициенты, полученные из условий несмещенности:
Е^=1
/=1
и минимальной погрешности оценки содержания о? = f(at, ахх ) —> min , где °XjXj — ковариация содержаний в точках i и j , которая снимается с графика вариограммы (или автокорреляционной функции).
Чтобы вычислить весовые коэффициенты, требуется решить систему уравнений из n переменных (где n — число проб) — столько раз, во сколько точек требуется интерполировать. Во всех случаях интерполяции во избежание систематического смещения оценок сумма весовых коэффициентов должна быть равна единице. Но прежде необходимо выбрать модель вариограммы, рассчитать её для каждого направления, на котором могут встретиться точки-пробы от точки интерполяции, привести результаты к единой геометрической базе по форме и размерам и выполнить ещё целый ряд головоломных процедур.
Если все ковариации равны нулю, то остаётся одно условие:
” 1
^ а,. = 1, т. е. as = const- — ,
/=i п что превращает геостатистическое средневзвешенное в обычное среднеарифметическое.
Ропь пакетов компьютерных программ по математической статистике и геостатистике
Мы живем в удивительный век. Почти в каждой семье есть компьютеры. Дети с младых ногтей играют на них в сложные игры. Все типовые задачи запрограммированы и собраны в пакеты. Пакеты снабжены инструкциями. Интерфейсы, обеспечивающие контакт человека с компьютером, выполнены стандартно, по определенным традициям. С помощью многочисленных «окон» и много - уровневых меню каждый шаг подсказывается, каждая ошибка предупреждается или исправляется. Достаточно одного-двух показов — и вы овладели основами программ. Дальнейшие особенности постигаются каждым по мере необходимости.
Спрашивается, нужно ли изучать в этих условиях теоретические основы метода, которым вы хотели бы вос пользоваться? Или достаточно уметь находить нужные кнопки и получать результат? Ответ для получающих высшее образование очевиден. Необходимо знать метод, уметь реализовать его вручную на самом простом примере, а уж затем выбрать нужный пакет программ и пользоваться им. Простой опрос студентов, изучающих курс «Введение в майкромайн», на кото рый отпущено больше часов, чем на всю математическую статистику, показал, что они не имеют представления, что в нем делается и для чего. Между тем ранее они изучали курс опробования и подсчета запасов месторождений, а нынешнее «Введение...» никак с ним не связано. Курс вставлен в учебную программу без обсуждения на кафедре.
Приложение 1 *
Пакеты |
< Q СО |
со |
со СО |
СО СО Рн со |
а- го О СО Щ |
< н и м |
Версия |
4.7 |
4.0 |
5.0 |
4.0 |
1.2 |
2.2 |
Объем пакета [Мбайт] |
0.44 |
2.3 |
6.5 |
7.5 |
1.6 |
1.2 |
Деловая графика |
||||||
X-Y -зависимости |
2 |
1 |
1 |
1 |
1 |
1 |
X-Y-Z-зависимость |
1 |
2 |
2 |
- |
- |
- |
Коммулятивная диаграмма |
- |
1 |
- |
- |
- |
- |
Диаграмма рассеяния |
1 |
1 |
1 |
1 |
1 |
- |
Столбиковая диаграмма |
1 |
2 |
2 |
2 |
- |
- |
Башневая диаграмма |
2 |
1 |
1 |
1 |
- |
- |
Круговая диаграмма |
1 |
1 |
1 |
1 |
- |
- |
«Ящик с усами» |
1 |
1 |
1 |
- |
- |
- |
«Звездная диаграмма» |
- |
1 |
- |
- |
- |
- |
Трехмерная поверхность |
1 |
1 |
1 |
- |
- |
- |
Распределение |
1 |
- |
1 |
- |
- |
- |
Сплайны |
2 |
1 |
- |
- |
- |
- |
Суммарный балл |
13 |
13 |
11 |
6 |
2 |
1 |
Параметрические тесты |
||||||
Описательная статистика |
15 |
11 |
14 |
13 |
6 |
9 |
Критерии Стьюдента, Фишера |
3 |
2 |
2 |
2 |
- |
- |
Гистограмма+нормальность |
1 |
1 |
1 |
1 |
- |
1 |
Распределения |
13 |
18 |
- |
4 |
- |
- |
Согласие частот |
1 |
1 |
- |
- |
- |
- |
Последовательный анализ |
1 |
- |
- |
- |
- |
- |
Суммарный балл |
34 |
33 |
17 |
20 |
6 |
10 |
Непараметрические тесты |
||||||
Хи-квадрат |
2 |
2 |
1 |
1 |
1 |
1 |
Биномиальный |
- |
1 |
- |
1 |
1 |
- |
Знаков |
1 |
1 |
1 |
1 |
1 |
- |
Серий |
- |
1 |
1 |
1 |
- |
- |
Вилкоксона |
2 |
2 |
1 |
2 |
- |
- |
Кокрена |
- |
- |
- |
1 |
- |
- |
Колмогорова - Смирнова |
2 |
2 |
1 |
1 |
- |
1 |
Ван дер Вардена |
1 |
- |
- |
- |
- |
- |
Клотца |
1 |
- |
- |
- |
- |
- |
Анасри-Бредли |
1 |
- |
- |
- |
- |
- |
Мозеса |
- |
- |
- |
1 |
- |
- |
Медианный |
- |
- |
- |
1 |
- |
- |
Корреляция Кендалла |
1 |
1 |
- |
1 |
1 |
- |
Корреляция Спирмана |
1 |
1 |
1 |
1 |
1 |
- |
Суммарный балл |
12 |
11 |
6 |
12 |
5 |
2 |
Катего! |
жальный анализ |
|||||
Кросстабуляция |
1 |
1 |
1 |
1 |
- |
- |
Хи-квадрат оценка |
1 |
1 |
1 |
1 |
- |
- |
Коэффициенты согласия |
8 |
8 |
8 |
- |
- |
- |
Лог-линейный анализ |
- |
1 |
- |
1 |
- |
- |
Суммарный балл |
10 |
11 |
10 |
3 |
0 |
0 |
Приложение 2
Пакеты программ по геостатистике **
Для решения специфических горно-геологических задач с применением геостатистики существует более 1000 разнообразных компьютерных программ.
Общедоступные программы за символическую плату распространяются Ассоциацией COGS (Computer oriented Geological Society, США).
Недорогие программы распространяет компания Goldeu Software (США) — Surfer и Grapher, первый в России геостатистический пакет GST, разработанный В. А. Мальце -вым.
Большие интегрированные (дорогие) пакеты — ДАТАМАЙН (русифицированная) и ГАЙД .
Более современные пакеты гео-статистических программ:
GSLIB — набор программ на фортране с открытыми (т. е. бесплатными!) кодами в книге Deutsch C. V., Journel A. G. GSLIB: Geostatical Software Library and Users Guide. N. 4.: Oxford Univ. A. Press, 1998.369 p. Книга является отличным руководством для пользователей, написана одним из корифеев геостатистики.
SGEMS — оболочка с набором прикладных геостатистических модулей и библиотека для разработчика, изданная и поддерживаемая Центром прогноза нефтяных месторождений (SCRF, SCRF. html) Стэнфордского университета.
VarioWin — интерактивная программа под Windows для анализа и моделирования пространственной корреляционной структуры данных
Продолжение прил. 1 Продолжение прил. 2 GO включая построение модели вариог- Пакеты < < , и р- < н GO GO m О н и S раммы. Распространяется как приложение к книге Pannatier Y. VARIOWIN GO ГО И РЦ рр Software for Spatial Data Analysis. — о S m New York: Springer Verl., 1996. http:// Дисперсионный анализ Однофакторный анализ 1 1 1 1 - - Метод Шеффе 1 1 - - - - «ГеостатОфис» (GSOffice) — на- Двухфакторный анализ 4 1 1 2 - - бор интерактивных программ под Крускала-Уоллиса 1 1 1 1 - - Windows для полного анализа и визу- Джонкхриера 1 - - - - - ализации (2D) пространственных дан- Фридмана 1 1 1 1 - - ных. Пейджа 1 - - - - - Многофакторный анализ 1 1 1 1 - - Gstat — пакет геостатистических Ковариационный анализ Суммарный балл 1 12 1 7 5 6 0 0 программ под различные платформы Конто оль качества (Windows, UNIX, R), разрабатывае- Гистограмма качества 1 - - - - - мый Е. J. Pebesma с 1996 г. в Утрехтс- Диаграмма Парето 1 1 - - - - ком университете. Контрольные карты 6 8 - - - - GeoEAS — один из старейших Суммарный балл 8 9 0 0 0 0 Регрессионный анализ программных пакетов по геостатисти- Простая регрессия 5 5 1 3 2 4 ке, содержащий набор программ для Множественная регрессия 4 3 1 2 3 3 выполнения геостатистической ин- Пошаговая регрессия 8 4 5 7 1 - терполяции (кригинга) с требующей- Ридж- регрессия - 1 - - - - ся для этого предобработкой (варио- Робастная регрессия - - - - 1 - графия) данных и визуализацией. На- Нелинейная регрессия 1 1 1 Суммарный балл 18 13 8 Анализ временных рядов 1 13 1 8 7 ходится в свободном доступе Сглаживание 6 7 8 14 7 5 . Фильтрация 9 Преобразование Бокса-Кокса 1 1 4 - 4 7 1 Геостатистические алгоритмы Автокорреляция 1 1 1 1 1 2 находят применение в различных спе- Кросскорреляция 1 2 2 2 2 2 циализированных программных про- Спектральный 7 2 1 1 2 17 дуктах, таких как геоинформацион- Кросспектральный 9 - - - 4 16 ные системы (ArcView Spatial Модели интервенции - - - - - 4 Analyst™). Фазовое пространство - - - - - 3 Более обширный список компь- Гармонические модели ARIMA-модели Суммарный балл 6 4 2 з 4 2 5 ютерных программ по геостатистике 40 17 18 21 24 64 можно найти на основном сервере по Многомерные методы геостатистике AI-GEOSTAT (GIS, Корреляция/ковариация 1 1 1 1 - - geostatistics, spatial analysis) (http:// Дискриминантный анализ 1 1 - 6 - - . Кластерный анализ 17 9 14 17 - - Факторный анализ Шкалирование 9 11 5 6 6 11 - 1 Рецензенты Каноническая корреляция - 1 - - - - д. г.-м. н. Я. Э. Юдович, Суммарный балл 39 17 27 35 0 1 Т. А. Ситников