Использование программы Microsoft Excel в биометрии

Автор: Баяхов Алиби Науханович, Моисейкина Людмила Гучаевна

Журнал: Сетевое научное издание «Международный журнал. Устойчивое развитие: наука и практика» @journal-yrazvitie

Статья в выпуске: 2 (17), 2016 года.

Бесплатный доступ

В статье рассматриваются математические методы в биологических исследованиях при изучении групповых свойств биологических объектов. Дан краткий обзор основных операции с данными в Excel. Описан порядок их применения, проанализированы эффективность и ограниченность этих механизмов. На конкретном примере показаны вычисления параметров вариационного ряда, вычисление коэффициента корреляции.

Жизнь, мера, биометрия

Короткий адрес: https://sciup.org/14122325

IDR: 14122325

Текст научной статьи Использование программы Microsoft Excel в биометрии

Биометрия (от греч. bios – жизнь, metron – мера) – наука о применении математических методов в биологических исследованиях при изучении групповых свойств биологических объектов. Содержанием биометрии является обработка данных наблюдений и экспериментов в биологических исследованиях, а ее аппаратом (методом) – теория вероятностей и математическая статистика.

Запуск программы Excel осуществляется так же, как и запуск других приложений пакета Microsoft Office: с помощью команды Microsoft Excel из меню программы или кнопки с таким же именем, расположенной на панели инструментов Microsoft Office.

После запуска Excel открывается окно, изображенное на рис. 1. Меню и панели инструментов Excel очень похожи на соответствующие элементы окна редактора Microsoft Word.

Рис. 1. Главное окно программы Excel

Основные операции с данными в Excel выполняются на рабочем листе. Рабочий лист разделен на строки и столбцы, которые при пересечении образуют ячейки. В ячейки вводится содержимое таблицы. Рабочий лист состоит из 256 столбцов и 65536 строк.

Строка формул находится под панелями инструментов и предназначена для обработки содержимого ячеек и имеет обозначение f x . Эта строка предназначена для набора формул. Скорость работы с большими таблицами во многом зависит от способа перемещения по рабочему листу. Для перемещения по небольшим диапазонам ячеек достаточно клавиш управления курсором. Чтобы попасть в ту часть таблицы, которая не видна на экране и находится недалеко от видимой области, следует использовать полосы прокрутки. Добиться значительного ускорения при перемещении по рабочему листу можно благодаря специальным комбинациям клавиш. В следующей таблице описаны клавиши и комбинации, предназначенные для перемещения по листам рабочей книги.

Таблица 1. Описание клавиш и комбинации, предназначенные для перемещения по листам рабочей книги

Клавиша

Перемещение

[Ноmе]

В начало текущей строки

[Ctrl+Home]

В ячейку А1

[Ctrl+End]

В последнюю заполненную ячейку таблицы

[↑]

На одну ячейку вверх

[↓]

На одну ячейку вниз

[→]

Ha одну ячейку вправо

Клавиша

Перемещение

[←]

На одну ячейку влево

[Ctrl+↑]

Вверх до первой заполненной ячейки

[Ctrl+↓]

Вниз до первой заполненной ячейки

[Ctrl+→]

Вправо до первой заполненной ячейки

[Ctrl+←]

Влево до первой заполненной ячейки

[Page Up]

Вверх на один экран

[Page Down]

Вниз на один экран

[Alt+Page Up]

Влево на один экран

[Alt+Page Down]

Вправо на один экран

[Ctrl+Page Up]

К следующему листу рабочей книги

[Ctrl+Page Down]

К предыдущему листу рабочей книги

Ввод данных. Ячейки электронной таблицы могут содержать самую разнообразную информацию: текст, числовые значения и формулы. При вводе данных Excel автоматически распознает их тип. Ввод данных выполняется в активной ячейке или в строке формул. Как только и ячейку будет введен хотя бы один символ, ее содержимое отобразится и строке формул. Кроме того, и этой строке помнятся три кнопки для обработки содержимого ячейки.

Ввод данных завершается нажатием клавиши [Enter] или кнопки с изображением галочки в строке формул. Намного удобнее для завершения ввода использовать клавишу управления курсором. В этом случае после ввода можно сместиться и нужном направлении. Отменить ввод данных позволяют клавиша [Esc] и кнопка с крестиком в строке формул. Введенные числовые значения автоматически выравниваются по правому краю, а текстовые данные — по левому краю. Если длина введенного в ячейку текста превышает ширину этой ячейки, то после завершения ввода текст либо полностью отображается в таблице, закрывая, расположенные справа пустые ячейки, либо урезается по правому краю ячейки, если соседняя ячейка содержит какую-либо информацию. Урезанный текст полностью отображается только в строке формул.

Если числовые значения, полученные в результате вычисления формул, не помещаются в ячейку, вместо них на экране отображается соответствующее число символов диез (#).

Если в ячейку вводится формула, то сразу по завершении ввода выполняются вычисления, и в ячейке отображается результат вычислений. Формула в Excel должна начинаться с математического оператора (например, со знака равенства ). Так, после ввода формулы =1+6 в ячейке появится число 7, но в строке формул отобразится фактическое содержимое ячейки — формула. Запись 1+6 программа интерпретирует как текст.

Вычисление параметров вариационного ряда рассмотрим на примере данных суточного удоя коров. Пример. Имеется выборка (n=100). Требуется разнести по классам данные суточного удоя. Для построения вариационного ряда, прежде всего следует найти лимиты — минимальное и максимальное значения вариант. В приведенной выборке они выделены.

Суточный удой коров

Таблица 2. Пример выборки

21,9

21,4

27,7

17,0

12,3

21,7

23,4

25,7

21,2

20,3

23,8

24,1

25,9

21,4

20,7

18,5

22,5

23,0

18,5

25,7

20,1

21,3

15,7

24,8

19,3

22,2

22,9

14,9

26,1

20,5

14,6

27,8

22,4

16,7

22,9

25,3

22,7

19,7

15,2

21,3

22,1

20,5

19,7

24,5

29,6

22,3

19,1

23,5

25,9;

17,2

15,5

18,1

23,9

25,4

20,4

13,2

19,6

24,4

18,2

24,8

24,2

20,9

21,0

16,5

20,9

23,2

27,2

21,1

26,3

18,6

17,2

17,8

31,2

25,0

20,7

18,3

23,7

16,1

16,2

21,6

23,0

20,7

25,3

13,9

17,3

21,8

14,1

19,0

21,9

18,7

28,5

21,2

19,9

24,8

22,7

16,4

20,6

23,5

22,2

19,5

Числовые значения вводим в рабочее поле Excel начиная с ячейки В2 до В11, далее С2-С11 и т.д. до ячейки К11. В итоге получим таблицу состоящую из 10 строк и 10 столбцов. В ячейку В1 можно ввести название данных текстом, например: написать «Суточный удой коров».

В программе Excel имеются стандартные программы вычисления параметров статистики, которые можно использовать указав название этой программы. В данном примере рассчитаем следующие показатели: количество данных, минимальное и максимальное значения ряда, среднее арифметическое, среднее квадратическое отклонение, значение сигмы, ошибку средней, коэффициент вариации и границы доверительного интервала.

Решение:

  • 1)    количество данных – в ячейку В13 (обозначение ячеек вводят латинским шрифтом) введем = СЧЕТ(В2:К11), затем нажимаем Enter, в ячейке появится цифра 100. Что означает, всего данных сто.

  • 2)    вычисление минимального и максимального значений ряда – в ячейку В14 введем =МИН(В2:К11) «Enter», а в ячейку В15 =МАКС(В2:К11) «Enter». В ячейках В14 и

  • В15 появятся цифры 12,3 и 31,2.
  • 3)    вычисление остальных величин:

в ячейку В16 введем =СРЗНАЧ (В2:К11) «Enter» – это среднее значение;

среднее квадратическое отклонение – в ячейку В17 введем = ДИСПРА(В2:К11) «Enter»; значение сигма – в ячейку В18 введем =КОРЕНЬ(В17) «Enter»;

ошибка средней – в ячейку В19 введем =В18/КОРЕНЬ(В13) «Enter»;

коэффициент вариации (в %) – в ячейку В20 – введем =(В19*100)/В16 «Enter».

Определение границ доверительного интервала. Определим доверительный интервал для генерального среднего с уровнем надежности 95%. Исходные данные: объем выборки – 100, среднее – 21,237, стандартное отклонение σ – 3,734.

Решение с помощью функции Лапласа.

  • 1)    По таблице значений функции Лапласа найдем значение t , которое удовлетворяет условию

2Ф(t)=γ,(1)

, , V

Ф (t) = t т.е.                                                           2,(2)

Ф (t) = 095 = 0,475

2            .(3)

Мы увидим, что t - 1,96 .

Если под рукой нет учебника с таблицей функции Лапласа, то можно воспользоваться программой Excel. Применим для вычисления t формулу …. первой главы:

Ф(t)=НОРМСТРАСП(t)-0,5.

Мы должны вместо уравнения Ф(t)=0,495 рассмотреть уравнение

НОРМСТРАСП(t)-0,5=0,475

или найти t из соотношения

НОРМСТРАСП(t)=0,977.

Воспользуемся обратной функцией для НОРМСТРАСП(t).

Введем в произвольную ячейку программы Excel (например, G14) формулу

=НОРМСТРАСП(0,975), получим значение 1,959963985, что совпадает приближенно с табличным значением t = 1,96.

  • 2)    Теперь найдем границы доверительного интервала

    Л = t      1,96 3,734   0,731


n

Введем в ячейку G16 = ДОВЕРИТ(0,05;3,73;100) «Enter», получим 0,731.

Тогда

хt      x -Л = 21,237 0,731  20,506

n

х+t x +л = 21,237 + 0,731  21,97

n

Рис. 2. Параметры вариационного ряда

Доверительный интервал имеет вид:

(20,506 <Х<21,97). В приведенном примере можно в ячейки записывать и пояснения, выбор ячеек для ввода чисел может быть любым.

Решенное задание имеет вид (рис. 2).

Вычисление коэффициента корреляции

Для примера возьмем таблицу суточного удоя и жирности молока. В ячейки В3, В4, В5 и до В102 вводим значения суточного удоя в кг, а в ячейки D3 до D102 значения жирности молока (рис. 3).

Рис. 3. Вычисление коэффициента корреляции (1-й способ – ввод всех данных в два столбца, на рисунке показаны только первые 20 значений)

Затем в ячейку G11 вводим = КОРРЕЛ(C3:C102;D3:D102) «Enter» получим в этой ячейки значение коэффициента корреляции – 0, 572.

Для более компактного ввода данных можно их вводить как на Рис.3

Тогда в ячейку Е22 вводим = КОРРЕЛ(C3:H19;I3:N19) «Enter». Получим значение 0,62699.

Для проверки значимости коэффициента корреляции вычислим по формуле значение

Тнабл.

Для этого введите в ячейку Е24 формулу=Е22*КОРЕНЬ((100-2)/(1-Е22^2)).

Получим Тнабл=-7,967.

В ячейку Е26 введите формулу =СТЬЮДРАСПОБР(0,01;98), получим значение критерия Стьюдента 2,626.

Так как Тнабл=-7,967>tкр(α;κ)=2,6, нулевую гипотезу отвергаем, т.е. делаем вывод: коэффициент корреляции значим с уровнем доверия 99% (1-0,01=0,99).

Значение выборочного коэффициента корреляции положительно и близко к единице, что означает очень сильную прямую связь между рассматриваемыми признаками.

Рис. 4 Вычисление коэффициента корреляции (2-й способ – ввод всех данных по столбцам, последовательно)

Таким образом, биометрию можно использовать при планировании и обработке лишь тех биологических экспериментов и наблюдений, результаты которых могут быть отнесены к теоретическому понятию статистической совокупности.

Список литературы Использование программы Microsoft Excel в биометрии

  • Ларцева С.Х., Муксинов М.К. Практикум по генетике. - М.: Агропромиздат, 1985. - 288 с.
  • Фолконер Д.С. Введение в генетику количественных признаков. - М.: Агропромиздат, 1985. - 486 с.
  • Плохинский Н.А. Биометрия. - М.: Московский университет, 1980. - 150 с.
  • Антипов Г.П. Генетика с биометрией. - М.: Изд. МСХА, 1995. - 166 с.
  • Рокицкий П.Ф. Введение в статистическую генетику. - Минск: Вышейшая школа, 1974. - 447 с.
  • Меркурьева Е.К., Шангин-Березовский Г.Н. Генетика. - М.: Колос, 1991. - 446 с.
  • Баяхов А.Н., Моисейкина Л.Г., Турдуматов Б.М., Мендалиева Ш. Методы математической статистики в биологии. - Уральск: ЦНТИИ, 2016. - 96 с.
Статья научная