Использование математических методов для оценки результатов испытаний селекционных достижений на отличимость, однородность и стабильность
Автор: Гронин В.В., Дьяков А.Б.
Статья в выпуске: 2 (135), 2006 года.
Бесплатный доступ
Показана возможность использования математических методов для оценки результатов испытаний родительских линий и гибридов подсолнечника на отличимость, однородность и стабильность. Подобран метод для вычисления доверительных интервалов для доли нетипичных растений по качественным признакам. Изучена возможность применения таксономического анализа для точной оценки сходственных отношений между сортообразцами. Подобран метод для оценки вероятности ошибочной идентификации по количественным признакам сортовой принадлежности отдельного растения.
Короткий адрес: https://sciup.org/142150772
IDR: 142150772
Текст научной статьи Использование математических методов для оценки результатов испытаний селекционных достижений на отличимость, однородность и стабильность
Научно-технический бюллетень аспирант
Всероссийского научно-исследовательского А. Б. Дьяков, института масличных культур кандидат биологических наук
2006, вып. 2 (135)
ГНУ ВНИИ масличных культур
ИСПОЛЬЗОВАНИЕ МАТЕМАТИЧЕСКИХ МЕТОДОВ ДЛЯ ОЦЕНКИ РЕЗУЛЬТАТОВ ИСПЫТАНИЙ СЕЛЕКЦИОННЫХ ДОСТИЖЕНИЙ НА ОТЛИЧИМОСТЬ, ОДНОРОДНОСТЬ И СТАБИЛЬНОСТЬ
Наличие специфических отличительных признаков сортов, гибридов и их родительских форм всегда было важно для установления их подлинности, определения сортовой чистоты посевов и наличия примесей при апробации. Выявление уникальных комбинаций апробационно ценных признаков для надёжного описания сортов является важным условием эффективного сортоподдержания с целью обеспечения производства семян высокой генетической чистоты. Без такого контроля смешивание семян разных сортов или их переопыление могут сводить на нет усилия селекционеров. Особенно возрастает значение надежного описания генотипов для поддержания в процессе семеноводства чистоты и идентичности при высоком уровне генетического улучшения, когда уменьшаются сортовые различия, но повышаются требования к генетической чистоте [6]. Еще более актуальным стало выявление надежных отличительных признаков после вступления России в 1998 году в международную организацию по защите прав селекционеров UPOV, так как патентная защита сорта или гибрида невозможна без наличия у него таких признаков.
Организацией UPOV разработан специальный определитель для проведения оценки на отличимость, однородность и стабильность (ООС) родительских линий и гибридов подсолнечника [7]. В нем указаны качественные (дискретные) и количественные (морфометрические) признаки растений, которые оцениваются визуально. Различия по дискретным признакам, как, например, наличие или отсутствие антоциановой окраски гипокотиля, окраска язычковых цветков, выявляются внешним осмотром и позволяют надежно распознавать принадлежность отдельных растений к соответствующим родительским линиям и межлинейным гибридам. Поэтому качественные признаки наиболее предпочтительны для использования в целях отличимости. Их можно использовать в семеноводстве, например, для поддержания генетической чистоты родительских линий гибридов. В ряде случаев дискретных признаков недостаточно для определения принадлежности растений подсолнечника к конкретным сортообразцам. Поэтому неизбежно использование и количественных признаков определителя, которые подвержены модификационной изменчивости.
Исследования проводились в 2001-2002 гг. Растения 16 родительских линий и 8 межлинейных гибридов подсолнечника выращивались на 5-рядных делянках с тремя учетными рядами и при выдержанной густоте стояния растений – 40 тыс./га. В посеве каждого изученного сортообразца было взято для морфологического описания по 15 растений. Учеты производились на стадиях: всходы, бутонизация, цветение, созревание. Для морфологического описания растений подсолнечника были использованы 34 признака растений из определителя UPOV. Описание семян не производили, так как задача сертификации семян не ставилась.
Все изученные образцы сравнены между собой по 34 морфологическим признакам растений. Между каждой парой изученных линий существуют различия в среднем по 10-25 морфологическим признакам, приведенным в определителе UPOV. Между простыми гибридами выявлено значительно меньше различий, чем между их родительскими линиями. Каждую пару гибридов различают в среднем 7-16 признаков. Однако не все эти признаки можно использовать как отличительные вследствие их неоднородной вы- раженности у отдельных сортообразцов, а также нестабильности проявления этих признаков по годам.
Для того чтобы определить, какие признаки можно использовать в целях обеспечения эффективности гибридного семеноводства, а также для определения сортовой чистоты посевов и наличия примесей при апробации, была поставлена задача оценить точность различения сортообразцов подсолнечника с использованием качественных и количественных признаков определителя UPOV, определить вероятность ошибочной идентификации отдельных растений. Для этого необходимо было подобрать соответствующие математические методы.
Подбор методов для оценки точности различения образцов и определения вероятности ошибочной идентификации отдельных растений осуществляли на примере пяти родительских линий межлинейных гибридов: ВК 499, ВК 653, ВК 678, ВК 389 и ВК 392. Поэтому эта модельная группа изучена более подробно.
Вначале у пяти инбредных линий была оценена однородность всех морфологических признаков растения, указанных в определителе UPOV. Неоднородно выраженные признаки обнаружены у каждой из изученных родительских линий (табл. 1). Для каждой линии по каждому неоднородно выраженному признаку найден процент нетипичных растений. Чтобы определить, насколько точно проценты нетипичных растений в выборке отражают долю нетипичных растений в генеральной совокупности, надо вычислить доверительные интервалы этих процентов. Эта задача решается с использованием биномиального распределения [4], однако эти вычисления очень сложны, поэтому разработаны различные методы приближенного вычисления: нормальное приближение, приближение Пуассона, φ -преобразование Р. А. Фишера. При малых объемах выборки нормальное приближение дает неточные результат [5]. Приближение Пуассона позволяет вычислять границы доверительного интервала более точно при малых выборках, однако оно неприменимо при больших величинах доли (процента) альтернативных вариант ( p ), поэтому мы использовали φ -преобразование.
Таблица 1 – Неоднородно выраженные морфологические признаки определителя
UPOVу пяти инбредных линий подсолнечника
Линия |
Признак |
ВК 499 |
Размер листа, форма дистальной части листа, зубчатость края, форма поперечного сечения листа, крыльевидные сегменты листа, угол между боковыми жилками листа, густота язычковых цветков, форма листочков обертки, форма стороны с семенами |
ВК 653 |
Размер листа, форма дистальной части листа, «уши» листа |
ВК 678 |
«Уши» листа, крыльевидные сегменты листа |
ВК 389 |
Размер листа, форма дистальной части листа, «уши» листа, зубчатость листа, крыльевидные сегменты листа, опушение вершины стебля, наличие антоциановой пигментации рыльца, форма листочков обертки, зеленый цвет внешней стороны листочка обертки, расположение корзинки в пространстве, форма стороны с семенами у корзинки |
ВК 392 |
Форма поперечного сечения листа, наличие крыльевидных сегментов листа |
Величина φ имеет распределение, близкое к нормальному, вычисляется по формуле: ф = 2 arcsin p , стандартная ошибка этой величины зависит только от объема выборки (n): ~ г~ . Соответственно, нижняя (pн) и верхняя (pв) границы довери- n тельного интервала вычисляются по формулам:
up
^—г
2n pн sin 2
up
2n и pв sin , где up – аргумент нормального рас- пределения, для 95%-ного доверительного интервала up=1,96, для 99%-ного доверительного интервала up=2,58.
Таким образом, для каждой родительской линии по каждому неоднородно выраженному признаку вычислены 95%-ные доверительные интервалы для доли нетипичных растений. Например, для линии ВК 653 доверительные интервалы по трем неоднородно выраженным признакам приведены в табл. 2. Из этой таблицы следует, что выборки объемом 15 растений недостаточно, для точного определения доли нетипичных растений, так как разность между верхним и нижним доверительными интервалами достаточно велика (для признаков «размер листа» и «форма дистальной части листа» – 45,7%, для признака «уши» листа» – 38,8%). Чтобы размах 95%-ного доверительного интервала для процента нетипичных растений составил 5%, необходимо брать выборку не менее 384 растений [5, с. 130]. Однако вывод о непригодности признака в качестве отличительного вследствие его неоднородной выраженности можно сделать и по небольшой выборке. Например, из табл. 2 видно, что по признаку «размер листа» в генеральной совокупности соотношение растений с маленькими листьями и растений со средним размером листа в лучшем случае, возможно, будет 12,6% на 87,4%, в худшем – 58,3% на 41,7%.
Таблица 2 – Процент нетипичных растений и его доверительные интервалы по неоднородно выраженным признакам у линии ВК 653
Признак |
Степень выраженности |
|||||
p ,% |
p н , % |
p в , % |
p ,% |
p н , % |
p в , % |
|
Размер листа |
Маленький |
Средний |
||||
33,3 |
12,6 |
58,3 |
66,7 |
41,7 |
87,4 |
|
Форма дистальной части листа |
Широкая треугольная |
Узкая треугольная |
||||
66,7 |
41,7 |
87,4 |
33,3 |
12,6 |
58,3 |
|
«Уши» листа |
Отсутствовали |
Маленькие |
||||
20 |
4,4 |
43,2 |
80 |
56,8 |
95,6 |
После определения процентов неоднородности по каждому признаку изученные родительские линии сравнены между собой по признакам определителя. Каждую пару из данных инбредных линий различают от 15 до 19 признаков. В табл. 3 приведены признаки, по которым различались сравниваемые линии в 2001 г., отдельно отмечены неоднородно выраженные, а также количественные признаки.
Таблица 3 – Сравнение пяти инбредных линий между собой по признакам определителя UPOV(2001 год)
ВК499 |
ВК653 |
ВК678 |
ВК389 |
|||||||||||||
ВК653 |
2 |
5 |
7 |
8 |
555 |
|||||||||||
9 |
10 |
11 |
15 |
|||||||||||||
17 |
19 |
21 |
24 |
|||||||||||||
25 |
27 |
28 |
34 |
|||||||||||||
ВК678 |
1 |
3 |
4 |
5 |
1 |
3 |
4 |
7 |
||||||||
8 |
9 |
10 |
11 |
8 |
9 |
10 |
11 |
|||||||||
12 |
13 |
15 |
21 |
12 |
13 |
17 |
19 |
^^^^ |
||||||||
26 |
27 |
28 |
32 |
24 |
25 |
26 |
27 |
|||||||||
34 |
28 |
32 |
34 |
|||||||||||||
ВК389 |
4 |
5 |
7 |
8 |
2 |
4 |
8 |
9 |
1 |
3 |
4 |
7 |
7Л |
7///Л |
||
9 |
10 |
11 |
13 |
10 |
11 |
13 |
14 |
8 |
9 |
12 |
14 |
|||||
14 |
15 |
17 |
21 |
17 |
19 |
24 |
25 |
17 |
24 |
27 |
28 |
|||||
24 |
26 |
29 |
32 |
26 |
27 |
28 |
29 |
29 |
32 |
34 |
||||||
32 |
34 |
7/Л |
7////Z |
|||||||||||||
ВК392 |
1 |
4 |
5 |
7 |
1 |
4 |
5 |
8 |
3 |
4 |
5 |
7 |
1 |
4 |
5 |
8 |
11 |
12 |
14 |
15 |
9 |
10 |
11 |
12 |
8 |
9 |
10 |
13 |
9 |
10 |
12 |
13 |
|
21 |
24 |
25 |
26 |
14 |
17 |
19 |
25 |
14 |
24 |
25 |
27 |
14 |
17 |
24 |
25 |
|
32 |
33 |
34 |
26 |
27 |
28 |
32 |
28 |
32 |
33 |
34 |
29 |
33 |
34 |
|||
33 |
34 |
Условные обозначения (номера признаков взяты из определителя UPOV):
– признак неоднородно выражен у одной из двух линий;
– признак неоднородно выражен у двух линий;
25 – количественный признак.
-
1 – наличие антоциановой окраски гипокотиля;
-
2 – интенсивность антоциановой окраски гипокотиля;
-
3 – размер листа;
-
4 – форма дистальной части листа;
-
5 – «уши» листа;
-
7 – бугристость листа;
-
8 – зубчатость края листа;
-
9 – форма поперечного сечения листа;
-
10 – крыльевидные сегменты листа (мезофилл по краю нижних боковых жилок)
-
11 – угол между боковыми жилками листа;
-
12 – высота кончика листа относительно места прикрепления черешка;
-
13 – опушенность вершины стебля (последние 5 см под корзинкой);
-
14 – время цветения;
-
15 – густота язычковых цветков;
-
17 – расположение язычковых цветков;
-
19 – цвет язычковых цветков;
-
21 – наличие антоциановой пигментации рыльца;
-
24 – форма листочка обертки;
-
25 – длина верхушки листочка обертки;
-
26 – зеленый цвет внешней стороны листочка обертки;
-
27 – естественная высота растения;
-
28 – положение листочков обертки по отношению к корзинке на стадии созревания;
-
29 – наличие ветвления;
-
32 – положение корзинки в пространстве;
-
33 – размер корзинки;
-
34 – форма стороны с семенами корзинки
Из табл. 3 видно, что для данной модельной группы линий существует не много признаков, удовлетворяющих требованию однородности. Оказалось, что больше всего отличий по качественным признакам между линиями ВК 678 и ВК 653 – 12 качественных, однородно выраженных признаков. Меньше всего таких отличительных признаков оказалось у пары линий ВК 389 и ВК 499 – только четыре. Во всех остальных парных сравнениях было обнаружено от шести до девяти однородно выраженных качественных признаков.
У этих однородно выраженных в один год исследования качественных признаков оценена стабильность их проявления по годам (2001 и 2002 годы). Оказалось, что у линии ВК 678 все качественные, однородно выраженные признаки одинаково проявляются в разные годы. Линии ВК 392 и ВК 389 имели по одному признаку, неодинаково выраженному в разные годы исследования (табл. 4). Больше всего таких нестабильно
Таблица 4 – Нестабильные по годам признаки у растений родительских линий ВК 499,
ВК 653, ВК 678, ВК 389 и ВК 392
В табл. 5 приведены качественные отличительные признаки для исследуемых линий, которые остались после того, как были отброшены все неоднородно выраженные и нестабильно проявляющиеся по годам признаки. Чтобы точно оценить сходственные отношения по качественным признакам между родительскими линиями исследуемой группы, необходимо было подобрать соответствующий математический метод. Е. С. Смирновым в 1924 г. был предложен точный метод, позволяющий оценивать отношения сходства и различия внутри таксона любого порядка, названный впоследствии таксономическим анализом [3]. Исследования в этом направлении велись также и другими авторами [3, с. 7].
Таблица 5 – Однородно выраженные, одинаково проявляющиеся по годам, качественные отличительные признаки пяти родительских линий межлинейных гибридов, взятые из определителя UPOV
Линия |
Признак и его степень выраженности |
ВК 499 |
Антоциановая окраска гипокотиля – имеется, интенсивность антоциановой окраски гипокотиля – сильная, время цветения – среднее, расположение язычковых цветков в пространстве – плоские, положение листочков обертки по отношению к корзинке – слабо обхватывают, положение корзинки в пространстве – полуперевернутое с прямым стеблем |
ВК 653 |
Антоциановая окраска гипокотиля – имеется, интенсивность антоциановой окраски гипокотиля – слабая, время цветения – среднее, расположение язычковых цветков в пространстве – продольно свернутые боковыми краями на лицевую сторону корзинки, положение листочков обертки по отношению к корзинке – не обхватывают, положение корзинки в пространстве – полуперевернутое с прямым стеблем |
ВК 678 |
Антоциановая окраска гипокотиля – отсутствует, форма дистальной части листа – круглая, форма поперечного сечения листа – слабо выпуклая, время цветения – среднее, расположение язычковых цветков в пространстве – плоские, положение листочков обертки по отношению к корзинке – сильно обхватывают, положение корзинки в пространстве – перевернутое вниз с прямым стеблем, форма стороны с семенами у корзинки – слабо вогнутая |
ВК 389 |
Антоциановая окраска гипокотиля – имеется, интенсивность антоциановой окраски гипокотиля – сильная, форма поперечного сечения листа – сильно вогнутая, время цветения – раннее, расположение язычковых цветков в пространстве – загнутые назад на тыльную сторону корзинки, положение листочков обертки по отношению к корзинке – слабо обхватывают, наличие ветвления – имеется, положение корзинки в пространстве – вертикальное |
ВК 392 |
Антоциановая окраска гипокотиля – отсутствует, время цветения – позднее, расположение язычковых цветков в пространстве – плоские, положение листочков обертки по отношению к корзинке – слабо обхватывают, положение корзинки в пространстве – вертикальное |
Основные понятия таксономического анализа – свойство, признак (или модальность) и фреквенция. В нашем случае свойством будет, например, интенсивность антоциановой окраски гипокотиля, а признаками этого свойства – слабая, средняя и сильная антоциановая окраска гипокотиля. То есть свойство по Е. С. Смирнову соответствует признаку в системе определителя UPOV, а признаки свойств – соответствуют степеням выраженности. Признаки в рамках таксономического анализа могут быть положительными, то есть имеющимися (они обозначаются прописной буквой), и отрицательными, то есть отсутствующими (они обозначаются строчной буквой). Это необходимо для перевода полимодального распределения изучаемых таксонов в систему бимодальных распределений, так как отсутствие какого-либо одного признака может быть более характерной особенностью, чем наличие другого признака. Фреквенция признака – это число видов (в нашем случае – линий) которые обладают этим признаком, она обозначается соответствующей буквой, заключенной в круглые скобки, например, ( E ) – фрек-венция положительного признака и ( e ) – фреквенция отрицательного признака.
Введем буквенные обозначения отличительных признаков, представленных в табл. 5, числовым индексом обозначив модальности свойств: A – наличие антоциановой окраски гипокотиля, B – интенсивность антоциановой окраски гипокотиля ( B 1 – сильная, B 2 – слабая), C – круглая форма дистальной части листа, D – форма поперечного сечения листа ( D 1 – слабо выпуклая, D 2 – сильно вогнутая, D 3 – другая), E – время цветения ( E 1 – раннее, E 2 – среднее, E 3 – позднее), F – расположение язычковых цветков ( F 1 – продольно свернутые боковыми краями на лицевую сторону корзинки, F 2 – плоские, F 3 – загнутые назад, на тыльную сторону корзинки), G – положение листочков обертки по отношению к корзинке ( G 1 – не обхватывают, G 2 – слабо обхватывают, G 3 – сильно обхватывают), H – наличие ветвления, I – положение корзинки в пространстве ( I 1 – полу-перевернутое с прямым стеблем, I 2 – перевернутое вниз с прямым стеблем, I 3 – вертикальное), J – слабо вогнутая форма стороны с семенами. Таким образом, морфологическое описание изучаемых инбредных линий можно представить в следующей форме:
ВК 499
ВК 653
ВК 678
ВК 389
ВК 392
AB 1 b 2 cd 1 d 2 D 3 e 1 E 2 e 3 f 1 F 2 f 3 g 1 G 2 g 3 hI 1 i 2 i 3 j Ab 1 B 2 cd 1 d 2 D 3 e 1 E 2 e 3 F 1 f 2 f 3 G 1 g 2 g 3 hI 1 i 2 i 3 j ab 1 b 2 CD 1 d 2 d 3 e 1 E 2 e 3 f 1 F 2 f 3 g 1 g 2 G 3 hi 1 I 2 i 3 J AB 1 b 2 cd 1 D 2 d 3 E 1 e 2 e 3 f 1 f 2 F 3 g 1 G 2 g 3 Hi 1 i 2 I 3 j ab 1 b 2 cd 1 d 2 D 3 e 1 e 2 E 3 f 1 F 2 f 3 g 1 G 2 g 3 hi 1 i 2 I 3 j
Далее было произведено парное сравнение данных линий друг с другом, и вычислены веса совпадений по каждому признаку для каждого сравнения. Вес совпадения
( a )
в положительном признаке равен AA , вес совпадения в отрицательном призна-
-
(A) .
ке вычисляется как . Например, для сравнения линий ВК 499 и ВК 653 по
-
( a)
признаку A вес совпадения в положительном признаке будет равен ω AA =2/3=0,67; для сравнения линий ВК 678 и ВК 392 по признаку A вес совпадения в отрицательном признаке будет равен ω AA =3/2=1,5. Вес несовпадения в любом признаке, как показано Е. С. Смирновым, всегда равен -1 [3, с. 16]. Надежным показателем таксономического 1
отношения является средний вес: txy i , где n – число признаков (в нашем слу- nn чае n=21), ωi – вес сравнения по каждому признаку, x и y – сравниваемые таксоны (ин-бредные линии). Таксономическое отношение txy для межвидового сравнения может 5 -2
изменяться от до -1, где s – число видов, в нашем случае 1,5>txy≥-1. Таксономи ческое отношение, вычисленное для внутривидового сравнения, то есть сравнения таксона с самим собой, служит показателем оригинальности исследуемой таксономической единицы. Эта величина обозначается txx, она может варьировать от s–1 до , в на-
5-1
шем примере 4> t xx ≥0,25. В табл. 6 приведены таксономические отношения данных пяти родительских линий.
Таблица 6 – Таксономические отношения, полученные при сравнении пяти инбредных линий между собой по признакам определителя UPOV
ВК 499 |
ВК 653 |
ВК 678 |
ВК 389 |
ВК 392 |
|
ВК 499 |
0,4881 |
0,0317 |
- 0,2857 |
- 0,1865 |
- 0,0476 |
ВК 653 |
0,0317 |
1,0635 |
- 0,3452 |
- 0,4444 |
- 0,3055 |
ВК 678 |
- 0,2857 |
- 0,3452 |
1,4206 |
- 0,5635 |
- 0,2262 |
ВК 389 |
- 0,1865 |
- 0,4444 |
- 0,5635 |
1,3214 |
- 0,1270 |
ВК 392 |
- 0,0476 |
- 0,3055 |
- 0,2262 |
- 0,1270 |
0,7063 |
По левой диагонали в табл. 6 находятся t xx , максимальное значение этой величины у линии ВК 678, так как она имеет наибольшее количество индивидуальных признаков, на втором месте – ВК 389, на третьем – ВК 653, на четвертом – ВК 392. Наименее оригинальной оказалась линия ВК 499, ее значение t xx минимально, так как у нее нет индивидуальных признаков. В табл. 7 приведены индивидуальные морфологические признаки для исследуемых родительских линий подсолнечника.
Таблица 7 – Индивидуальные отличительные признаки у пяти инбредных линий подсолнечника
Линия |
Признак |
Количество индивидуальных признаков |
ВК 499 |
– |
0 |
ВК 653 |
B 2 E 2 F 1 G 1 |
4 |
ВК 678 |
CD 1 G 3 I 2 J |
5 |
ВК 389 |
D 2 E 1 F 3 H |
4 |
ВК 392 |
E 3 |
1 |
Из этой таблицы видно, что у изученных линий есть только положительные индивидуальные признаки. Отрицательных индивидуальных признаков, то есть таких, которые имелись бы у четырех линий, но отсутствовали у одной линии, в исследуемом наборе линий не оказалось.
Значения t xy представлены в таблице 6 в двойном количестве для удобства обозримости. Из табл. 7 видно, что все они, кроме одного, отрицательны. Это означает, что во всех сравнениях различия преобладают над сходством. Только для сравнения пары линий ВК 499 и ВК 653 получено небольшое положительное значение, значит, в этом сравнении сходство преобладает над различием. Наиболее сильно различаются линии ВК 678 и ВК 389, для этого сравнения получено наибольшее по модулю отрицательное значение t xy . Наименьшее по модулю отрицательное значение t xy получено для пары линий ВК 499 и ВК 392, значит, между ними различий меньше, чем в других сравнениях, хотя различия все еще перевешивают сходство.
Таким образом, с помощью таксономического анализа можно осуществить точную оценку сходства или различия между любыми инбредными линиями или межлинейными гибридами подсолнечника по качественным морфологическим признакам. Необходимым условием для применения этого математического метода является наличие у сравниваемых образцов одинаково выраженных у всех растений и стабильно проявляющихся по годам качественных признаков.
Возможна ситуация, когда качественных признаков недостаточно для надежного распознавания принадлежности растений подсолнечника к конкретным сортообразцам, как, например, в сравнении линий ВК 499 и ВК 653, где сходство преобладало над различиями (табл. 6). В таких случаях необходимо использовать количественные признаки, однако они подвержены модификационной изменчивости.
Чтобы изучить возможность использования количественных признаков в условиях сильной средовой изменчивости, был заложен опыт, в котором модификационная изменчивость усиливалась варьированием густоты стояния растений: 20, 40, 70 тыс./га. Выращивались растения тех же пяти родительских линий межлинейных гибридов: ВК 499, ВК 653, ВК 678, ВК 389, ВК 392. Изучались следующие количественные признаки, предлагаемые определителем UPOV: размер листа, угол между нижними боковыми жилками листа, длина язычковых цветков, густота язычковых цветков, длина вершины листочка обертки, высота растения, размер корзинки. Все признаки были измерены на 20-ти растениях каждой инбредной линии на каждой густоте в каждый год исследования. Размер листа измерен как длина листовой пластинки, максимальная ширина листовой пластинки, расстояние от максимальной ширины до вершины листовой пластинки и длина черешка, густота язычковых цветков – как число язычковых цветков на 10 см периметра корзинки, а размер корзинки – как диаметр и периметр корзинки. Для каждой инбредной линии по всем признакам вычислены средние величины и их доверительные интервалы, дисперсии и стандартные отклонения на каждой густоте и для совокупности всех густот.
Проведено сравнение исследуемых линий по средним значениям признаков с помощью t -критерия Стьюдента [1]. В большинстве случаев выявлены различия, достоверные на 5%, 1% и 0,1%-ном уровнях значимости, величины t -критерия для некоторых сравнений приведены в табл. 8.
Построив распределение частот по значениям этих признаков, мы видим, что между сравниваемыми линиями по всем изученным признакам в разной степени наблюдается трансгрессия, что затрудняет надежную идентификацию принадлежности отдельного растения, несмотря на достоверные различия по средним. В качестве примера на рисунке 1 приведены распределения частот по некоторым признакам для линий ВК 499, ВК 653 и ВК 678.
Таблица 8 – Значения t-критерия, полученные при сравнении инбредных линий по средним значениям некоторых количественных признаков в разные годы
Признак |
t |
|
2001 год |
2002 год |
|
Линии ВК499 и ВК653 |
||
Длина вершины листочка обертки |
13,02* |
9,18* |
Линии ВК653 и ВК678 |
||
Длина листовой пластинки |
12,37* |
10,62* |
Длина вершины листочка обертки |
14,99* |
14,73* |
Высота растения |
15,75* |
9,35* |
* - Различия достоверны на 0,1%-ном уровне значимости |

Рисунок 1 – Распределения частот по значениям некоторых признаков растений трех инбредных линий подсолнечника, выращенных при разных густотах стояния в разные годы.
Так получается потому, что критерием значимой разницы между средними является средняя ошибка разности, которая зависит от размеров разности, изменчивости в пределах группы, а также от числа исследованных индивидов. Чем число обследованных особей больше, тем ошибка меньше, по этой причине она не может быть использована для установления ценности признака при определении единственной особи. Поэтому была поставлена задача подобрать статистический метод, позволяющий оценить вероятность ошибки при идентификации отдельного растения и не зависящий от числа индивидов. Зная вероятность ошибки при идентификации отдельного растения, можно оценить пригодность количественного признака в целях отличимости, а также для оценок однородности и стабильности.
Проанализировав различные математические методы, позволяющие оценить эффективность различения групп особей, мы остановились на коэффициенте дискриминации ( K ), который был предложен А. А. Любищевым [2]. Формула коэффициента дискриминации:
_ ( х х 2 )
K или
(7! +(Т2
_ (х х 2 )
2 У
,
где x 1 и x 2 – средние арифметические обеих групп,
σ1 и σ2 – стандартные отклонения, y – квадрат общего квадратичного отклонения, вычисленный по формуле Р. А. Фишера или полученный в ходе дисперсионного анализа.
Вероятность ошибочного определения можно вычислить следующим образом: из формулы коэффициента дискриминации следует
xx
Левая часть равенства есть аргумент u нормального распределения (рис. 2). Вероятность ошибочных определений – это доля вариант, лежащих правее абсциссы u. Она вычисляется как , где Φ(u) – интеграл вероятности, а θ(u) – площадь под кривой нормального распределения в пределах от x-uσ до x+uσ. Величину θ(u) можно найти с помощью таблицы [4, 5]. Существуют также таблицы непо- средственно для Φ(u). Имея величину
вероятность P можно также вычислить с
помощью компьютерных программ по статистике, например STATISTICA 6.0.
Из систематики известен морфологический критерий вида: два близких вида должны отличаться хотя бы по одному признаку, не дающему трансгрессии. Амплитуды колебаний данного признака должны быть разделены промежутком. Если обе амплитуды заходят друг за друга, создается область трансгрессии, где пользование этим признаком может привести к ошибкам в определении. Известно, что амплитуда есть величина, зависящая от числа наблюдений: чем больше число наблюдений, тем шире амплитуда. Поэтому при определении очень обширного материала может произойти такое расширение амплитуды, которое приведет к ненадежным или ошибочным определениям. Но и по ограниченной выборке можно составить представление о вероятности подобных ошибок. Критерием является стандартное отклонение σ . Вместо эмпирических амплитуд можно использовать условные амплитуды, взяв интервал в 3 σ по обе стороны от среднего арифметического. За пределами этого интервала останется около 0,003 генеральной совокупности.

Рисунок 2 – Кривая плотности нормального распределения ( X ср. =0, σ =1).
Можно вычислить, какое значение должен иметь коэффициент дискриминации, чтобы признак считался удовлетворительным для различения двух групп особей. Хорошим отличительным признаком считается такой, по которому нет трансгрессии между исследуемыми группами. Если не требовать полного отсутствия трансгрессии и ограничиться требованием трех σ , то можно считать удовлетворительным случай, когда кривые распределения отличительного признака расположены так, что минимальная точка между обоими видами находится на расстоянии 3 σ от обоих средних (предполагая для
36 a 2
простоты, что σ 1 = σ 2 ). Следовательно, x x 6 су , а K 18 . При коэф-
12 2 о- 2
фициенте дискриминации меньше 18 имеется уже более или менее выраженная трансгрессия.
Для изученных пяти инбредных линий вычислены коэффициенты дискриминации по всем измеренным признакам. Как и ожидалось, ни в одном случае значение K не превысило 18. В большинстве сравнений K варьировал от 0 до 3, таким значениям соответствует вероятность ошибочного определения от 0,5 до 0,111. Следовательно, неверно идентифицированные растения будут встречаться от 1 раза на 2 растения до 1 на 9 растений. Лишь в отдельных случаях получены более высокие значения K , некоторые из них приведены в табл. 9.
Таблица 9 – Значения коэффициента дискриминации (K), вероятности ошибочного определения (P) и отношения числа неверно идентифицированных растений к общему числу определений (О), полученные при сравнении инбредных линий подсолнечника по некоторым количественным признакам в разные годы
Признак |
2001 год |
2002 год |
||||
K |
P |
О |
K |
P |
О |
|
Линии ВК499 и ВК653 |
||||||
Длина вершины листочка обертки |
3,25 |
0,101 |
1:9,9 |
4,21 |
0,073 |
1:13,7 |
Линии ВК653 и ВК678 |
||||||
Длина листовой пластинки |
2,72 |
0,122 |
1:8,2 |
5,64 |
0,046 |
1:21,7 |
Длина вершины листочка обертки |
3,93 |
0,080 |
1:12,5 |
10,85 |
0,010 |
1:100 |
Высота растения |
4,44 |
0,068 |
1:14,7 |
4,73 |
0,062 |
1:16,1 |
Из табл. 9 видно, что наибольшее значение K получено для линий ВК 653 и ВК 678 по признаку длина вершины листочка обертки в 2002 г., однако в 2001 г. коэффициент дискриминации был почти в 3 раза меньше. Вероятность ошибочного определения изменилась в 8 раз. В остальных случаях коэффициенты дискриминации и вероятности ошибочных определений тоже изменяются по годам. Только по признаку высота растения для линий ВК 653 и ВК 678 величины коэффициента дискриминации и вероятности ошибочного определения в разные годы почти одинаковы: в 2001 г. K=4,44, P=0,068, в 2002 г. K=4,73 и P=0,062. В этом случае одно ошибочное определение будет случаться в среднем на 14-16 растений, такая точность идентификации недостаточна для практического использования признака как отличительного.
Увеличить точность идентификации отдельных растений с помощью количественных признаков можно, используя одновременно два некоррелированных признака, так как в этом случае вероятности ошибочного определения перемножаются. Например, у линии ВК 653 коэффициент корреляции признаков длина вершины листочка обертки и высота растения по данным двух лет равен 0,29; у линии ВК 678 r по тем же признакам равен -0,06. Величины коэффициента дискриминации, вычисленного для линейной комбинации этих двух признаков, были K =5,02 по данным 2001 г. и K =12,40 по данным 2002 г. Соответственно, вероятность ошибки при определении отдельного растения для данных 2001 г. равна 0,056 (одна ошибка на 17,7 испытаний), для данных 2002 г. P =0,006 (одно ошибочное определение на 156,7 растений).
Количественные признаки, взятые по одному, можно использовать в целях отличимости только при одинаковой густоте стояния сравниваемых сортообразцов. Например, для линий ВК 499 и ВК 653, различающихся по признаку длина вершины листочка обертки, вычислены коэффициенты дискриминации отдельно по каждой, использованной в этом эксперименте, густоте стояния растений (табл. 10).
Таблица 10 – Значения коэффициента дискриминации (K), вероятности ошибочного определения (P) и отношения числа неверно идентифицированных растений к общему числу определений (О), полученные при сравнении инбредных линий подсолнечника ВК499 и ВК 653 по признаку длина вершины листочка обертки в разные годы на разных густотах стояния растений
2001 год |
2002 год |
|||||
20 тыс./га |
40 тыс./га |
70 тыс./га |
20 тыс./га |
40 тыс./га |
70 тыс./га |
|
K |
2,85 |
2,08 |
5,03 |
7,42 |
3,21 |
6,09 |
P |
0,116 |
0,154 |
0,056 |
0,027 |
0,103 |
0,040 |
О |
1:8,6 |
1:6,5 |
1:17,7 |
1:37,0 |
1:9,7 |
1:24,7 |
Из табл. 10 видно, что лучше всего данные две линии различаются по признаку длина вершины листочка обертки, если их растения выращивались при густотах стояния 20 и 70 тыс./га.
Таким образом, подобран математический метод, позволяющий оценить вероятность ошибки при идентификации принадлежности отдельного растения к конкретному сортообразцу по количественному признаку. На примере пяти родительских линий гибридов с помощью этого метода измерена вероятность ошибки при идентификации отдельного растения по количественным признакам (в частности, имеющимся в определителе UPOV). На основе полученных данных сделан вывод о непригодности количественных признаков, взятых отдельно, для надежного определения принадлежности одного растения.