Бесплатный автореферат и диссертация по сельскому хозяйству на тему
Прогнозирование результатов скрещивания в селекции плодовых и ягодных растений на основе математического моделирования
ВАК РФ 06.01.05, Селекция и семеноводство
Автореферат диссертации по теме "Прогнозирование результатов скрещивания в селекции плодовых и ягодных растений на основе математического моделирования"
гя оа
На греках рукописи
Бутенко Анатолий Иванович
Прогнозирование результатов скрещивания в селекции плодовых
и ягодных растений на основе математического моделирования
Специальность - 06.01.05 - селекция и семеноводство
Автореферат диссертации на соискание ученой степени доктора сельскохозяйственных наук
Мичуринск -1996
Работа выполнена в Мичуринской государственной сельскохозяйственной академии
Научный консультант - доктор сельскохозяйственных наук,
профессор В.Е. Перфильев
Официальные оппоненты - доктор биологических наук, профессор
А.В. Смиряев,
доктор биологических наук, старший научный сотрудник С.П.' Мартынов, доктор сельскохозяйственных наук, профессор К.Н. Кондратьев
Ведущая организация - Северо-Кавказсийй зональный научно-исследовательский институт садоводства и виноградарства
Зашита состоится 14 января 1997 го,1,а в 1330 на заседании диссертационного совета Д. 120. 18. 01 при Мичуринской государственной сельскохозяйственной академии по адресу: 393740, г. Мичуринск Тамбовской обл., ул. Интернациональная, 101.
С диссертацией можно ознакомиться в библиотеке Мичуринской государственной сельскохозяйственной, академии
Автореферат разослан _1996 года.
Отзывы на автореферат в двух экземплярах, заверенные и скрепленные гербовой печатью, просим направлять ученому секретарю Совета.
Ученый секретарь диссертационного Совета '-У^' 1 V
Д. 120. 18. 01, канд. с.-х. наук, доцент ^ " Й.В. Трунов
ОБЩАЯ ХАРАКТЕРЛСТИКА РАБОТЫ
Актуальность темы. Важнейшей задачей селекции растений является выведение новых сортов и гибридов сельскохозяйственных культур, превосходящих существующие по основным хозяйственным и биологическим показателям.
Большая продолжительность селекционного процесса у плодовых растений затрудняет выявление лучших комбинаций скрещивания опытным путем. В связи с этим для плодовых растений особенно важное значение имеет разработка способов прогноза результатов скрещивания при селекции на комплекс количественных признаков.
Совершенствованию методов селекции и повышению ее результативности может способствовать использование компьютерной техники. Уже сейчас компьютеры могут оказать большую помощь селекционеру в планировании эксперимента, статистической обработке опытных данных, оперативном поиске нужной информации. Однако значительного повышения эффективности селекционной работы от внедрения компьютерной техники следует ожидать лишь тогда, когда удастся моделировать на ЭВМ весь селекционный процесс или, хотя бы наиболее существенные его этапы. Для этого необходима разработка адекзатных математических методов и моделей, реализация их в виде компьютерных программ, способных без вмешательства селекцнснера производить нужную обработку имеющейся информации и выдавать требуемые рекомендации.
В работе автор обобщает опыт использования математических методов и ЭВМ в селекционно-генетических исследованиях плодовых и ягодных растении и предлагает свои подходы к решению указанных задач.
Цель и задачи исследования. Целью исследовании является разработка методических вопросов применения многомерного статистического анализа и теории нечетких множеств в селекции плодовых растений.
Задачи исследований:
1) разработать методические рекомендации по применению многомерного статистического анализа при подборе родительских пар при гибридизации;
2) разработать методические вопросы применения теории нечетких множеств в селекции плодовых и ягодных растений;
3) разработать принципы функционирования на базе нечетких
моделей экспертной системы селекционера.
Научная новизна. Предлагаются два принципиально новых подхода к решению проблемы подбора родительских пар.
Первый основан на вычислении вероятностей получения ценных гибридов в той или иной комбинации скрещивания по значениям количественных признаков у исходных сортов.
Второй - на использовании теории нечетких множеств для прогнозирования распределения признака у гибридов по его распределению у исходных форм.
Практическая значимость работы. Использование рекомендаций по подбору пар для гибридизации будет способствовать повышению результативности селекционной работы.
Реализация результатов исследований. Часть разработок вошла в написанные автором "Методические рекомендации по применению анализа главных компонент в генетике и селекции плодовых растений" (Мичуринск, 1989. - 40 с.), а также в монографию "Математические методы и компьютерные модели в селекции плодовых и ягодных растений" (Мичуринск, 1996. - 87 е.). Ряд методических статей опубликован в центральных журналах.
Апробация работы. Материалы исследований докладывались на следующих совещаниях и конференциях:
1) Совещание "Применение математических методов и ЭВМ в сельском хозяйстве" (Тарту, 1978);
2) Всесоюзная конференция "Экологическая генетика растений и животных" (Кишинев, 1981)
3) Всесоюзная конференция молодых ученых "Биологические аспекты изучения и рационального использования животного и растительного мира" (Рига, 1981);
4) Всесоюзное совещание "Методические вопросы селекции вегетативно размножаемых растений" (Мичуринск, 1981);
5) областная научная конференция "Развитие научного наследия И. В. Мичурина" (Мичуринск, 1981);
6) научная конференция профессорско-преподавательского состава, научных сотрудников и аспирантов Плодоовощного института им. И.В. Мичурина "Научное обеспечение агропромышленного комплекса в условиях перехода к рыночным отношениям"(Мичуринск. - 1994).
7) XVI Мичуринские чтения "проблемы оценки исходного матери-
ада и подбора родительских пар в селекции плодовых растений" (Мичуринск. - 1995).
8) областная научно-практическая конференция "Сельскохозяйственное производство и высшая школа на переломном этапе реформирования" (Мичуринск. - 1996).
Публикация результатов исследований. Основные положения диссертации опубликованы в 21 печатной работе.
Объем и структура диссертации. Диссертация изложена на 256 страницах машинописного текста, состоит из введения, 9 глав, 3 приложений, выводов и методических рекомендаций по селекции плодовых и ягодных растений, содержит 61 таблицу и 12 рисунков. Список цитированной литературы включает 265 работ, в том числе 68 на иностранных языках.
МАТЕРИАЛ И МЕТОДЫ
Яблоня. Объектами исследований по яблоне являлись 11 сортов и 2 элитных сеянцев яблони. Были взяты 12 количественных показателей, характеризующих урожайность, размер растений и структуру кроны.
Учеты проводили в 1975, 1976 и 1977 гг. на деревьях посадки 1961 года. Деревья, на которых проводились учеты, обрезке не подвергались. Для анализа использовали только средние по сорту значения признаков. Средние значения для признаков "высота растений", "ширина кроны", "окружность штамба" вычисляли по результатам измерений 10 деревьев каждого сорта. Для получения средних значений по таким признакам, как побегообразовательная способность, пробудимость почек, площадь листьев, учеты проводили на 30-60 двухлетних веточках каждого сорта после окончания роста побегов. Средние значения остальных признаков вычислялись по данным на 4-6 учетных ветвях, расположенных на 3-4 деревьях.
Учеты по признакам "высота растений", "ширина кроны", "окружность штамба" автор проводил совместно с сотрудниками лаборатории генетико-статистических методов ВНИИГиШР им. И.В. Мичурина. Данные по остальным признакам были любезно нам предоставлены директором ВНИИГиСПР им. И. В. Мичурина, доктором сельскохозяйс-
твенных наук В.Е. Перфильевым и старшим научным сотрудником этого учреждения, кандидатом сельскохозяйственных наук A.B. Лебедевым..
Слива. По сливе использовали данные учетов 19 количественных признаков у 11 сортов. Учеты проводились на деревьях посадки 1966 года. По признаку "балл подмерзания" использовались данные за 1976 год, по признаку "ширина кроны" - за 1979 год, по остальным признакам брались средние значения за период от 2 до 8 лет.
Данные по 12 признакам были любезно предоставлены нам старшим научным сотрудником ВНИИГиСПР им. И.В. Мичурина, кандидатом сельскохозяйственных наук(д.Е. Курсаковои, а данные по остальным признакам получены нами совместно с В.Е. Перфильевым, A.B. Лебедевым, Й.Е. Курсаковой|.
Вишня. Объектом исследования явились 20 сортообразцов. Использовались данные по 18 количественным признакам. Учеты их проводили на деревьях посадки 1976 года. По признакам "высота дерева", "ширина кроны", "окружность штамба", "степень подмерзания цветковых почек" и "относительное количество (%) плодов на букетных веточках" использовали данные за 1982 год. По остальным признакам брали средние значения их за 2-3 года учетов(1980-1982 гг.). Учеты проводились нами совместно с В.Е. Перфильевым, A.B. Лебедевым, !Л.Е. Курсаковой.
Земляника. Для проверки способа вычисления вероятностей получения гибридов с заданными свойствами мы использовали данные по исходным формам и гибридам от скрещивания семи сортов земляники, любезно предоставленные нам заведующим лабораторией генетики ягодных культур ВНИИГиСПР им. И.В. Мичурина, доктором сельскохозяйственных наук A.A. Зубовым. У исходных сортов Белруби, Грена-дир, Зенга Зенгана, Редкоут, Реритан, Рубиновый Кулон, Фестивальная и гибридов от всех комбинаций скрещивания (кроме самоопыления) изучались три признака "средняя масса ягоды", "плотность мякоти", "содержание антоцианов в плодах".
Смородина. Для проверки метода прогнозирования результатов скрещивания, основанного на нечетких множествах, использовали данные по смородине, любезно предоставленные нам старшим научным сотрудником ВНИИГиСПР, кандидатом сельскохозяйственных наук В.А. Тихоновым. У исходных форм Бредторп, Зеленоплодная, Сеянец Астахова (Голиаф х Сеянец смородины черной), Фертоди, 94/3 (Приморс-
кий чемпион х Сандерс), 13-10 (Память Мичурина х Восход), К-1 (Память Мичурина х 34/3) и гибридов от скрещивания этих комбинаций изучались три признака "плодоношение", "величина ягоды", "одновременность созревания ягод".
Данные по яблоне, сливе и вишне обрабатывались методом главных компонент. Этот метод в последнее время находит все более широкое применение. Автором совместно с В.Е. Перфильевым разработаны методические вопросы использования метода главных компонент в селекционно генетических исследованиях плодовых растений [Перфильев и др., 1980, 1981а; Бутенко, 1981, 1989, 1996а; Бутенко и др., 1980, 19811. Изложению результатов этих исследований пссвя ш.ечы главы 3 - б настоящей работ.
Нами совместно с В.К. Перфильевым предложен принципиально новый подход к решению проблемы подбора родительских пар, основанный на вычислении вероятностей получения гибридов с заданным сочетанием количественных признаков [Перфильев, Бутенко, 1984; Перфильев, Бутенко, . ,5ов, 19881. В нем предполагается, что гмз-наки у гибридсь шеют многомерное нормальное распределение с вектором средних, равным полусумме значений признаков у родителей и ковариационной матрицей как у группы исходных форм. Изложение этого метода и результатов его проверки содержится з главе 5.
В главах 6-8 рассматривается предложенный автором принципиально новый подход к решению ряда задач селекции растений, основанный на использовании нечетких множеств [Бутенко, 1996а,Ь,с,д; Бутенко, Новопокровсий, 1994а,ЬЗ. Этот подход мы считаем наиболее перспективным, так как он позволяет обрабатывать информацию, представленную в привычной для селекционера форме -балльной или словесной. Признаки, измеренные в количественных шкалах, также можно перевести в бальную шкалу и обрабатывать с помощью теории нечетких множеств.
В главе 9 обсуждается предлагаемая автором концепция экспертной системы селекционера, которая позволит освободить селекционера от рутинной работы и сделать его труд более эффективным и целенаправленным.
- б -
Г Л А В А 1. ОСНОВНЫЕ НАПРАВЛЕНИЯ ИСПОЛЬЗОВАНИЯ МАТЕМАТИЧЕСКИХ МЕТОДОВ И ЭВМ В СЕЛЕКЦИИ ПЛОДОВЫХ И ЯГОДНЫХ РАСТЕНИЙ
В селекции плодовых и ягодных растении можно выделить три основных этапа: формулирование цели селекции и составление модели будущего сорта; подбор родительских пар для гибридизации; отбор перспективных гибридов и их испытание.
Основное внимание в диссертации уделяется методам подбора родительских пар. Анализ существующих методов показывает, что они подходят, в основном, для работы с чистыми линиями, так как не учитывают ращепления признаков в потомстве. Плодовые растения являются в высокой степени гетерозиготными вегетативно размножаемыми культурами. У них могут быть семьи с высоким средним значением признака, например, величиной плода, а среди гибридов не найдется ни одного подходящего. С другой стороны, могут быть семьи с низким средним звачением признака, однако в них может быть выделено хотя бы одно растение, которое даст начало сорту. Поэтому, при работе с такими растениями нужны методы, позволяющие прогнозировать распределение признаков у гибридов. В диссертации предлагается два таких метода.
Первый основан на вычислении вероятностей получения ценных гибридов в той или иной комбинации скрещивания по значениям количественных признаков у исходных сортов.
Второй - на использовании теории нечетких множеств для прогнозирования распределения признака у гибридов по его распределению у исходных форм.
Г Л А В А 2 СОПРЯЖЕННАЯ ИЗМЕНЧИВОСТЬ ПРИЗНАКОВ У БИОЛОГИЧЕСКИХ ОБЪЕКТОВ
Изменчивость и корреляции, присущие всем живым объектам, являются к тому же неразрывно связанными между собой явлениями. С одной стороны - нет корреляции там, где признаки не изменяются, с другой стороны - нет таких изолированных признаков, которые не были бы связаны в своей изменчивости с другими какими-то признаками. Поэтому более правильно рассматривать ?тк явления совместно. Термин "сопряженная изменчивость" как раз служит для их объединения.
В настоящее время растет число публикаций с применением многомерного статистического анализа для изучения сопряженной изменчивости признаков. Многомерные методы позволяют выделить в совокупности признаков независимые подсистемы тесно коррелирующих между собой признаков - корреляционные плеяды.
Понятие корреляционной плеяды было впервые введено П.В. Те-рентьевым [1959, 19603 и развито работах других исследователей [Берг, 1959. 1964; Шмидт, 1963; Вельдре. 1964; Выханду, 1964; Колосова, 1971, 1973, 1975; Егоров, 1979]I.
Корреляционная плеяда - это совокупность тесно взаимосвязанных признаков, обладающих некоторой независимостью от признаков, которые не входят в нее. Образование таких сопряженных комплексов признаков происходит под действием стабилизирующего отбора [Берг, 1964]. Важную роль при этом могут играть процессы гамети-ческой интеграции, приводящие к тому, что определенные аллели генов в галлотипах встречаются чаще, чем возможно при случайном комбинировании [Животовский, 1982, 19843.
Методы выделения к:., реляционных плеяд, предложенные П.В. Те-рентьевым и его последователями, просты и наглядны, но, как отмечают В.М Шмидт с соавторами [1978], не всегда обладают достаточной разрешающей способностью. 3 этих случаях более эффективны такие методы многомерного статистического анализа, как факторный анализ и анализ главных компонент, использованию одного из которых посвящены следующие 3 главы.
Г Л А В А 3. АНАЛИЗ ГЛАВНЫХ КОМПОНЕНТ КАК ИНСТРУМЕНТ ДЛЯ ИЗУЧЕНИЯ СОПРЯЖЕННОЙ ИЗМЕНЧИВОСТИ
Анализ главных компонент и факторный анализ. Почти во всех работах, где излагаются факторный анализ и анализ главных компонент, отмечается, что эти методы различны, хотя и решают сходные задачи. В факторном анализе преследуют цель ~ максимально объяснить корреляции, а в анализе главных компонент - дисперсии [Лоу-ли, Максвелл, 1967; Айвазян и др., 1974; КенДалл, Стьюарт, 1976; Иберла, 1980; Лиепа. 1980; Дубровский, 19823. Однако в прикладных исследованиях авторы часто не делают различия между указанными методами. Мы считаем, что правильнее все же рассматривать компо-
нентный и факторный анализы как два самостоятельных метода многомерного статистического анализа, обладающие примерно одинаковыми возможностями. Чтобы решить, какой из этих двух методов использовать, нужно упктмват!. цель, стоящую перед исследователем.
Если ставится задача: описать как можно проще структуру взаимосвязей ряда признаков заранее принятым числом Фгцсторов. то используют факторный анализ. За достижение такой простоты приходится "расплачиваться" неоднозначностью вычисления весов у факторов. Чтобы получить сравнимые результаты при решении сходных задач, приходится дополнительно вращать оси в факторном пространстве, пользуясь, как правило, эмпирическими критериями достижения оптимальной структуры. Все это приводит к дополнительным вычислительным трудностям. К тому же, в результате применения таких процедур часто факторы оказываются коррелированными. Приходится отступать от первоначального условия о независимых причинах.
При использовании главных компонент заранее не предполагается, каким числом их описать структуру взаимосвязей признаков. Это число выбирается по полученным результатам. Веса главных компонент вычисляются однозначно, и никакого дополнительного вращения здесь проводить нет необходимости. В анализе главных компонент точно вычисляются значения главных компонент, и их можно рассматривать как новые некоррелированные признаки. Значения же факторов находят с использованием множественного регрессионного анализа, поэтому они характеризуют объекты в среднем.
На наш взгляд, кроме симпатии авторов и сложившихся традиций нельзя указать никаких особых преимуществ для использования факторного анализа по сравнению с анализом главных компонент. Мы отдаем предпочтение анализу главных компонент по сравнению с факторным анализом, так как этот метод позволяет однозначно находить веса и значения главных компонент. Последние облегчают интерпретацию главных компонент, рассматривая значения главных компонент как новые некоррелированные признаки, можно находить корреляцию и строить регрессию по главным компонентам с какими-то другими показателями, не включенными в анализ. Регрессия по главным компонентам становится особенно важной, если первоначальные признаки, по которым проводят регрессионный анализ тесно коррелируют между собой.
Реальный смысл выделяемых главных компонент. Анализ главных компонент является статистическим методом и при его использовании могут возникнуть следующие вопросы: 1) если изменчивость и взаимосвязи признаков обусловлены некоторыми независимыми причинами, то будут ли разным причинам соответствовать разные компоненты, или последние являются некоторыми статистически независимыми показателями разбивающими корреляционную структуру даже тогда, когда в основе корреляций лежит всего одна причина; 2) анализ главных компонент позволяет для каждого объекта однозначно найти значения главных компонент. Являются ли эти значения индивидуальными характеристиками объекта или же они характеризуют всю совокупность изучаемых объектов.
Первый вопрос рассмотрим с двух сторон: а) независимые причины могут обусловливать корреляции между разными группами признаков, что приводит к образованию корреляционных плеяд. Поэтому сопоставим между собой плеяды и главные компоненты; б) независимые причины могут давать вклад в каждый коэффициент корреляции. Поэтому сопоставим вклады независимых причин и главных компонент.
В случае а) корреляционная матрица будет блочно-диагональной или близкой к ней. Тогда матрица весов также будет блочно-диаго-нальной или близкой к ней. С каждым блоком такой матрицы будет связана труппа признаков, тесно коррелирующих с какой-то главной компонентой. Эти же признаки будут тесно коррелировать между собой, поэтому они образуют корреляционную плеяду. Таким образом, если независимые причины обусловливают корреляции между разными группами признаков, то им соответствуют разные компоненты.
В случае б) проведенный нами анализ показывает, что если изменчивость каких-то признаков обусловливается одними и теми же двумя независимыми причинами, одна из которых дает больший вклад, чем другая, то первая причина будет объединять эти признаки в первой компоненте, а вторая причина - во второй. Так как вклады каждой из независимых причин могут в свою очередь являться вкладами нескольких независимых причин, то сделанный вывод можно распространить на несколько независимых причин.
Таким образом, на первый вопрос: будут ли независимым причинам соответствовать разные главные компоненты, следует ответить положительно.
Теперь рассмотрим второй вопрос: можно ли рассматривать значения главных компонент в качестве обычных признаков или они несут информацию о всей совокупности объектов?
Если представить многомерные наблюдения точками в р-мерном евклидовом пространстве(р - число признаков),то становится понятным, что в каждом таком наблюдении заключена как индивидуальная, так и групповая информация об объектах. Бри постоянном наборе объектов значения р признаков у какого-то объекта служат индивидуальной характеристикой этого объекта и никак не связаны со значениями этих же признаков у других объектов. Если же мы будем добавлять новые объекты или исключать из рассмотрения некоторые объекты, то конфигурация точек в р-мерном пространстве будет меняться, а поэтому будет меняться и относительное положение каждой точки, т.е. будет меняться характеристика объекта относительно остальной совокупности объектов. В этом случае будет проявляться групповая информация, заключенная в многомерных данных.
Главные компоненты при постоянном наборе объектов также являются их индивидуальными характеристиками, только в отличии от признаков большая доля информации содержится в первых нескольких компонентах. При изменении состава объектов, когда меняется конфигурация точек в многомерном пространстве, главные компоненты и признаки ведут себя по-разному. Если значения признаков у объектов не меняются(при изменении средних значений, дисперсий, кова-риаций и т.д.), то значения главных компонент пересчитываются у всех объектов даже при замене только одного объекта. Вопрос о том, сколь велики могут быть изменения значений главных компонент тесно связан с устойчивостью элементов выборочных ковариационной или корреляционной матриц. Хьюбер [19843 отмечает, что элементы этих матриц очень чувствительны к добавлению "выбросов", т.е. сильно уклоняющихся наблюдений. Применительно к селекционно генетическим исследованиям такая ситуация может наблюдаться в тех случаях, когда к растениям одного вида будут добавлены либо растения другого вида, либо мутанты, резко отличающиеся по своим признакам от общей массы растений. В любом случае изменение главных компонент будет оправдано, так как вводятся в рассмотрение новые источники изменчивости.
Устойчивость главных компонент мы исследовали на эмпиричес-
ком материале по яблоне. Оказалось, что веса и значения трех первых наиболее существенных главных компонент довольно устойчиво сохраняются при разных наборах учетных деревьев, а также при отбрасывании части признаков. Такое поведение главных компонент позволяет считать, что получаемые этим методом на основании выборочных данных результаты будут носить объективный характер.
Г Л А В А 4. ИСПОЛЬЗОВАНИЕ АНАЛИЗА ГЛАВНЫХ КОМПОНЕНТ В СЕЛЕКЦИОННО ГЕНЕТИЧЕСКИХ ИССЛЕДОВАНИЯХ ПЛОДОВЫХ И ЯГОДНЫХ РАСТЕНИЙ
Главные компоненты как параметры сопряженной изменчивости.
В таблице 1 приведены веса первых трех главных компонент. Первая главная компонента, объясняющая 34,4 % общего варьирования, тесно коррелирует с большинством признаков. Можно предположить, что эта компонента отражает действие факторов, ответственных за образование, накопление и распределение энергопластических веществ.
Вторая главная компонента, на долю которой приходится 22,2 7. общей изменчивости признаков, тесно связана с показателем интенсивности периодичности закладки цветковых почек. У сортов с высокими значениями этой компоненты сильнее проявляется полярность, выражающаяся в более интенсивном росте верхушечных побегов и образовании в основном розеток и коротких приростов. Такие сорта, как известно, склонны к периодичному плодоношению[Ро, 1929; Кобель, 195?; Метлицкий, 1955, 1973; Заец, 1955; Коломиец, 1966 и ДР-1.
С третьей компонентой тесно коррелируют признаки "средняя масса плода", "масса плодов на 1 м прироста предшествующего года", "число цветковых почек на 1 м пророста предшествующего года". На долю этой компоненты приходится 16,5 % общей изменчивости.
У оставьных главных компонент нет достаточно высоких по абсолютной величине весов. Так, например, самый большой вес, равный 0,48, у четвертой компоненты с признаком "средняя масса плода". Такой же вес имеет пятая компонента с признаком "процент приростов длиной 1-5 см".
Ценность метода главных компонент состоит в том, что он поз-
воляет описать изменчивость и взаимосвязи признаков сравнительно небольшим числом главных компонент, каждая из которых оказывается тесно связанной с некоторой группой признаков - корреляционной плеядой. Выделить плеяды по весам главных компонент достаточно просто. Для этого нужно брать, например, в одну плеяду признаки, имеющие наибольшие по абсолютной величине веса с какой-то одной главной компонентой.
Таблица 1 Веса трех первых главных компонент у яблони
Признак
Главная компонента
1
2
3
Площадь листьев на см прироста -0,89 -0,18 -0,05 текущего года Пробудимость почек Окружность штамба Побегообразовательная способность Ширина кроны
Интенсивность периодичности закладки цветковых почек Высота растений
Процент приростов длиной 1-5 см Средняя длина прироста Средняя масса плода Масса плодов на 1 м прироста
предшествующего года -0,49 -0,21 0,70
Число цветковых почек на 1 м
прироста предшествующего года -0,56 0,27 0,66
-0,80 0,25 -0,12
0,76 0,50 0,18
0,79 -0,16 0,01
0,66 0,39 0,41
-0,03 0,83 -0,33
0,24 0,75 0,27
0,47 -0,63 0,16
0,45 -0,52 -0,28
0,16 -0,32 0,75
Так признаки "площадь листьев на 1 см прироста текущего года", "пробудимость почек", "окружность штамба", "побегообразовательная способность" и "ширина кроны" имеют максимальные по абсолютному значению веса с первой главной компонентой. Вторую плеяду составляют признаки "интенсивность периодичности закладки цветковых почек", "высота растений", "процент приростов длиной 1-5 см", "средняя длина прироста". Они имеют максимальные по абсолютной величине веса со второй компонентой. Наконец, признаки "средняя
масса плода", "масса плодов на 1 м прироста предшествующего года", "число цветковых почек на 1 м прироста предшествующего года" наиболее тесно коррелируют с третьей главной компонентой. Признаки в таблице 1 расположены в порядке убывания абсолютных значений весов соответствующей компоненты. Добавление последующих компонент не дало бы ничего нового в отношении такого разбиения признаков, поскольку веса этих компонент с каждым из признаков ниже по абсолютной величине, по крайней мере, одного из весов первых трех компонент. Поэтому можно ограничиться рассмотрением лишь тех главных компонент, которые необходимы для разделения изучаемых признаков на плеяды, а остальные главные компоненты считать несущественными для данного набора признаков. Каждая существенная главная компонента является показателем наличия соответствующего сопряженного комплекса признаков, а ее веса характеризуют степень сопряженности признаков этого комплекса с главной компонентой и друг с другом.
Главные компоненты как обобщенные характеристики генотиличе-ских особенностей сортов плодовых растений. Значения главных компонент можно использовать в качестве обобщенных признаков. Мы рассмотрели две группы сортов яблони, соответственно с низкими и высокими значениями первой глав пой компоненты, и оказалось, что эти группы можно отнести к двум типам сортов, согласно известной классификации сортов яблони по особенностям роста и плодоноше-нияСАлешин, 1933; Белохонов и др., 1939; Рыбаков, 1956; Гельфанд-бейн, 1965; Резниченко, 1969].
В таблице 2 приведены значения некоторых признаков у указанных двух сортов. Значения первой компоненты у остальных 7 сортов из изучавшихся 13 близки к среднему ее значению.
У первой группы сортов(с низкими значениями первой компоненты) наблюдается низкая побегообразовательная способность и высокая пробудимость почек. Такие сорта относят к сортам типа Грушовки Московской. У второй группы сортов(с высокими значениями первой компоненты) - высокая побегообразовательная способность и низкая пробудимость почек. Это сорта типа Аниса. Известно также, что у сортов типа Грушовки Московской образуется больше плодов на коротких приростах, чем у других типов сортов. В подтверждение этого мы приводим в таблице 2 данные по признаку "процент плодов
на приростах более 5 см" (этот признак не был включен в анализ главных компонент), из которых видно, что действительно у первой группы сортов намного ниже процент плодов на длинных приростах, чем у второй группы.
Таким образом, значения первой главной компоненты являются количественным выражением особенностей роста и плодоношения сортов яблони, т.е. могут служить обобщенными характеристиками этих особенностей. Различия между сортами по указанному комплексу признаков прежде всего обусловлены особенностями образования, накопления и распределения энергопластических веществ. Подобный анализ второй и третьей главных компонент позволяет считать их также объективными характеристиками генотипических особенностей этой культуры.
Таблица 2 Значения некоторых признаков у двух групп сортов яблони с крайне различным проявлением первой главной компоненты
Груп- 1-ком- Побего- Пробу- Процент
понен- образо- димость плодов на
па та ватель- почек, приростах
Сорт ная % более 5 см
способность, %
Бессемянка Мичуринская -1, ,84 15,2 55,5 9,5
1 Антоновка Обыкновенная -1, ,58 19,6 58,9 8,8
Коричная Китайка -1, ,38 10,6 62,1 4,6
Пепин Шафранный 0, ,91 39,7 45,8 27,0
2 Бельфлер-китайка 0, ,98 31,9 44,7 31,0
Звездочка 1, .13 34,4 40,4 42,0
Наглядным подтверждением того, что главные компоненты отражают генотипические особенности растений, могут служить результаты анализа главных компонент у вишни СБутенко и др., 1987].
Первая главная компонента, тесно связанная с большинством признаков, объясняет 35,9% общей изменчивости. У нее положительные веса - с высотой дерева, относительным количеством букетных веточек, средней массой плода, вкусом плодов и отрицательные - с поражаемостью коккомикозом. Такой комплекс признаков характерен
для черешни, поэтому у сортообразцов, полученных с участием черешни, следует ожидать более высокие значения этой компоненты. Действительно, у сортов Краса Севера и Любительская, полученных с участием черешни, наблюдаются высокие значения первой главной компоненты. Чтобы более точно выразить связь главных компонент с геномом, нужно дать какую-то количественную оценку степени проявления в каждом сорте геномов разных видов, при участии которых сорт получен.
8 таблице 3 приведены степени фенотипического проявления с сортах вишни геномов вишни обыкновенной, черешни, вишни степной и вишни пенсильванской. Эти оценки были произведены старшими научными сотрудниками ВНИИСиГПР имени В. И.Мичурина ¡JLE. "Курсаковои] и A.B. Лебедевым по внешнему виду растений на основании более 20 морфологических признаков и с учетом происхождения.
Таблица 3 Степень фенотипического проявления в сортах вишни геномов разных видов
Степень проявления генома
Сорт вишни черешки вишни вишни
обыкно- степной пенсильван-
венной ской
Аморель розовая 3/4 1/4 _ _
Владимирская 1 - - -
Добрач 1 - - -
Жуковская 3/8 5/8 - -
Идеал - - 7/8 1/8
Комсомольская 5/8 1/4 1/8 -
Краса Севера 3/8 5/8 - -
Незябкая 1/2 1/4 1/4 -
Памяти Вавилова 1/2 1/2 - -
Плодородная Мичурина 3/4 - 1/4 -
Подарок 50-летию Октября 7/8 - 1/8 -
Полевка 1/4 - 3/4 -
Северянка 5/8 1/4 1/8 -
Черноокая 1 - - -
Ширпотреб черная 5/8 3/8 - -
Элита N 4-10 1 - - -
Народная 3/4 1/4 - -
Винная 3/4 1/4 - -
Любительская 1/2 1/2 - -
Степной орел 1/2 1/4 1/4 -
Рассматривая столбцы таблицы 3 в качестве количественных характеристик геномного состава сортообразцов, мы вычислили коэффи-
•2
О Черноокая
Добрая0
1
О - Вишня обыкновенная ф • Черешня
■ Вишня степная
© • Вишня
пенсильванская
3 Ширпотреб черная
0Аморель розовая
Степной орел^
Любительская ф
Элита .IV 4-10 „
Народкзяф Владимм]
ф Винная (!) Полевка
О
Жуковская (Ъ 3 Памяти
Вавилова
Северянка
О) Подврок 50-лвти»о Октября ^^ ^ Незябкая
Идеал Плодородная Мичурина
Комсомольская
Рис. 1. Распределение сортов вишни & осях I и VI гла&ных «компонент
циенты корреляции их с шестью главными компонентами. Наибольшие по абсолютной величине коэффициенты получены с первой и шестой главными компонентами.
Первая главная компонента имеет тесную положительную корреляцию с долей генома черешни (коэффициент корреляции равен 0,810) и отрицательнуто корреляцию с долей генома вишни степной (коэффициент корреляции равен -0,579). Поэтому сорта, близкие по геному к черешне, будут иметь высокие значения первой компоненты, а сорта близкие к вишне степной, - низкие. Действительно, как уже отмечалось, высокие значения первой компоненты имеют вишне-черешневые гибриды Краса Севера и Любительская. Также высокие значения этой компоненты у сортов Памяти Вавилова и Жуковская, которые являются сеянцами,мичуринских сортов, но многие относят их к виш-не-черешневым гибридам. Самые низкие значения первой компоненты имеют Идеал и Полевка, в геномном наборе которых высокая доля степной вишни.
Шестая компонента положительно коррелирует с долек генома вишни обыкновенной (коэффициент корреляции равен 0,453) я отрицательно коррелирует с признаками вишни степной (коэффициент корреляции равен -0,437).
Следовательно, в плоскости первой и шестой компонент сорта, имеющие разный геномный состав, должны разделяться. На рисунке 1 сорта с долей генома черешни (Краса Севера, Любительская, Памяти Вавилова, Жуковская) располагаются в правой полуплоскости, а сорта с большой долей генома вишни степной (Идеал, Полевка, Плодородная Мичурина) - в левой полуплоскости, внизу. Сортообразцы Владимирская, Добрая, Элита N 4-10, полученные от вишни обыкновенной, по значениям первой компоненты занимают где-то промежуточное положение и несколько смещены вверх по оси шестой компоненты.
Таким образом, уже несколько первых главных компонент заключают в себе достаточно большую долю информации об изучаемых формах и позволяют группировать близкие по происхождению сорта.
Г л а в а 5. ИСПОЛЬЗОВАНИЕ МНОГОМЕРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА ДЛЯ ПОДБОРА РОДИТЕЛЬСКИХ ПАР
Подбор пар по главным компонентам. Поскольку главные компоненты можно рассматривать как характеристики генотипических особенностей, есть основания полагать, что их можно использовать для выявления лучших комбинаций скрещивания при селекции на комплекс признаков.
Так как каждый признак можно представить линейной комбинацией главных компонент, то его значение (относительно среднего уровня) у какой-нибудь Форш равно сумме вкладов, даваемых главными компонентами (вклад главной комоненты равен произведению ее значения на вес и на стандартное отклонение рассматриваемого признака).
Можно предположить, что в комбинациях со значительно различающимися вкладами главных компонент в какой-нибудь признак возможно появление трансгрессивных по этому признаку гибридов (как с положительной, так и с отрицательной трансгрессией). Выделяя лучшие комбинации по отдельным признакам, можно затем взять общие комбинации у которых возможно получение трансгрессивных гибридов по комплексу признаков.
Изложенный метод еще нуждается в проверке и против него могут быть возражения. Основное возражение может вызвать предположение о независимом комбинировании главных компонент. Этот вопрос достаточно подробно рассмотрен нами в третьей главе, где показано, что есть веские основания для такого предположения. Конечно, при этом вовсе не предполагается, что у гибридов значение каждой компоненты должно быть равно ее значению у одного из родителей. Возможны все промежуточные варианты, и наряду с трансгрессивными могут получаться гибриды с промежуточными значениями признаков. Оценить, какова вероятность получения именно трансгрессивных гибридов, этим методом невозможно. Но мы все же считаем, что изложенный метод можно использовать для ориентировочной оценки комбинаций скрещивания, так как он в конечном счете сводится к идее выбирать наиболее различающихся родителей для получения трансгрессивных гибридов. А этот подход уже имеет положительные результаты в селекционной практике. Достаточно отметить, что И.В.
Мичурин для получения гибридов с отличающимися от родителей свойствами широко использовал географически и систематически удаленные исходные формы.
Прогнозирование результатов скрещивания по комплексу количественных признаков. У плодовых растений благодаря вегетативному размножению начало сорту дает один сеянец. Отсюда следует, что лучшими комбинациями скрещивания у них являются те. в которых с большей частотой появляются гибриды, удовлетворяющие предъявляемым требованиям. Поэтому наиболее полной и объективной оценкой родительских пар с точки зрения достижения желаемого результата можно считать вероятность получения от них гибридов с нужным сочетанием признаков.
Оценками таких вероятностей для разных комбинаций скрещивания могут служить соответствующие частоты, которые нетрудно рассчитать по значениям признаков у потомства. Однако этот путь малопригоден. Известно, что сеянцы многих плодовых пород поздно вступаю" в плодоношение и для получения данных о некоторых важнейших признака"., например о качестве плодов и урожайности растений, а следовательно, и для выявления лучших комбинаций скрещивания требуется довольно продолжительное время. Для повышения эффективности селекционной работы важное значение имеет разработка способов нахождения вероятностей без использования данных по потомству.
Нами совместно с В.Е. Перфильевым был предложен способ вычисления для разных комбинаций скрещивания вероятностей получения гибридов, у которых интересующие селекционера признаки находились бы в заданных пределах [Перфильев, Бутенко, 1984; Перфильев, Бу-тенко, Зубов, 1988]. Способ основан на предположении, что совместное распределение признаков у гибридов каждой комбинации подчиняется многомерному нормальному закону с вектором средних, равным полусумме векторов значений признаков у родительских форм. Чтобы избежать использования данных по потомству, было предложено ковариационную матрицу рассчитывать по средним значениям признаков у группы исходных форм. Эта группа по возможности должна представлять собой репрезентативную выборку.
Вероятность того, что значения признаков ха, хг, .... хт У гибридов, полученных при скрещивании к-го и 1-го сортов будут на-
ходиться в заданных пределах а1<хг<Ь1, аг<хг<Ь2, ат<хП1<Ьт
можно выразить многомерным интегралом Р-1а1<Х1<Ь1, а2<Х2<Ьг, .... ат<х1л<Ьгп> = Ъг Ьщ
- (2^«п/2|с|1/2 I I" • I ехР(^"ХК1)Т С_1 сх-хк1)ах^х2...йхт, аа а2 ат (1)
где X - вектор-столбец с координатами XI, х-г, ..., х^; Хк1 - вектор-столбец средних значений признаков у гибридов; С - матрица ковариаций между признаками; |С|- определитель матрицы С.
С целью проверки предложенного способа нами для 21 комбинации скрещивания земляники были вычислены вероятности получения гибридов, у которых средняя масса ягоды была бы не менее 10 г, содержание антоцианов в ягодах не ниже 50 мг%, плотность мякоти (усилие, при котором происходит повреждение ягоды) не меньше 8 г/мм2. Ковариационную матрицу рассчитывали на основании средних значений признаков у 20 сортов. Как у исходных форм, так и у гибридов признаки учитывали на третьем году жизни растений. Среднюю массу ягоды у сортов определяли путем взвешивания, а у гибридов глазомерно. Содержание антоцианов во всех случаях оценивали с помощью специальной шкалы [Зубов, Станкевич, 19793. Плотность мякоти измеряли прибором, дающим показатели в г/мм2.
Рассчитанные вероятности получения гибридов, отвечающих,указанным выше требованиям, были сопоставлены с соответствующими частотами (табл. 4).
Чтобы выразить результаты сравнения одним показателем, мы вычислили коэффициент ранговой корреляции по Спирмену, оказавшийся равным 0,753, что существенно отличается от нуля при уровне значимости 0,01. Средние значения частот и вероятностей также оказались близкими - 0,352 и 0,332. Из 10 лучших комбинаций по вероятности 8 оказались лучшими и по частотам. Все это свидетельствует о том, что предложенный способ сравнительно неплохо решает вопрос о вычислении вероятностей получения гибридов с заданными признаками и позволяет делать прогнозы о селекционной ценности разных комбинаций скрещивания.
Таблица 4
Сопоставление эмпирических частот с рассчитанными вероятностями в разных комбинациях скрещивания у земляники
Комбинация Число Частота Вероят-
скрещивания растений ность
х Гренадир х Зенга Зенгана Редкоут х Белруби х Редкоут х Реритан Гренадир Белруби
Рубиновый кулон Рубиновый кулон Зенга зенгана х Рубиновый кулон Рубиновый кулон Рубиновый кулон Зенга зенгана х Зенга зенгана х Рубиновый кулон х Фестивальная Редкоут х Гренадир Гренадир х Белруби Зенга Зенгана х Реритан Фестивальная х Гренадир эеритан х Редкоут Фестивальная х Белруби Зеритан х Белруби эеритан х Гренадир Фестивальная х Зенга Зенгана Фестивальная х Рерита-5едкоут х Белруби >естивальная х Редкоут
151 320 571 662 689 153 192 86 491 539 126 70 358 370 442 233 340 355 146 120 245
0,927 0,666 0,567 0,486 0,484 0,477 0,458 0,450 0,401 0,386 0,357 0,357 0,340 0,324 0,258 0,223 0,108 0,045 0,041 0,025 0,008
0,598 0,525 0,313 0,639 0,634 0,481 0,300 0,321 0,489 0,343 0,365 0,183 0,177 0,213 0,180 0,231 0,2x7 0,143 0,088 0,359 0,167
Г Л а в а 6. ПРЕДСТАВЛЕНИЕ КОЛИЧЕСТВЕННОГО ПРИЗНАКА В ВИДЕ 1ЕЧЕТК0Г0 МНОЖЕСТВА
Измерения признаков. Любая область исследования имеет свой редмет, т.е. определенные объекты, в изучении свойств которых и остоит цель исследования. В селекции растений объектами являются орта и гибридные формы растений, а свойствами -. те • признаки, лагодаря которым такие растения возделываются человеком. Изуче-ие начинается прежде всего с измерения признаков, т.е. выражения к в цифровой форме. Для этого используются различные типы шкал, экие как шкалы интервалов, отношений, порядка, наименований(но-«нальная шкала).
Из рассмотренных типов шкал на одном полюсе находится шкала {тервалов как самая богатая, а на другом - шкала наименований зк самая бедная. Шкалы интервалов и отношений являются количест-шными шкалами, а шкалы порядка и наименований - качественными
шкалами.
В одной и той же области исследований, у одних и тех же объектов могут встретится признаки, измеренные в разных шкалах, что затрудняет совместный их анализ,поскольку для каждой шкалы требуются специфические методы обработки. Для устранения этих затруднений существуют два противоположные по направленности подхода.
Один из них состоит в приведении всех признаков к более грубой шкале, что обычно приводит к потере части информации, заключенной в данных. Кроме того, в настоящее время более развиты методы обработки количественных признаков, поэтому существует также другой подход, в котором признаку, измеренному в шкале наименований и порядка приписываются некоторые числовые значения и он становится числовым. Этот процесс называется оцифровкой.
При использовании оцифровки, какими бы совершенными математическими методами она ни проводилась, возникает проблема привнесения в преобразованные данные информации, которая может не отражать отношения между объектами, измеренными в слабых шкалах. Поэтому последующая статистическая обработка может вылиться в бессмысленные оперирование с цифрами. Основное назначение оцифровки состоит в том, чтобы приспособить имеющиеся данные, измеренные в слабых шкалах, к методам, которые были разработаны для количественных шкал. Нам кажется более привлекательным приспосабливать не данные к методам обработки, а методы к данным.
Нечеткие множества и балльные признаки. Согласно сложившемуся в естественных науках и математике взгляду обычно отвергают как ненаучные всякие неопределенные, неясные, нечеткие и неточные понятия. Поскольку и в обыденной жизни, и при проведении исследований очень часто приходится сталкиваться с такими понятиями, то хотелось бы подвергнуть их научному анализу. При работе с растениями встречается масса признаков, которые можно оценить только глазомерно. В этом случае исследователь вынужден работать с нечеткими понятиями.
Для оперирования с такими понятиями в 1965 году Л.А. Заде была предложена теория нечетких множеств, которая в настоящее время интенсивно развивается и находит применение в таких областях. как медицинская диагностика, инженерное искусство, системное моделирование, процесс управления, психология, лингвистика и др.,
то есть там, где участие человека в получении исходной информации и ее оценке является неотъемлемым.Быстро растет число публикаций в этой области. Выходит международный журнал Fuzzy Sets and Systems, однако работ на русском языке еще очень мало. В основном они посвящены отдельным аспектам использования нечетких множеств.
Если задано распределение признака по баллам, то его можно рассматривать как нечеткое множество. Так, например, если при использовании трехбалльной шкалы у какого-то сорта доля особей с одним баллом равна pi, с двумя баллами - рг, с тремя баллами - рз (Р1+Р2+Рз=1). го эти данные можно записать как нечеткое множество A»{pi/1; рг/2; рз/3>. Числа рьрг и Рэ будут степенями принадлежности баллов 1,2,3 соответственно к нечеткому множеству А. Вместо цифр 1,2,3 в качестве элементов множества А можно брать любые другие числа, расположенные в том же порядке или лингвистические переменные, например, следующие: низкие значения признака, средние значения, высокие значения.
Таким образом, для изучения балльных признаков можно использовать аппарат теории нечетких множеств. Но нечеткие множества пригодны не только для описания признаков. По нашему мнению, сами растения можно считать нечеткими системами. Действительно, растению приходится функционировать в сложной, постоянно меняющейся среде, когда добавляются новые, ранее не существовавшие в природе факторы антропогенного воздействия. Адаптация в этих условиях была бы невозможной, если растение реагировало бы на все мельчайшие средовые изменения и не способно бы было выделять какие-то существенные особенности в состоянии среды. На самом деле растение как бы "не различает" многочисленные количественные изменения средовых факторов, реагируя в основном на крупные, качественные воздействия. Так, у многих растений существует свой ограниченный набор механизмов адаптации, поэтому на различные стрессовые ситуации они вынуждены часто реагировать одинаково.
Таким образом, теория нечетких множеств, по нашему мнению, является наиболее адекватным и перспективным аппаратом для исследования биологических объектов, у которых большая изменчивость и нечеткость в функционировании являются неотъемлемыми свойствами.
Г Л А В А 7. ИСПОЛЬЗОВАНИЕ НЕЧЕТКИХ МНОЖЕСТВ ДЛЯ ПРОГНОЗИРОВАНИЯ РЕЗУЛЬТАТОВ СКРЕЩИВАНИЙ ПО ОТДЕЛЬНЫМ ПРИЗНАКАМ
Нечеткая модель наследования. Если сорт представляет клон, как, например, у плодовых растений, то естественно считать, что генотипические значения признака у всех его представителей одинаковые, поэтому такому генотипу будет соответствовать нечеткое множество, в котором степень принадлежности какой-то градации XI равна единице, а остальных нулю. Так, при трех градациях признака генотипу с низким проявлением признака будет соответствовать нечеткое множество АИ1/Х1; О/хг; 0/хз>, будем обозначать для краткости такой генотип через хь Аналогично, генотипы со средним и с высоким проявлением признака будем обозначать через хг и хз соответственно.
Результаты скрещивания генотипов XI и х^ можно также представить в виде нечеткого множества Р-^х/Хг; {¿/хг; Гз/хзК где
Г2• ~ доли гибридов с генотипическим проявлением признака XI, хг и хз соответственно. Данные по скрещиванию разных генотипов можно объединить в одну матрицу скрещиваний X, записывая в строки этой матрицы степени принадлежности гибридов от скрещивания генотипов XI х XI, XI X Х2, XI X Хз, Х2 X Х2, Х2 х Х3, хз х хз. Таким образом, для трех градаций признака матрица X будет иметь б строк и три столбца. Для к градаций - к(к+1)/2 строк и к столбцов. Все элементы матрицы X неотрицательны и сумма элементов каждой строки равна единице. Такие матрицы называются стохастическими.
При известной матрице X можно получить прогноз результатов скрещивания по фенотипам. Так например, если скрещиваются два сорта, фенотипическое проявление признака у которых можно представить нечеткими множествами Аа»-(р1/Х1; рг/хг; рз/хз> и А2-<Я1/Х1; чг/хг; чз/хз> соответственно, то фенотипическое проявление признака у гибридов будет описываться нечетким множеством Т, получаемым следующим образом. Из Р1 и qj составляется вектор-строка (>141, Р1Ч2+Р2Ч1, Р1ЧЗ+РЗЧ1, Р2Ч2. P2qз+Pзq2, Рздз). которая умножается на X слева. В результате получается вектор-строка (Ъх, Ьг, 1з) , значения которой будут степенями принадлежности элементов хь хг, хз, т.е. Т={11/Х1; t2/X2; ^.з/хз>. Если
Р1+Р2+Рз=1 и 41+42+43=1, то автоматически будет выполняться условие Прогноз для скрещиваний А^хДо и Аг^Ах будет при таком подходе одинаковым.
Если будет п комбинаций скрещивания, то для них можно построить матрицу А размера п х 6, каждая строка которой соответствует одной комбинации и получается из фенотипических значений степеней принадлежности родительской пары как описанная вектор-строка из А\ и Аг- Тогда произведение матриц АХ дает матрицу В размера п х 3, в каждой строке которой содержаться степени принадлежности для гибридов данной комбинации скрещивания. Таким образом, получаем матричное уравнение:
АХ=В. (2)
Все матрицы в уравнении (2) стохастические.
Задача состоит в том, чтобы найти матрицу скрещиваний X. Нами получена матрица скрещиваний для разного числа локусов в предположении полимерной гипотезы наследования количественного признака СБутенко, 19943.
Получение матрицы скрещиваний в случае полимерного наследования. Для получения матрицы скрещиваний нужно исходить из какой-то модели количественного признака. Так, в рамках полимерной модели в случае двух локусов с аллелями А и а , В и Ь , если считать, что вклады доминантных аллелей равны единице, а рецессивных - нулю, то для генотипов ааЬЬ, АаЬЬ, ааВЬ, АаВЬ, ААЬЬ, ааВВ, ААВЬ, АаВВ, ААВВ будем иметь значения признака 0, 1, 1, 2, 2, 2, 3, 3, 4 соответственно. Если будем относить к классу х^ генотипы со значением признака 0, к классу хг - генотипы со значением признака 1, к классу хз - генотипы со значением признака 2, к классу Х4 - генотипы со значением признака 3, к классу Х5 - генотипы со значением признака 4, то можно получить распределение признака для каждой комбинации скрещивания. Так, например, для скрещивания генотипов с нечетким множеством
М1= {1/Х1-, 0/Х2; О/Хз; 0/Х4", 0/Х5 > (для краткости обозначим XI * хз, ) нужно проанализировать результаты скрещиваний ааЬЬ х ааЬЬ. В этом случае ь потомстве нет расщепления и все гибриды имеют генотип ааЬЬ, т.е. попадают в класс XI. Таким образом, для гибридов от скрещивания генотипов ааЬЬ х ааЬЬ получим также нечеткое множество М}. Для скрещивания геноти-
лов о нечеткими множествами
М1 = и/хг, О/хг; 0/хз: 0/Х4: О/Ч^Ь Мг = <0/хг; 1/хг; 0/хз; 0/Х4; 0/Х5> (для краткости обозначим хх * хг ) нужно проанализировать результаты скрещиваний ааЬЬ х АаЬЬ или ааЬЬ х ааВЬ. В первом случае по-1 1
лучим расщепление - ааЬЬ + - АаЬЬ , а во втором случае -112 2
- ааЬЬ + - ааВЬ. Оба случая дают множество со степенями принад-2 2
лежности |1 - <0,5; 0,5; 0,0; 0,0; 0,0>. Аналогично можно получить степени принадлежности для гибридов других комбинаций скрещивания.
В общем случае, когда рассматривается N локусов ( 2N аллелей) , весь диапазон изменения признака от 0 до 2Ы разбиваем на 5 частей (при пяти градациях признака)точками = 2М/5, йг - 4Ы/5, с!з = бИ/5, <14 = 8Я/5 , округляя их, относим к классам XI, хг, хз, Х4, Х5 соответственно генотипы, признаки которых попадают в промежутки СО.сЮ, [с^.йг),Мг,с1з). Мз.сЦ) Дс14,2М). Тогда каждый класс XI будет содержать несколько генотипов и для получения степеней принадлежности гибридов комбинащлг Xi * х^ нужно проанализировать результаты скрещиваний для всех генотипов, входящих в эти классы и взять средние значения степеней принадлежности.
Мы произвели расчеты на ЭВМ для разного числа локусов, от 2 до 9 при частоте доминантного аллеля р » 0,5. С ростом числа локусов происходит некоторая стабилизация степеней принадлежности.
Для большего числа локусов такой непосредственный расчет и на ЭВМ становится затруднительным из-за большой его продолжительности. Чтобы обойти указанные трудности мы вывели формулы, выражающие зависимость математического ожидания и дисперсии полимерно наследуемого количественного признака у гибридов от значений признака у родителей. После этого, аппроксимируя биномиальное распределение нормальным, легко получить степени принадлежности как вероятности попадания в соответствующие интервалы нормально распределенной случайной величины.
Указанным способом была получена матрица скрещиваний для разного числа локусов(от 2 до 1000). С ростом числа локусов, начиная примерно с 300 локусов, степени принадлежности полностью стабилизируются.
Влияние сцепления локусов. В полимерной модели, как известно, предполагается, что локусы не сцеплены, поэтому хотелось бы выяснить: изменятся ли результаты при учете сцепления локусов. Однако модель со сцеплением чрезвычайно сложна для аналитического исследования, а непосредственный машинный расчет, как уже отмечалось, даже в случае полимерного наследования возможен лишь для малого числа локусов. Поэтому мы ограничились выяснением: насколько чувствительны элементы матрицы X при изменении вектора рекомбинации в четырехлокусной компьютерной модели.
В компьютерном эксперименте каждый генотип был представлен двумя числами, двоичная запись которых, состоящая из нулей и единиц, задавала положение рецессивных и доминантных аллелей каждого из четырех локусов двух гомологичных хромосом. Доминантный аллель давал вклад в признак, равный 1, а рецессивный - 0. Вклад зиготы принимался равным сумме гамет и вклады локусов суммировались. Эта модель отличалась от полимерной только учетом сцепления между ло-кусами.
Пусть п- вероятность рекомбинации между i-м и i+1-м локуса-ми. Для четырех локусов будет три числа ri.ro и гз, каждое из которых заключено между 0 и 0,5. Эти числа образуют вектор рекомбинации г={Г'1,Г2,гз>. Для каждого родителя на ЭВМ имитировали ме-йоз. Обмен между гомологичными участками при расхождении хромосом происходил с частотами, задаваемыми вектором рекомбинации. При слиянии гаметных наборов получаем генотипы потомков. Какой-либо отбор на гаметном или зиготном уровне не проводился.
При четырех локусах значения признака будут изменяться от О до 8. генотипы со значениями признака 0-2 относили к классу xi, со значениями 3-5 - к классу хг и со значениями 6-8 - к классу хз. Было взято 9 генотипов с признаками от 0 до 8, при скрещивании которых получали частоты для гибридов 45 комбинаций скрещивания (45=6-9/2). От каждой родительской пары получали по 120 гибридов. Группировкой 9 родителей по трем классам и объединением соответствующих частот у гибридов получали частоты для 6 комбинаций xixxi, xi>4<2, Х1ХХ3. Хг*хо. хохх?, У3ХХ3. Нормирование этих частот по каждой строке давало матрицу скрещиваний X.
Матрица X была получена для 10 разных векторов рекомбинаций, элементы которых выбирались как случайные числа, равномерно расп-
ределенные на отрезке СО; 0,5]. Как оказалось, влияние вектора рекомбинации на степени принадлежности значительно и им нельзя пренебрегать. Возможно, что с ростом числа локусов, контролирующих признак, влияние коэффициентов рекомбинации уменьшится, но проверка этого предположения затруднительна.
Следует ожидать также, что результаты будут б значительной степени зависеть от частот генотипов в популяции и многих других факторов. Поэтому, если даже удается из теоретических соображений получить матрицу скрещиваний, ее необходимо уточнять на основании имеющегося гибридного материала.
Оценка параметров нечеткой модели наследования по опытным данным. Рассматривалась возможность оценки матрицы X непосредственно из уравнения (2) при известных матрицах А и В. Эти матрицы будут известны, если имеются в наличии данные по интересующему признаку у исходных форм и гибридных комбинаций, полученных от этих форм. Количество комбинаций должно быть больше числа строк матрицы X. Получив оценку X из имеющихся данных, можно будет затем прогнозировать результаты скрещивания для других родительских пар.
Оценка матрицы X из уравнения (2) подобна задаче регрессионного анализа, но здесь еще накладывается ограничение: матрица X должна быть стохастической. Эту задачу мы решали в два этапа. Вначале проводили обычный регрессионный анализ, а затем для полученной с помощью него матрицы искали ближайшую стохастическую матрицу, минимизируя сумму квадратов отклонений элементов матриц.
Для проверки метода использовали данные по смородине, любезно предоставленные нам старшим научным сотрудником НИИГиСПР имени В.И. Мичурина, кандидатом сельскохозяйственных наук В.А.Тихоновым. Были взяты следующие 3 признака: плодоношение, величина ягоды и одновременность созревания ягод. Учеты проводились в 1988 и 1989 годы. В таблице 5 представлены экспериментальные и полученные по полимерной модели степени принадлежности для признака "плодоношение"(1 балл - урожай до 0,5 кг с куста, 2 балла - урожай с 0,5 до 1,5кг с куста. 3 балла - урожай более 1,5 кг с куста). Аналогичные результаты получили и по другим признакам. Соответствие между экспериментальными и теоретическими данными получилось неплохим. Были также рассчитаны степени принадлежности
Таблица
Экспериментальные и полученные из полимерной модели степени принадлежности для признака "плодоношение" у гибридных семей
смородины
N л /а Комбинация Экспериментальные Теоретические
( 1 2 3 1 2 3
1 Бредторп х Бредторп 0,65 0,25 0,10 0.64 0.33 0,03
2 >> х Зеленоплодная 0,79 0,19 0,02 0,65 0,32 0,03
3 » х К-1 0,73 0,21 0.06 0,66 0.31 0,03
4 >> х Сеян.Астахова 0,80 0.18 0,02 0,74 0,25 0.01
5 >> х Фертоди 0,66 0.25 0,09 0,66 0,31 0,03
6 >> х 94/3 0,68 0,32 0,00 0,71 0,27 0,02
7 » х 13-10 0,60 0,32 0,08 0,55 0,41 0,04
8 Зеленоплодная х К-1 0,78 0,21 0,01 0,68 0,30 0,02
9 >> X С.Астахова 0,81 0.19 0,00 0,75 0,24 0,01
10 >> х Фертоди 0,59 0.32 0,09 0.66 0.31 0,03
11 >> X 94/3 0,66 0,26 0,08 0.72 0,26 0,02
12 >> х 13-10 0,72 0,26 0,02 0,70 0,28 0,02
13 К-1 х Сеянец Астахова 0,85 0,15 0,00 0,77 0,22 0,01
14 >> х Фертоди 0,58 0,33 0,09 0,69 0,29 0,02
15 » X 94/3 0,83 0,15 0,02 0,84 0,16 0,00
16 Сеян.Астахова х Фертоди 0,78 0,20 0,02 0,75 0,24 0,01
17 » X 94/3 0,88 0.11 0,01 0,82 0,17 0,01
18 » X 13-10 0,78 0,22 0,00 0,63 0,35 0,02
19 Фертоди х Фертоди 0,85 0,13 0,02 0,68 0,30 0,02
20 » х 94/3 0,57 0,29 0,14 0,73 0,25 0,02
21 >> х 13-10 0,62 0,23 0,15 0,56 0,40 0,04
22 94/3 х 94/3 0,76 0,18 0,06 0,80 0,19 0,01
23 >> х 13-10 0,64 0,16 0,20 0,62 0,35 0,03
24 13-10 х 13-10 0,52 0.28 0,20 0,45 0,49 0,06
восстановлением матрицы X из уравнения (2), однако соответствие с экспериментальными данными получилось несколько хуже, чем для полимерной модели.
Г Л А В А 8. ОПЕНКА СЕМЕЙ ПО КОМПЛЕКСУ ПРИЗНАКОВ
Одинаковые по значимости признаки.После получения прогноза результатов скрещивания по отдельным признакам нужно бывает провести оценку семей по совокупности признаков. Такая же задача возникает, если мы просто хотим упорядочить группу сортов по степени выраженности у них признаков. Разница лишь в том, что в первом случае получаем данные из прогноза, а во втором - в результате учетов.
Для упорядочивания сортов и семей по степени проявления признака обычно используют средние баллы, считая при этом, что чем больше у сорта средний балл, тем выше у него степень проявления признака. Однако, как показано в работе (Орлов, 1985), использование среднего балла математически некорректно, так как сорта, упорядоченные по среднему баллу в одной балльной шкале, могут стать неупорядоченными при монотонно возрастающем преобразовании такой шкалы.
Оценку сортов по комплексу признаков обычно проводят с помощью индексов, то есть линейных комбинаций признаков. Если признаки выражены в баллах, то использование индексов становится также неправомерным.
Для решения указанной задачи мы использовали метод нечетких отношений. Чтобы упорядочить сорта по одному признаку, введем отношение предпочтения Ри, каждый элемент которого Рп (хк.хх) выражает степень превосходства балла хк над баллом XI или насколько хк лучше XI у сравниваемых 1-го и ]-го сортов. Элементы р^ являются степенями принадлежности отношения Р^.
Возьмем для степени принадлежности отношения предпочтения функцию Р1з(хр,хч) = ш(хр- хч), где хр и хр - значения баллов у Ьго и з-го сортов, а ш нормирующий множитель, который определим позже. В этом случае она тем больше, чем больше различие по баллам у сравниваемых сортов.
Проиллюстрируем этот метод на примере. Пусть признак у двух сортов представлен в виде нечетких множеств:
А1=<0,25/1; 0,25/2; 1/3> и А2=-Ш,38/1; 0,13/2;1/3>. Строим произведение множеств А1 х Аг . Для чего каждую степень принадлежности А1 сравниваем с каждой степенью принадлежности Ао и выбираем меньшую, тогда получим:
1 2 3
1
Аг X А2 = 2 3
0.25 0,13 0,25 0,25 0.13 0.25 0.38 0.13 Г.00
Находим отношение предпочтения Р12. Значение ри(хп.хп) имеет смысл находить только для хр>ха:
1 2 о
1 0 0 0
2 1 ñ n
3 2 1 О
]
Отношение Peí записывается аналогично Pi» с заменой хР на xq и xq на хр. Находим пересечение полученных множеств:
12 3
1
Pl2n(Aj X А2) =2 3
0,00 0.00 0.00 0,25 0,00 о;оо
0,76 0,13 0,00
Лля нахождения элементов этого множества нужно перемножить соответствующие элементы Р12 и Ai х Ао. Б качестве степени принадлежности. отражающей превосходство сорта Ai над сортом ho, выбирается наибольший элемент полученного множества. Он равен 0,7бш. Степень принадлежности, отражающая превосходство сорта Аг над сортом Aj, будет наибольшим элементом множества P2in(Ai х Аг) и равна 0,50т.Таким образом, из двух сравниваемых сортов первый предпочтительнее второго по рассматриваемому признаку.
В работе [Борисов и пр.,19903, откуда взята идея метода, не указывается как упорядочить им более чем два нечетких множества. Мы для этого использовали метод Саати [Саати, 19793, в котором в качестве функции принадлежности используется собственный вектор некоторой матрицы парных сравнений. Обозначим эту матрицу через В, а ее элементы через bjj. В качестве bi2 и bji берем полученные максимальные элементы пересечений Pi2n(Ai х Аг) и Pßi^CAi х Аг) соответственно. Для получения Ьц нужно сравнить множество Ai с собой и ?\\ ваять такой же как Р12, тогда получим Ьц=0,50ш. Теперь можно выбрать нормирующий множитель ш так. чтобы Ьц было равно единице, таким образом, т=1/0,5=2,00 и bj2=0,76/0,5=1,52; b2i=0,50/0,50=1. Точно также можно найти другие элементы матрицы 3, используя отношения предпочтения Рц, совпадающие с Р12, а Рл, совпадающие с Р21 и выбирая нормирующие множители так, чтобы диагональные элементы матрицы В были равны единице. Вычисляя собственный вектор полученной матрицы В. соответствующий наиболь-нему собственному значению, и нормируя так. что наибольший его 'элемент равен единице, получим упорядочивание сортов по рассматриваемому признаку.
Чтобы упорядочить сорта не по одному, а по нескольким признакам, нужно проделать для всех признаков аналогичные вычисления и перемножить соответствующие элементы собственных векторов, найденных для каждого признака. Полученный таим образом вектор будет упорядочивать сорта по совокупности признаков.
Изложенным способом мы провели упорядочение по 3 признака« (плодоношение, величина ягод, одновременность созревания) у гибридных комбинаций смородины, рассмотренных в предыдущей главе. Вначале упорядочили комбинации по экспериментальным данным, а затем - по прогнозируемым из полимерной модели данным и результатам, полученным с помощью восстановления матрицы скрещиваний из опытных данных. В таблице б представлены ранги полученных упорядочивающих векторов. Комбинации упорядочены по экспериментальным
Ранги трех способов упорядочения гибридных комбинаций смородины
Таблица 6
Комбинация
По опытным По поли- По восста-данным мерной новленной модели матрице
Зеленоплодная х 13-10
К-1 х 94/3
Бредторп х Фертоди
Бредторп х 94/3
94/3 X 13-10
Фертоди х 94/3
К-1 х Фертоди
13-10 х 13-10
Фертоди х Фертоди
Бредторп х К-1
Фертоди х 13-10
Зеленоплодная х Фертоди
Зеленоплодная х 94/3
Бредторп х Бредторп
Бредторп х 13-10
Сеян. Астахова х Фертоди
94/3 X 94/3
Зеленоплодная х К-1
Бредторп х Зеленоплодная
Зеленоплодная х Сеян.Астахова
Бредторп х Сеян.Астахова
Сеян.Астахова х 13-10
Сеян.Астахова х 94/3
К-1 х Сеян.Астахова
8 9 10 11 12
13
14
15
16
17
18
19
20
21
22
23
24
1 2 3
4
и
7
2 8 9 22 10
4
13
5 1
6 3
11 18
14
15
16 17
7 20
23
24 12 19 21
15 1 9
23 10
4
11
17 19 14
18 Б
16 13 24 22 21
6 20 12
8 3
7
данным. Из десяти .лучших комбинаций >? оказались лучшими и за основании обеих моделей. Коэффициент ранговой корреляции 0пирмена
для полимерной модели оказался равным 0.606, а для модели с восстановленной матрицей - 0,410.
Задание приоритета для признаков. Для того, чтобы придать некоторым признакам большее значение, нужно после вычисления собственных векторов, упорядочивающих сорта(семьи) по каждому признаку. умножить полученные столбцы на некоторые веса . Эти веса находят с учетом оценок важности(табл.7). По этой таблице
Таблица 7
Шкала оценок важности признаков
Относительная важность 1-го признака по сравнению с ,1-м Элемент Г^
Равная важность 1
Немного важнее 3
Важнее 5
Промежуточные значения 2,4
строим матрицу парных сравнений Г размера к х к (к - число признаков). Ее элементы удовлетворяют следующим соотношениям: Гн=1;
Затем как и для матрицы В находим наибольшее собственное значение 1шах матрицы Р и соответствующий собственный вектор и, который нормирован так, что сумма его компонент равна единице. Тогда а1«к*н.
Г Л А В А 9. ПОСТРОЕНИЕ ЭКСПЕРТНОЙ СИСТЕМЫ СЕЛЕКЦИОНЕРА НА ОСНОВЕ НЕЧЕТКИХ МОДЕЛЕЙ
Назначение экспертной системы и основные ее блоки. В настоящее время селекционер должен многое знать и уметь: он должен разбираться в агротехнике и физиологии той культуры, с которой работает, уметь проводить статистическую обработку экспериментального материала и планировать на ее основе новые скрещивания. В целях получения более точного прогноза результатов селекции постоянно приходится совершенствовать и. как правило, усложнять используемые математические методы. Для правильного применения этих методов селекционер должен разбираться в них, а это непросто даже для специалиста-математика, не принимавшего участие в разработке и адаптации методов к данной культуре. Трудности не снимаются даже
при наличии компьютера с готовыми программными средствами. Поэтому возникает необходимость в создании такой программы, по которой компьютер сам бы проводил всю необходимую обработку и выдавал селекционеру рекомендации. Такие программы называются экспертными системами.
Логическим завершением представленного в диссертации подхода к решению селекционных задач с использованием нечетких множеств должна стать, на наш взгляд, экспертная система селекционера. Можно, конечно, всю обработку данных производить без экспертной системы, используя отдельные программы, как это мы и делали. Но при таком подходе селекционер должен работать в постоянном контакте с разработчиком программ, иначе ему придется вникать в вычислительные и алгоритмические тонкости, чтобы избежать ошибок при манипуляции с разными программами, а это значительно снижает круг пользователей.
Экспертная система должна стать помощником и советчиком селекционера. избавляя его от рутинной работы и оперативно снабжая информацией для принятия правильного решения.
В настоящее время экспертные системы чаще отроятся универсальными. Такую систему легко перепрофилировать после соответствующего обучения. Здесь рассматривается концепция узкоспециализированной экспертной системы, способной оказывать помощь при подборе родительских пар для гибридизации. Такая система еще не создана, но отдельные программы, которые могут быть ее блоками, есть. Мы считаем, что такую систему можно создать на базе СУБД типа CLARION или CLIPPER с развитым внутренним языком программирования и возможностью компиляции программных продуктов.
рассмотрим принципиальную схему экспертной системы (рис.2ь Для ее работы необходимо заполнить базу данных сортов (БДС) и базу знаний (БЗ). Эти базы затем периодически пополняются новой информацией. В БДС (блок 7) заносят информацию по каждому учитываемому признаку у всех сортов, находящихся в распоряжении селекционера. Сорта должны произрастать в одном регионе, желательно на одном участке, чтобы сравнимы были средовые условия.
каждый сорт в БДС по каждому признаку должен быть представлен в виде нечеткого множества M»-ipi/Xi; P2/X0; Рк/Хк> и P1+p2+-•.+Pk«l. В этом случае степени принадлежности pi, ро.
Рк можно рассматривать как доли растении данного сорта нием признака XI, хо> • • • .• хк соответственно.
проявле-
Нет
1. Формудишвание залания | и приоритетов |
2. Система готова к прогнозированию ?
¥
3. Ввод-вывод дополнительной инфошации КЗ
А А А
4 4 4
» 4. База знаний (БЗ)
Да
5. Получение матрицы скрещиваний
11. Ранжирование и выдача списка перспективных комбинаций
Да Г
12. Необходима дополнительная информация ?
1 Нет
6. Ввод-ВЫВОД !
дополнительной <1 информации ВДС I I
&
I
А
4
7. База данных сортов (БДС)
АДА
4 4 4
Да
8. Прогноз по каждому признаку
9. Ввод-вывод дополнительной информации БДОГ
10. Ваза данных ожидаемых гибридов (.БДОГ)
13. Конец решения задачи
Рис.2. Принципиальная схема экспертной системы
В БЗ каждая запись содержит информацию в виде нечетких множеств по каждому из родителей и по гибридной семье. Признаки и нормировка нечетких множеств такая же как в БДС.
В БДС и БЗ может содержаться еще и другие сведения, например, информация о происхождении и районировании. Такие данные экспертной системой не учитываются, но они могут оказаться полезными при окончательном выборе родительских пар для скрещивания. Для ввода и вывода дополнительной информации предназначены специальные интеррейсы (блоки 6 и 3 соответственно), которые позволяют работать с БДС и БЗ как с автономными базами данных.
Работа с экспертной системой (ЭС) начинается с формулировки задания и приоритетов (блок 1). При этом можно задать идеал (образец), к которому должны быть близкими перспективные комбинации, или не задавать его, если предполагать у потомства проявления признаков в максимальной или минимальной степени. Можно отдавать предпочтение каким-то признакам или нет и в соответствии с этим устанавливать приоритеты. Все эти вопр" "ы подробно рассмотрены в предыдущей главе. В этом же блоке устанавливается количество перспективных комбинаций для выдачи на экран или принтер.
Для получения прогноза результатов скрещивания по каждому выбранному признаку нужно знать матрицу скрещивания X. Блок 2 проверяет:найдены ли эти матрицы. Если таких матриц нет или они были найдены до очередного пополнения БЗ, то по имеющейся в БЗ информации строятся исходная матрица А и матрица гибридов В и изложенным в главе 4 способом находится матрица X (блок 5).
При известных матрицах скрещиваний для каждого выбранного признака строятся исходные матрицы по всем комбинациям сортов, информация о которых находится в БДС, и находится матрица гибридов (блок 8). По этой информации строится (блок 101 база данных ожидаемых гибридов (БдОГ). Она имеет такую же структуру, как и БЗ, но в отличии от последней информацию по гибридам содержит пDoгнoзиDveмvю. а не Фактическую.
Ин!рормация БДОГ используется для упорядочения комбинаций по векторному критерию К с учетом выбранных приоритетов и выдается список перспективных комбинаций (блок 11).
Прежде чем закончится работа (блок 13), система спрашивает о потребности ь дополнительных сведениях (блок 12') и в случае ее
наличия отсылает к соответствующей базе данных.
ВЫВОДЫ
1. При изучении сопряженной изменчивости количественных признаков у плодовых растений весьма перспективно использование анализа главных компонент. По весам главных компонент достаточно просто выделять совокупности наиболее тесно связанных между собой признаков (корреляционные плеяды). Значения первых, наиболее существенных, главных компонент являются интегральными показателями, отражающими генотипические особенности сортов плодовых растений.
2. Первую главную компоненту у яблони и сливы, сопряженную с большинством признаков, можно интерпретировать как проявление факторов образования, накопления и распределения знергопластичес-ких веществ. Остальные главные компоненты связаны с отдельными группами признаков и отражают такие свойства растений, как полярность, продуктивность, качество плодов.
3. Первая главная компонента у вишни имеет тесную положительную корреляцию с долей генома черешни (коэффициент корреляции равен 0,810)и отрицательную корреляцию с долей генома вишни степной (коэффициент корреляции равен -0,579). Шестая компонента положительно коррелирует с долей генома вишни обыкновенной (коэффициент корреляции равен 0,453) и отрицательно коррелирует с признаками вишни степной (коэффициент корреляции равен -0,437). Следовательно, в плоскости первой и шестой компонент сорта, имеющие разный геномный состав, разделяются: сорта с долей генома черешни (Краса Севера, Любительская, Памяти Вавилова, Жуковская) располагаются в правой полуплоскости, а сорта с большой долей генома вишни степной (Идеал, Полевка, Плодородная Мичурина) - в левой полуплоскости, внизу. Сортообразцы Владимирская, Добрая, Элита N 4-10, полученные от вишни обыкновенной, по значениям первой компоненты занимают где-то промежуточное положение и несколько смещены вверх по оси шестой компоненты.
4. Анализ главных компонент можно использовать при подборе таких комбинаций родительских форм, в которых возможно появление гибридов с трансгрессивным проявлением признаков. Трансгрессия наиболее вероятна в комбинациях скрещивания тех сортов, у которых вклады соответствующих главных компонент в признаки существенно
различаются.
5. Предложен способ вычисления вероятностей получения гибридов с заданным сочетанием количественных признаков. Он основан на предположении, что признаки у гибридов имеют многомерное нормальное распределение с вектором средних, равным полусумме значений признаков у родителей и ковариационной матрицей как у группы неходких форм. Проверка этого метода на гибридах земляники дала вполне удовлетворительные результаты.
6. При использовании признаков, измеренных в разных шкалах, предлагается переходить к балльной шкале как наиболее универсальной и привычной для селекционера.
7. Показано, что балльный признак можно рассматривать как нечеткое множество. В этом случае доли растений с тем или иным баллом являются степенями принадлежности нечеткого множества. Для изучения таких признаков весьма перспективно применять аппарат интенсивно развивающейся в настоящее время теории нечетких множеств.
8. В рамка* полимерной модели наследования получена зависимость представленного нечетким множеством признака у гибридов от генотипических значений такого признака у родителей. Показано, что с ростом числа локусов, контролирующих признак, эта зависимость стабилизируется.
9. Предложена модель наследования, позволяющая прогнозировать представленный нечетким множеством признак у гибридов по фе-нотипическим значениям такого признака у родителей. Проверка этой модели на гибридах смородины дала удовлетворительные результаты.
10. Предложен основанный на нечетких отношениях способ оценки гибридных семей и сортов по комплексу балльных признаков. Чтобы упорядочить сорта по одному признаку, вводили отношение предпочтения, каждый элемент которого выражает степень превосходства баллов у сравниваемых двух сортов или форм. По этим данным строится матрица парных сравнений, собственный вектор которой, соответствующий наибольшему собственному значению, дает упорядочение сортов по рассматриваемому признаку. Для упорядочения сортов по нескольким признакам, нужно проделать для всех признаков аналогичные вычисления и перемножить соответствующие элементы собственных веторов, найденных для каждого признака. Полученный таким
образом вектор будет упорядочивать сорта по совокупности признаков. В рассматриваемом методе можно учесть неодинаковую значимость различных признаков, заданием соответствующих приоритетов.
11. Показано, что с формальной точки зрения у плодовых растений задачу подбора родительских пар для получения гибридов с желаемым проявлением признаков можно рассматривать как задачу принятия решений при нечеткой исходной информации.
12. Предлагается концепция основанной на теории нечетких множеств экспертной системы, способной оказывать помощь при подборе родительских пар для гибридизации. Такая система должна стать помощником и советчиком селекционера, избавляя его от рутинной работы и оперативно снабжая информацией для принятия правильного решения.
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИЙ ПО СЕЛЕКЦИИ ПЛОДОВЫХ И ЯГОДНЫХ РАСТЕНИЙ
1. Для выявления лучших комбинаций скрещивания следует использовать вероятности получения гибридов с заданным сочетанием количественных признаков, которые можно рассчитать с помощью предлагаемого нами способа на основании данных о соответствующих признаках у исходных сортов.
2. Для прогнозирования результатов скрещивания по балльным признакам предлагается использовать разработанный нами метод, позволяющий предсказывать распределение балльного признака у гибридов по его распределению у родителей.
3. Для оценки сортов и гибридных семей по комплексу балльных признаков следует использовать предлагаемый нами способ, основанный на нечетких отношениях.
ЭКОНОМИЧЕСКАЯ ЭФФЕКТИВНОСТЬ
Экономическая эффективность от внедрения разработок достигается за счет сокращения затрат на создание сорта. Если известна вероятность р получения гибрида с заданным сочетанием признаков, то вероятность того, что среди г. сеянцев будет хотя бы один такой гибрид равна 1-(1-р)п. Отсюда можно получить оценку для числа сеянцев п, необходимых для того, чтобы с вероятностью, например,
0,99 подучить хотя бы один гибрид, удовлетворяющий предъявляемым требованиям. Это число равно ~2/lg(l-p). Оценивая среднюю вероятность по всем комбинациям и среднюю вероятность по группе лучших комбинаций, на основании данных по гибридным семьям земляники и смородины мы получили, что происходит сокращение числа сеянцев в 1,4 - 1,8 раз за счет выбора лучших комбинаций по сравнению со средними. Примерно во столько же раз сокращаются расходы на создание сорта за исключением расходов на сортоиспытания. Трудно дать точную оценку эффекта в денежном выражении из-за постоянно меняющихся расценок, поэтому выясним хотя бы какого порядка будет эта величина.
На один сорт яблони в среднем приходится Ю - 20 тысяч сеянцев, для размещения которых требуется площадь в 2 - 3 га. Возьмем для определенности 2 га. По данным ВНИИГиСПР им. И.В. Мичурина и ВНШС им. И.В. Мичурина средние годовые затраты на содержание 1 га молодого сада с учетом его закладки в ценах 1S94 года приблизительно равны 5 млн. руб. Этот сад нужно содержать в среднем около 15 лет до вступления в плодоношение, следовательно, расходы на содержание составят около 150 млн. руб. К этому нужно прибавить еще столько же на заработную плату селекционеру и лаборантам.
Таким образом, на сорт яблони по минимальным оценкам требуется около 300 млн. руб. в ценах 1994 года. Эффект от внедрения составит 300 - 300/1,5-100 млн. рублей на 1 сорт. Фактически этот эффект может оказаться значительно большим, если из-за ограниченности площади не удастся в заложенном селекционном саду выделить ни одного подходящего гибрида. Будут потрачены средства и время. С использованием прогнозирования за счет целенаправленного подбора родительских пар можно повысить вероятность получения гибридов с заданным сочетанием признаков , то есть интенсифицировать селекционный процесс.
Основные работы по теме диссертации
Перфильев В.Е., Бутенко А.И. Изучение количественных признаков у
яблони методом главных компонент//Генетика. - 1980а.- Т.16. -
N 8.. - С. 1447-1452.
Бутенко д.И,, Перфильев В.Е. Компонентный анализ ( анализ главных компонент)//Методические рекомендации по применению статистических методов в генетике и селекции плодовых растений. - Мичуринск, 1980. - С.110-119.
Перфильев В.Е., Бутенко А.И., Кондратов В.Т. Выявление особенностей географических рас облепихи методом главных компонент// Всесоюзная конференция "Экологическая генетика растений и животных": Тез. докл. - Кишинев:Штиинца, 1981.- 4.1.- С.178-179.
Бутенко А.И. Исследование взаимосвязи между признаками методом главных компонент// Всесоюзная конференция молодых ученых-биологов "Биологические аспекты изучения и рационального использования животного и растительного мира": Тез. докл. - Рига. -1981. - С.11-12.
Перфильев В.Е., Бутенко А.И., Лебедев A.B.. Курсакова Л.Е., Смирнов А.Г. Исследование количественных признаков у плодовых и ягодных растений методом главных компонент //Тр. ЦГЛ им. И.В. Мичурина. - 1981а. - С. 90-100.
Перфильев В.Е., Лебедев A.B., Курсакова Л.Е., Бутенко А.И. К вопросу о подборе родительских пар для гибридлзации у сливы // Вкзл.научн. информации ЦГЛ им. И.В. Мичурина. - 19816.- Вып.37. С. 20-23.
Бутенко А.И., Перфильев В.Е. Исследование взаимосвязи между признаками методом главных компонент// Областная научная конференция "Развитие научного наследия И.В. Мичурина": Тез. докл.-Мичуринск. - 1981. - С.47-48.
Перфильев В.Е., Бутенко А.И. Вычисление вероятностей получения гибридов с заданными свойствами в разных комбинациях скрещивания плодовых растений//Вестник сельскохозяйственной науки.-1984. - N 7. - С. 112-117.
Бутенко А.И. Выявление генотипических особенностей плодовых растений методами многомерного статистического анализа:Автореф. дис. ...канд. биол. наук. М, 1986. - 17 с.
Лебедев A.B., Перфильев В.Е., Курсакова Л.Е., Бутенко А.И., Чуча B.C. Обобщенный показатель расстояния и подбор пар вишни// Плодоовощное хозяйство. - 1987. - N 2. - С.35-37.
Бутенко А.И., Курсакова Л.Е., Перфильев В.Е., Лебедев A.B. Выявление генотипических особенностей сортов вишни методом главных
кшлокент//Вшлетень научной информации ИГЛ им. И.В. Мичурина.
1987. - ВЫП.45. - С.52-57.
Перфильев В.Е.. Бутенко А.И., Зубов А.А. Вычисление вероятностей получения гибридов с заданными признаками в разных комбинациях скрещивания плодовых и ягодных растений//Доклады ВАСХНИЛ.-
1988. - N 6. - С. 19-20.
Бутенко А.И. Методические рекомендации по применению анализа главных компонент в генетике и селекции плодовых растений. -Мичуринск. - 1989. - 40 с.
Бутенко А.И. Использование математических методов и ЭВМ в селекции плодовых и ягодных растении// Математическое моделирование в садоводстве. - Мичуринск. - 1990. - С.3-7.
Бутенко А.И. Использование нечетких множеств для прогнозирования результатов скрещиваний в случае полимерно наследуемого количественного признака//Генетика. - 1994. - Т.30.- N 1. - С.133-137.
Бутенко А.И., Новопокровский B.C. Нечеткие множества и шкалирование количественного прианака в селекции растений//Доклады Россель хозакадемии. - 1994а. - М 5. - С.7-8.
Бутенко А.И., Новопокровский B.C. Построение оптимальной шкалы количественного признака в селекции растений// Научная конференция профессорско-преподавательского состава, научных сотрудников и аспирантов Плодоовощного института им. И. В. Мичурина "Научное обеспечение агропромышленного комплекса в условиях перехода к рыночным отношениям": Тез. докл. - Мичуринск. -1994Ь. С.85-86.
Бутенко А.И. Математические методы и компьютерные модели в селекции плодовых и ягодных растений. - Мичуринск. 1996а . - 87 с.
Бутенко А.И. Подбор пар как задача принятия решений//Сельскохо-зяйственное производство и высшая школа на переломном этапе реформирования: Материалы областной научно-практической конференции 21 - 22 марта 1996 г. 4.1. Плодоводство. - Мичуринск. -1996Ь. - С.81-83.
Бутенко А.И. Упорядочивание сортов и гибридных форм плодовых и ягодных растений по комплексу балльных признаков//Сельскохо-зяйственное производство и высшая школа на переломном этапе реформирования: Материалы областной научно-практической конфе-
ренции 21 - 22 марта 1996 г. 4.1. Плодоводство. - Мичуринск. -1996с. - С.83-85.
Бутенко А.И. Прогнозирование балльных признаков у гибридов плодовых и ягодных растений//Сельскохозяйственное производство и высшая школа на переломном этапе реформирования: Материалы областной научно-практической конференции 21 - 22 марта 1996 г. 4.1. Плодоводство. - Мичуринск. - 1996с1. - С.85-87.
- Бутенко, Анатолий Иванович
- доктора сельскохозяйственных наук
- Мичуринск, 1996
- ВАК 06.01.05
- Донорские свойства яблони
- Совершенствование методики оценки морозостойкости сортов яблони
- Эколого-генетические основы селекции яблони на зимостойкость
- Биологические особенности сливы и селекционное решение проблемы сортимента Среднего Поволжья
- Основные параметры адаптивности новых сортов груши селекции ВСТИСП