Бесплатный автореферат и диссертация по биологии на тему
Разработка методов автоматического определения количественных характеристик опушения листа
ВАК РФ 03.01.09, Математическая биология, биоинформатика

Автореферат диссертации по теме "Разработка методов автоматического определения количественных характеристик опушения листа"

На правах рукописи

ГЕНАЕВ МИХАИЛ АЛЕКСАНДРОВИЧ

РАЗРАБОТКА МЕТОДОВ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ КОЛИЧЕСТВЕННЫХ ХАРАКТЕРИСТИК ОПУШЕНИЯ ЛИСТА

03.01.09 Математическая биология, биоинформатика

Автореферат диссертации на соискание ученой степени кандидата биологических наук

1 4 МАР 2013

005050598

Новосибирск

2013

005050598

Работа выполнена в лаборатории эволюционной биоинформатики и теоретической генетики Федерального государственного бюджетного учреждения науки Институт цитологии и генетики СО РАН, г. Новосибирск, Россия.

Научный руководитель: кандидат биологических наук, доцент Афонников Дмитрий Аркадьевич

Официальные оппоненты: Ратушняк Александр Савельевич, доктор биологических наук,

зав. лабораторией "Биомедицинская информатика" Федеральное государственное бюджетное учреждение науки Конструкторско-технологический институт вычислительной техники СО РАН, г. Новосибирск

Дорогина Ольга Викторовна,

доктор биологических наук, профессор,

зав. лабораторией интродукции редких и исчезающих видов

растений

Федеральное государственное бюджетное учреждение науки Центральный сибирский ботанический сад СО РАН, г. Новосибирск

Ведущее учреждение: Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Санкт-Петербургский государственный политехнический университет, г. Санкт-Петербург

Защита диссертации состоится «2.?» ¡Аа^ТЧ 2013 г. на утреннем заседании диссертационного совета Д 003.011.01 по защите диссертаций на соискание ученой степени кандидата наук, на соискание ученой степени доктора наук в ИЦиГ СО РАН в конференц-зале Института по адресу:

630090, г. Новосибирск, проспект ак. Лаврентьева, 10, т./ф. (383)363-49-06, факс (383) 333-12-78, e-mail: dissov@bionet.nsc.ru.

С диссертацией можно ознакомиться в библиотеке ИЦиГ СО РАН. Автореферат разослан « ^ » \zyiUAJ 2013 г.

Ученый секретарь диссертационного совета, доктор биологических наук

Т.М. Хлебодарова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Аетуальность проблемы. Одной из ключевых проблем современной биологии — изучение взаимосвязи между генотипом и фенотипом у живых организмов, в том числе растений. Для определения взаимосвязей между генотипом и фенотипом при анализе комплексных признаков применяются компьютерно-экспериментальные подходы, основанные на методе картирования генов, контролирующих количественные признаки (quantitative trait loci, QTL). Эти подходы основаны на статистическом анализе комбинаций молекулярных маркеров и фенотипических данных (Shavrukov et al., 2010; Kearsey, 1998).

Одной из эффективных технологий, позволяющей получать массовым образом данные о последовательностях маркеров в геноме отдельно взятого организма, является секвенирование нового поколения. Эта технология ориентирована на прочитывание коротких фрагментов нуклеотидных последовательностей (30-200 п.н.), но в массовом порядке и с высокой степенью покрытия, что позволяет идентифицировать в геноме последовательности большого количества маркеров одновременно (Mardis, 2008). Таким образом, высокопроизводительное генотипирование (получение большого пула данных по ДНК-маркерам) в анализе взаимосвязи генотип-фенотип сейчас не является проблемой, как это было еще 10-20 лет назад. В этой связи становится актуальным массовое получение данных по фенотипам растений. Именно поэтому область исследований в биологии, связанная с получением данных о фенотипических признаках растений в массовом порядке (высокопроизводительное фенотипирование), сейчас получает все большее развитие (Eberius et al., 2009).

Совокупность фенотипических признаков организма в последнее время стали называть «феном» (по аналогии с геномом), а область науки, которая посвящена его анализу - феномика (Houle et al., 2010; Furbank et al., 2011). В основе технологий высокопроизводительного фенотипирования растений лежат методы оцифровки морфологических признаков. Разработка быстрых и относительно точных методов автоматического определения фенотипических признаков необходима для проведения экспериментов по исследованию взаимосвязи генотипа и фенотипа, основанных на анализе тысяч растений (Benfey et al., 2008, Ajjawi et al., 2010; Brachi et al., 2010). Если ранее для фенотипирования применялись механические средства (весы, рулетка, штангенциркуль), то в настоящие время появляются технологии, позволяющие получать фенотипические характеристики в автоматическом режиме на основе методов цифровой обработки изображений. Основное преимущество таких технологий — максимальное исключение человека из процесса оценки какого либо признака. Это позволяет: (а) существенно ускорить процесс получения данных за счет автоматизации; (б) увеличить точность оценки фенотипических параметров, устранив субъективизм и неточность измерений, присущих человеку; (в) получать оценки новых характеристик фенотипа, наблюдение или

оценка которых ранее были недоступны (например, параметры микроскопических органов растений).

Один из важных фенотипических признаков растений - опушение. Опушение формируется совокупностью эпидермальных образований, которые называются трихомами, и имеет большое физиологическое значение для растения. Оно может защищать растение от вредителей и агрессивного воздействия окружающей среды, влияя на микроклимат вблизи поверхности листа, регулируя такие параметры как влажность, температуру. Трихомы некоторых растений могут синтезировать, накапливать и секретировать различные метаболиты (Schilmiller et al., 2008). К числу метаболитов, секретируемых трихомами, относятся терпены, производные фенилпропаноидов, метилкетоны, флавоноиды и др., часть из них используются в фармацевтике, пищевой промышленности, парфюмерии. Таким образом, трихомы служат своеобразными «химическими фабриками» по производству ценных продуктов для биохимии и биотехнологии. Между тем в настоящие время в мире не существует технологии высокопроизводительного фенотипирования этого признака. Существующие методы оценки опушения растений или достаточно дороги и трудоемки или не дают необходимой точности.

Цель и задачи исследования. Целью работы является разработка метода автоматического определения количественных характеристик опушения листьев растений на основе анализа цифровых микроизображений их сгибов, и сравнительный анализ количественных характеристик опушения листа у растений яровой пшеницы и табака, как модельного растения.

Для достижения заявленной цели были поставлены следующие задачи:

1) Разработать алгоритм автоматической оценки количественных характеристик опушения листа на основе анализа цифровых микроизображений его сгибов у пшеницы и табака.

2) Создать компьютерную программу для анализа количественных характеристик опушения листа пшеницы и табака.

3) Провести массовый анализ количественных характеристик опушения листа сибирских и европейских сортов пшеницы.

4) Провести анализ взаимного расположения трихом на поверхности листа у различных сортов пшеницы.

5) Провести анализ количественных характеристик опушения листьев табака на примере линии SRI и ее генетически-модифицированных вариантов.

6) Разработать интегрированную систему для хранения и анализа данных по взаимосвязи фенотипических признаков растения, генотипа и окружающей среды на примере пшеницы.

Научная новизна работы. В работе предложен метод автоматического определения количественных характеристик опушения листьев растений на основе анализа цифровых микроизображений их сгибов. Метод адаптирован для анализа опушения у пшеницы и табака. Данный метод реализован в программе LHDetect2, доступной в качестве web-сервиса, что впервые позволило обеспечить возможность фенотипирования растений с

использованием сети Интернет. Впервые проведен массовый анализ количественных характеристик опушения листьев пшеницы для нескольких десятков сортов и выявлены их различия у сибирских и европейских сортов. На основе анализа распределений расстояний между ближайшими трихомами выявлены различия в распределении коротких и длинных трихом на поверхности листа для 4 сортов мягкой пшеницы. Впервые проведено сравнение количественных характеристик опушения листьев растений табака Nicotiana tabacum L. линии SRI и ее генно-модифицированных линий, несущих трансгенную конструкцию, ингибирующую экспрессию гена пролиндегидрогеназы и характеризующихся повышенным содержанием пролина. Результаты показали, что генно-модифицированные растения обладают более плотным опушением листа. Для обеспечения информационной поддержки сбора и анализа данных в селекционно-генетическом эксперименте у пшеницы, разработана система WheatPGE, которая позволяет вводить и хранить фенотипические, генотипические и средовые характеристики для растений и устанавливать взаимосвязь между генотипическими и фенотипическими признаками растений и параметрами окружающей среды.

Теоретическая и практическая ценность работы. Предложенный метод позволяет оценивать такие характеристики опушения, как плотность трихом, их распределение по длинам, линейные размеры, расстояние между трихомами на поверхности листа. Это позволяет характеризовать опушение с высокой степенью детализации, недоступной прежде. Время обработки изображения программой LHDetect2 составляет менее секунды, что позволяет существенно ускорить процедуру фенотипирования растений и проводить широкомасштабные генетические эксперименты, включающие анализ десятков генотипов и сотен растений.

Массовый анализ опушения у растений 47 сортов пшеницы продемонстрировал, что предложенный метод позволяет количественно оценивать плотность опушения и среднюю длину трихом, четко выделять классы опушенных и неопушенных сортов и выявлять статистические зависимости между плотностью опушения и средней длиной трихом.

Система WheatPGE обеспечивает информационную поддержку (ввод, хранение, обработку) данных о фенотипе, генотипе и окружающей среде растений пшеницы в ходе селекционно-генетического эксперимента и доступна для работы как с персональных компьютеров, так и с мобильных устройств, что позволяет использовать ее в полевых условиях. Основные положения, выносимые на защиту.

1) Разработанный алгоритм анализа изображений сгиба листа, реализованный в компьютерной программе LHDetect2, позволяет автоматически с высокой точностью оценивать количественные характеристики опушения листьев пшеницы и табака и обеспечивает эффективное проведение экспериментов по массовому фенотипированию этого признака.

2) Высокая точность предложенного метода при определении количественных характеристик опушения листа позволяет установить, что частичная

супрессия гена пролиндегидрогеназы у трансгенных растений табака линии SRI (Nicotiana tabacum L.), приводящая к повышению уровня пролина, сопровождается увеличением плотности опушения листьев. 3) Созданная компьютерная система WheatPGE обеспечивает информационную поддержку экспериментов по анализу взаимосвязи генотип — фенотип — окружающая среда у пшеницы.

Публикации. По материалам диссертации опубликовано 18 работ, из них 4 статьи в рецензируемых научных журналах, входящих в перечень ВАК, 2 авторских свидетельства, 12 тезисов конференций.

Апробация работы. Работа представлена в виде устных и стендовых докладов на научных конференциях, среди которых: «Электронные библиотеки: перспективные методы и технологии, электронные коллекции. XII Всероссийская научная конференция RCDL'2010» (2010, Казань), «VIII Всероссийская научно-практическая конференция студентов, аспирантов и молодых ученых «Молодежь и современные информационные технологии»» (2010, Томск), «XLVIII Международная научная студенческая конференция» (2010, Новосибирск), «Молодежный научный форум "ЛОМОНОСОВ - 2010"» (2010, Москва), «The 7th International Conference on Bioinformatics of Genome regulation and Structure» (Новосибирск, 2010), «XVI Biotechnology Summer School» (Гданьск, 2010), International Conference «Plant Genetics, Genomics and Biotechnology» (Иркутск, 2012).

Объём и структура работы. Работа состоит из введения, обзора литературы и трех глав. Работа изложена на 141 листах, содержит 53 рисунка и 10 таблиц. Список литературы содержит 101 источник.

Личный вклад автора. Основная часть работы выполнена автором самостоятельно, в частности, разработка метода автоматического получения количественных характеристик опушения листа по изображению его сгиба и реализация этого метода в компьютерной программе LHDetect2.

Глава 1. Обзор литературы.

В обзоре литературы детально описаны функции опушения, строение трихом, существующие методы определения опушения растений. Приводится классификация и обзор методов обработки биологических цифровых изображений, описан набор компьютерных библиотек для обработки изображений. Подчеркивается важность интеграции и структуризации информации о фенотипах, генотипах и параметрах окружающей среды. Приводятся примеры систем, решающих эту задачу для разных видов животных и растений. Описана обобщенная блок схема архитектуры такой системы.

Глава 2. Метод оценки количественных характеристик опушения листа.

Алгоритм анализа изображений сгиба листа для определения количественных характеристик опушения. Трихомы пшеницы -одноклеточные эпидермальные образования, которые идентифицируются как выросты, сужающиеся от основания (области прикрепления к поверхности листа) к вершине. Типичные микроизображения, которые получаются в результате протокола подготовки сгибов листа, приведены на рисунке 1.

Рис. 1 - Пример микроизображения сгиба листа пшеницы. На изображении хорошо видны область фона, область листа и трихомы. Для каждой трихомы можно визуально определить её вершину, основание и длину.

При анализе изображений поперечного сгиба листа можно определить следующие количественные характеристики: число трихом на изображении (характеристика плотности опушения); длина трихом и распределение трихом по длинам (характеристики размеров трихом); среднее значение длины трихом (характеристика среднего размера трихом); площадь трихом на изображении (характеристика объема трихом).

Алгоритм, разработанный нами для оценок этих параметров, работает в несколько этапов:

(1) преобразование изображения в шкалу оттенков серого и удаление шумов;

(2) бинаризация изображения на области листа с трихомами и фона;

(3) построение границы между листом и фоном;

(4) выделение одиночных трихом и их групп как объектов изображения;

(5) анализ размеров и форм объектов.

Алгоритм содержит 8 параметров, включая минимальную длину трихом (тт_Мс1готе), порог интенсивности цвета между листом и фоном (7),

Об; ф.

кривизну линии контура в вершинах трихом (alpha), число пикселей границы трихомы, по которым определяется ее кривизна в области вершины (N) и др.

Предложенный алгоритм анализа числовых характеристик опушения у пшеницы реализован в программе LHDetect2, консольном приложении, написанном на языке Си с использованием библиотеки OpenCV. Программа LHDetect2 доступна так же в виде web-сервиса по адресу http://wheatdb.org/lhdetect2.

Для оценки точности определения числа трихом использовалась тестовая

выборка, на каждом изображении которой мы размещали окружности с

диаметром в 15 пикселей с центрами в вершинах трихом, определенных

вручную. Для оригинального изображения при помощи нашего алгоритма мы

идентифицировали положение вершин трихом и сравнивали их координаты с

выделенными нами областями. Если вершина трихомы, определенная

программой автоматически, находились в пределах отмеченных областей, то

считалось, что вершина указана правильно. В этом случае для каждого из

изображений можно оценить ошибку недопредсказания положения вершины fn

(доля трихом на изображении, для которых автоматический метод не определил

вершину в пределах заданной области), перепредсказания fp (отношение ложно

указанных вершин к полному числу трихом), а так же долю правильно

предсказанных трихом, tp. На основе этих значений вычисляли оценки

точности рг (англ. термин precision), полноты re (англ. термин recall) и общую

F-меру точности (van Rijsbergen, 1979).

tp tp „ _ pr re pr = ——, re —-, F = 2 —-

' tp+fp tp+fn pr+re

Чем выше F, тем меньше ошибок в идентификации трихом на изображении. В случае если все трихомы идентифицированы правильно и не идентифицировано ни одного лишнего объекта F равно 1.

Дополнительно мы оценивали среднее значение абсолютного отклонения рассчитанного программой числа трихом на изображении от числа трихом, определенного вручную (МАЕ, mean absolute error) и отношение ошибки МАЕ к числу трихом на изображении, выраженном в процентах (МАРЕ, mean absolute percentage error):

где N — число тестовых изображений, и, — число трихом, определенных на изображении i вручную, п\ - число трихом, определенных компьютерным методом. Чем больше значение параметров МАЕ и МАРЕ, тем выше ошибка определения числа трихом на изображении.

Кроме того, мы оценивали коэффициент корреляции Пирсона г между числами трихом на изображении, подсчитанными LHDetect2 и вручную.

Для того чтобы определить ошибку оценки длин трихом на изображении, на тестовом наборе из 20 изображений мы вручную, при помощи программы «segmented line» из пакета ImageJ, для каждой трихомы проводили центральную линию и оценивали ее длину. Затем для каждой трихомы

сравнивали это значение со значением, полученным автоматически, мерой точности служил коэффициент корреляции Пирсона.

Значения параметров алгоритма для пшеницы выбирались так, что на обучающей выборке из 76 изображений (полученных при анализе листьев от растений разных сортов, как сильно, так и слабо опушенных) максимизировалось среднее значение /^меры. Оптимизация осуществлялась автоматически методом перебора в определенном интервале значений.

Применение алгоритма для анализа опушения листа пшеницы. Для набора оптимальных параметров точность метода на тестовой выборке из 70 изображений составила для оценок числа трихом /*"=0.85, МАЕ=3.33 МАРЕ= 11.65%, /-=0.986 (р<0.001) (рисунок 2А), для оценок длин трихом г=0.999 (р<0.001) (рис. 2Б).

Посчитано вручную Посчитано вручную (1таве.1)

Рис. 2 - А - Корреляция между автоматическим и ручным подсчетом количества трихом пшеницы; Б - корреляция между автоматическим и ручным определением длины трихом у пшеницы.

Анализ характеристик опушения листа у растений табака. Опушение табака формируется многоклеточными секретирующими трихомами. Типичное изображение сгиба листа табака под микроскопом, сделанное в тех же условиях, что и у пшеницы показано на рисунке ЗА.

Для трихом табака характерно массивное основание. Вершина трихом -секретирующая головка овальной формы. Большинство трихом содержат одну секретирующею головку, однако встречаются трихомы на которых вблизи вершины образуются небольшие выросты на каждой из которых формируется секретирующая головка. Для анализа трихом у табака алгоритм был модифицирован за счет дополнительного параметра, учитывающего форму секретирующей головки трихом (рисунок ЗБ). Оптимальные параметры определялись на обучающей выборке из 20 изображений, точность метода (Р-мера) оценивалась по выборке из 53 тестовых изображений и составила 0.9,

коэффициент корреляции г между ручным и автоматическим подсчетом вершин трихом составил 0.927 (р<0.001).

Рис. 3 - А - Микроизображение сгиба листа табака; Б - учет формы секретирующей головки при определении вершины трихомы. В результате модификации значения параметра N (число пикселей границы трихомы, по которым определяется ее кривизна в области вершины) последовательно увеличивается от Nm,„ до Nmax с шагом 1. Для каждой такой пары пикселей измеряется величина угла alpha, с вершиной в тестируемом пикселе. Если на определенном шаге alpha, меньше порогового значения alpha, перебор останавливается и тестируемый пиксель считается потенциальной вершиной трихомы.

Таким образом, были разработаны алгоритмы автоматической оценки количественных характеристик опушения листьев растения по микрофотографии сгиба листа для пшеницы и табака. Создана компьютерная программа LHDetect2, реализующая эти алгоритмы; продемонстрирована высокая точность программы при определении количества трихом и их длин у пшеницы и табака.

Глава 3. Применение метода оценки количественных характеристик опушения листа

Массовый анализ характеристик опушения листа пшеницы. Для того чтобы оценить фенотипическое разнообразие опушения у пшеницы сибирских и европейских сортов мы выполнили сравнение количественных характеристик их опушения. Исследовались 47 сортов пшеницы, 30 из которых представляли растения с сильным опушением, в основном сибирской селекции, а 17 со слабым опушением. Определение количественных характеристик опушения на основе цифрового анализа микроизображений производилось с помощью программы LHDetect2. Для каждого микроизображения сгиба листа рассчитывалась гистограмма распределения трихом по длине в пределах 0— 2500 мкм с шагом 31,5 мкм. На основе гистограммы для каждого изображения строился вектор и, элемент и, которого соответствовал числу трихом с длиной в интервале от 31,5-(г-1) мкм до 31,5-г мкм, i = 1, ..., 80. Значения элементов п для растений одного и того же сорта усреднялись. Набор из 47 полученных таким образом векторов распределения трихом по длинам был проанализирован при помощи метода неметрического многомерного шкалирования (Oksanen, 2011).

Рис. 4 - Классификация 47 сортов пшеницы по опушению листа, полученная с помощью метода неметрического многомерного шкалирования.

Анализ позволил выделить две группы сортов, формирующих кластеры 1 и 2 (рис. 4). К первому кластеру относятся сорта, которые являются сильно опушенными, ко второму слабоопушенные, в основном, европейские сорта. Анализ координатных осей показал, что ось X связана с интенсивностью опушения. Мы рассчитали коэффициент корреляции Пирсона между значениями координаты X указанных сортов, средней длиной трихом, I и средним числом трихом, N. Эти коэффициенты значимы (р<0.0 5) и отрицательны (г(Х, Е)=-0.99; г(Х, Ы)=-0.82). Это означает, что с ростом значений Xнаблюдается ослабление опушения.

Дополнительный анализ показал, что между средней длиной Ь и средним числом трихом N у растений в кластере 2 наблюдается значимая корреляция (г2(1, N)=0.80, р<0.05), а для растений кластера 1 она отсутствует (г,(1, Л?)=0.06, р>0.()5). Это может означать, что для сортов со слабым опушением гены, контролирующие опушение, действуют как на формирование длин трихом, так и на их число. Этим же может быть обусловлен меньший разброс точек из второго кластера вдоль второй главной компоненты V.

Проведенный анализ демонстрирует, что предложенный метод позволяет количественно оценивать плотность опушения и среднюю длину трихом, четко выделять классы опушенных и неопушенных сортов и выявлять статистические зависимости между плотностью опушения и средней длиной трихом.

Изучение взаимного расположение трихом у пшеницы. Для того чтобы охарактеризовать особенности взаимного расположения трихом на поверхности листа, программа ЬНОе1ес12 для каждой трихомы выдает расстояние вдоль границы листа от середины ее основания до середины основания ближайшей трихомы. С помощью этого метода нами были проанализированы особенности взаимного расположения коротких (длина до 100 мкм) и длинных (длина более 100 мкм) трихом вдоль границы листа у растений сорта Ног^-тап§-та1, линии

9

102/00' сорта Родина, Саратовская 29 и Голубка. Для каждого сорта по 60 изображениям строилось распределение расстояний <1пп в парах ближайших коротких и длинных трихом, оценивались их параметры, и проводилось сравнение формы этих распределений у растений одного сорта с использованием критерия Колмогорова-Смирнова. Результаты приведены в таблице 1.

Таблица 1. Сравнение распределений коротких и длинных трихом для различных сортов пшеницы. Приведено количество проанализированных пар трихом для исследуемых генотипов (Лу, средние (йпп) и дисперсии (Уаг(с1пп)) расстояний между ближайшими короткими и длинными трихомами, уровень значимости (р) при проверке гипотезы о

Сорт Тип Np dnn Var(dnn) Критерий К-С

Голубка короткие 624 153.33 145.98 р <0.01

длинные 588 164.17 136.12

Саратовская 29 короткие 556 184.48 180.51 р <0.001

длинные 1232 89.89 89.61

102/00' короткие 174 362.78 339.61 р< 0.001

длинные 184 421.30 318.15

Hong-mang-mai короткие 999 124.70 133.49 р< 0.001

длинные 549 207.09 173.06

Анализ продемонстрировал разнообразие распределений трихом на поверхности листа у исследованных нами генотипов пшеницы. Кроме того, было установлено, что между распределениями коротких и длинных трихом на поверхности листьев пшеницы для всех исследованных нами генотипов сушествуют значимые различия (таблица 1). Выявленные нами различия можно объяснить тем, что длинные трихомы располагаются в основном вдоль жилок листа.

Изучение количественных характеристик опушения листа линий табака с различным содержанием пролина. Мы исследовали количественные характеристики опушения листа трансгенных линий табака, полученных на основе сорта Petit Havana SR-1 (Nicotiana tabacum L.J, далее по тексту SRI, несущие антисмысловой супрессор гена пролиндегидрогеназы (pdh). Сравнивались растения исходного сорта SRI и трансгенные растения линий pdh5, pdh6 и pdh8 пятого поколения самоопыления (потомки трех независимых трансформантов). Трансгенные растения табака, характеризовались пониженной активностью гена pdh и повышенным содержанием пролина, по сравнению с исходным сортом SRI (Кочетов и др., 2004; Колодяжная, 2006).

126 378 630 882 1134 1386 1638 Длина, мкм

Количество

1 pdh6

126 378 630 882 1134 1386 1638 Длина, мкм

««4 *-------

.4 *»' ♦

126 378 630 882 1134 1386 1638 Длина , мкм

■ U

Рис. 5 - Сравнение опушения листа табака трансгенных линий pdh5, pdh6, pdh8 с линией дикого типа SRI; диаграммы А, В, Д - распределение трихом но длинам с шагом 126 мкм.; диаграммы Б, Г, Е — зависимость количества трихом (ось X) и их средней длины (ось Y).

Для анализа опушения одновременно срезалось по одному листу каждой линии из среднего яруса растения. В средней части каждого листа высекались два фрагмента, заключённые между радиальными жилками. Средние данные по количеству трихом и их длины для каждого препарата, получали на основе анализа 4-х изображений. Всего было проанализировано 440 микроизображений сгиба листа табака в трех экспериментах: 64 изображения линии pdh5 и 56 изображений сорта SRI; 64 изображения линии pdh6 и 64 изображений сорта SRI;

100 изображений линии pdh8 и 92 изображения сорта SRI.

Результаты анализа этих изображений программой LHDetect2 показали, что опушение листьев генно-модифицированных линий значимо выше, чем у растений линии SRI, как показано на графиках распределения трихом по длинам и графиках зависимости между средней длиной и количеством трихом (рисунок 5). Генно-модифицированные растения обладают большим числом трихом в интервалах длин от 100 до 300 мкм.

Полученные нами результаты позволяют предположить, что повышенное содержание пролина способствует образованию большего количества трихом, которые являются морфологическим проявлением стрессоустройчивости растений. Полученные результаты согласуются данными о том, что пролин является осмолитом, уровень, которого многократно повышается в ответ на стрессовые условия окружающей среды (Babaei et al., 2010), а трихомы табака играют важную роль в устойчивости растений к абиотическим факторам среды (Harada et al, 2010).

Глава 4. Компьютерная система для анализа взаимосвязи признаков фенотипа, генотипа и параметров окружающей среды

Для интеграции информации о фенотипе, генотипе и окружающей среде в селекционно-генетических экспериментах у пшеницы нами разработана система \VheatPGE (http://wheatdb.org, рисунок 6А). Система служит для ввода разнородных данных о растении, их хранения, поиска и вывода для дальнейшего статистического анализа.

Окружающая среда

Молекулярные маркеры

Рис. 6 - Компьютерная система системы \VheatPGE. А). Веб интерфейс системы. Б). Схема взаимосвязи между основными разделами информации в системе \VheatPGE.

Всего в текущей версии БД содержит 32 таблицы и 55 отношений между ними. Центральным объектом в эксперименте является растение. Оно характеризуется уникальным генотипом, фенотипом и местом произрастания (рисунок 6Б). Генотип растения описывается девятью таблицами. Они включают описание сорта растения или линии. Генотип связан с рядом таблиц, описывающих молекулярные маркеры. Фенотип растения описывается 15 таблицами: содержащие базовые признаки растения (длина стебля, число

колосьев, общую урожайность), структуру урожая (главный и вторичные колосья), опушение листа, стадии развития растения. Место произрастания описано двумя таблицами, основная информация в которых содержит название места произрастания, широту, долготу, тип климата, климатические характеристики (среднегодовую температуру, среднегодовую влажность, средние температуры января и июля).

Блок информации, связанный с проведением эксперимента, включает две таблицы, описывающие событие, и список событий для растения. Событие содержит поле названия, типа и значения. Типичные события селекционно-генетического эксперимента у пшеницы показаны на рисунке 7.

Дни

00 07 10-13

21 25

30

31

37

49 51 60-65 70-

Агротехнич. Внесение удобрений

Рис. 7 — Общая схема селекционно-генетического эксперимента у пшеницы, представленного в виде шкалы времени. На ней отражены основные типы событий: запись данных о состоянии окружающей среды, агротехнические мероприятия, фазы развития растения и измерения параметров фенотипа.

Для автоматизации сбора информации о температуре и влажности воздуха в месте произрастания растений на основе прибора UniPing RS-485 был реализован программно-аппаратный комплекс. В режиме реального времени через Интернет этот комплекс осуществляет считывание информации с датчиков прибора и сохранение их в базе данных системы WheatPGE.

WheatPGE обеспечивает интерфейс для сбора данных в процессе селекционно-генетического эксперимента. Система позволяет загружать данные о фенотипе, как в текстовом виде, так и в виде изображений, осуществлять поиск данных и вывод их в формате CSV, удобном для дальнейшего анализа программами статистической обработки. Для удобства взаимодействия с базой данных при идентификации растений используется система QR кодов. QR-код присваивается в базе каждому растению или группе растений, может быть распечатан на плотной бумаге и прикреплен к его стеблю.

i

Рис. 8 - Пример QR кода, который содержит ссылку на растение в БД WheatPGE, результат считывания QR кода мобильным устройством под управлением ОС Android в программе NeoReader и переход по ссылке на страницу записи соответствующего растения.

При измерении параметров отдельного растения в процессе эксперимента достаточно с помощью мобильного устройства (например, телефона) считать прикрепленный к нему код (рисунок 8) и занести параметры в базу.

Таким образом, интерфейс системы \VheatPGE позволяет сохранять информацию об измерениях фенотипов растений в ходе эксперимента непосредственно в базу данных как со стационарного компьютера в лаборатории, так и в поле, минуя записи в журналах. Это позволяет экспериментатору затрачивать меньше времени на сбор данных, обеспечивает их сохранность, доступ к данным в любой момент времени.

1 ) Разработаны алгоритмы автоматической оценки количественных характеристик опушения листьев растения по микрофотографии сгиба листа для пшеницы и табака.

2) Создана компьютерная программа LHDetect2, реализующая эти алгоритмы; продемонстрирована высокая точность программы при определении количества трихом и их длин у пшеницы и табака.

3)На примере анализа растений 47 сортов яровой пшеницы, имеющих различную степень опушения листа, показано, что предложенный метод позволяет количественно оценивать плотность опушения и среднюю длину трихом, четко выделять классы опушенных и неопушенных сортов и выявлять статистические зависимости между плотностью опушения и средней длиной трихом.

4) На примере анализа растений пшеницы сортов Саратовская 29, Голубка, Hong-mang-mai и линии 102/00' впервые показано, что распределения расстояний по поверхности листа между ближайшими короткими и ближайшими длинными трихомами у растений значимо различаются.

5) Впервые проведено сравнение количественных характеристик опушения листа у модельных трансгенных линий табака сорта Petit Havana SR-1 (SRI), несущих антисмысловой супрессор гена пролиндегидрогеназы арабидопсиса, и характеризующегося повышенным содержанием уровня пролина. Показано, что повышение содержания пролина у трансгенных линий табака сопровождается увеличением плотности опушения листа.

6) Создана интегрированная система WheatPGE для поддержки селекционно-генетических экспериментов у пшеницы, которая позволяет хранить и анализировать данные по взаимосвязи фенотипических признаков растения,

ВЫВОДЫ

генотипа и окружающей среды, осуществляет автоматический мониторинг температуры и влажности воздуха в местах произрастания растений и обеспечивает доступ к работе через мобильные устройства.

Список работ, опубликованных по теме диссертации.

1. Genaev М.А., Doroshkov A.V., Pshenichnikova Т.A., Kolchanov N.A., Afonnikov D.A. Extraction of quantitative characteristics describing wheat leaf pubescence with a novel image-processing technique // Planta, 2012, N 236, 1943-1954.

2. Генаев M.A., Дорошков A.B., Пшеничникова T.A., Морозова Е.В., Симонов А.В., Афонников Д.А. Информационная поддержка селекционно-генетического эксперимента у пшеницы в системе WheatPGE. // Математическая биология и биоинформатика. 2012. Т. 7. № 2. С. 410-424.

3. Генаев М.А., Дорошков А.В., Морозова Е.В. и др. Компьютерная система WheatPGE для анализа взаимосвязи фенотип-генотип-окружающая среда у пшеницы // Вавиловский журнал генетики и селекции. 2011. Т. 15. С. 784-793.

4. Кочетов А.В., Смирнова О.Г., Ибрагимова С.М., Рассказов Д.А., Афонников Д.А., Генаев М.А., Дорошков А.В., Пшеничникова Т.А., Симонов А.В., Морозова Е.В. Информационный портал "Биотехнология растений" - Интернет ресурс для поддержки экспериментов в области генной инженерии растений, генетики и селекции пшеницы // Вавиловский журнал генетики и селекции, 2012 Т. 16 № 4/1 С. 838-848.

5. Генаев М.А., Дорошков А.В., Афонников Д.А. (2012) Программа автоматического определения количественных характеристик опушения листа (ОЛДетект2). // Свидетельство о регистрации программы для ЭВМ N 2012612357 от 5.03.2012, дата приоритета 17.11.2011.

6. Генаев М.А., Дорошков А.В., Афонников Д.А. (2010) База данных для анализа взаимосвязей генотип-фенотип-окружающая среда у пшеницы (ВитПГЕ). Свидетельство о регистрации базы данных N 2010620602 от 23.10.2010, дата приоритета 30.06.2010

7. Genaev М.А., Doroshkov A.V., Pshenichnikova Т.А., Afonnikov D.A. Extraction of quantitative characteristics describing wheat leaf pubescence with a novel image processing technique // Proc. of the 2nd International Conference "Plant Genetics, Genomics and Biotechnology", Иркутск, 2012.

8. Genaev M.A., WheatPGE : a system for analysis of phenotypic, genotypic and environmental relationships in wheat // XVI Biotechnology Summer School, Gdansk, Poland, 2010.

9. Doroshkov A.V., Genaev M.A., Pshenichnikova T.A., Afonnikov D.A.. Analysis of leaf hairiness morphology wheat: computational approaches using image processing technique. // Proc. of the International Conference "Wheat Genetics Resources and Genomics" Новосибирск, 2011.

10.Afonnikov D.A., Doroshkov A.V., Genaev M.A., Pshenichnikova T.A. High througput phenotyping approach to analysis of the leaf hairiness in wheat // Proc. of the International Conference "Wheat Genetics Resources and Genomics" Новосибирск, 2011.

11 .Doroshkov A., Genaev M., Pshenichnikova Т., Afonnikov D. Analysis of leaf hairiness in wheat Triticum aestivum L. using image processing technique // Proc. of European Conference on Mathematical and Theoretical Biology, Krakow, Poland, 2011

12.Doroshkov A.V., Genaev M.A., Pshenichnikova T.A., Afonnikov D.A. Analysis of leaf hairiness in wheat Triticum aestivum L. using the high throughput phenotyping approach // Proc. of the International Conference "Plant Genetics, Genomics, and Biotechnology, Новосибирск, 2010.

13.Doroshkov A.V., Genaev M.A., Pshenichnikova T.A., Afonnikov D.A. Using a computer-base image processing technique in genetic analysis of leaf hairiness in wheat Trticum aestivum L. // Proc. of the 7th International Conference on Bioinformatics of Genome regulation and Structure, Новосибирск, 2010.

14.Афонников Д. А. Дорошков A.B., Генаев М.А. Анализ морфологии опушения листа у пшеницы: компьютерный подход с использованием анализа изображений // Тезисы. Российско-Французский семинар "Геномика, биоинформатика и моделирование в науках о жизни", Новосибирск, 2010.

15.Дорошков А.В., Генаев М.А., Пшеничникова Т.А., Афонников Д.А. Методы компьютерного анализа в исследовании опушения листа пшеницы Triticum aestivum L. // Тезисы. VIII Всероссийской научно-практической конференции студентов, аспирантов и молодых ученых "Молодежь и современные информационные технологии" Томск, 2010.

16.Генев М.А., Дорошков А.В. Визуализация схем скрещивания пшеницы в рамках разработки системы WheatDB // Тезисы. XLVIII Международная научная студенческая конференция "Студент и научно- технический прогресс", Новосибирск, 2010.

17.Генаев М.А., Дорошков А.В., Афонников Д.A. WheatPGE — система анализа взаимосвязей фенотип-генотип-окружающая среда у пшеницы // Тезисы. Молодежный научный форум "ЛОМОНОСОВ - 2010", Москва, 2010.

18.Генаев М.А., Дорошков А.В., Афонников Д.A. WheatPGE - компьютерная система анализа взаимосвязи признаков фенотипа генотипа и окружающей среды у пшеницы // Тезисы. Электронные библиотеки: перспективные методы и технологии, электронные коллекции. XII Всероссийская научная конференция RCDL'2010, Казань, 2010.

Благодарности. Автор выражает искреннюю благодарность руководителю диссертации к.б.н. Афонникову Д.А., соавторам и коллегам по работе - к.б.н. Дорошкову A.B., к.б.н. Пшеничниковой Т.А., к.б.н. Ибрагимовой С.М., Морозовой Е.В. за предоставление биологического материала, консультации, ценные советы и за помощь в биологической интерпретации результатов.

Подписано к печати 07.02.2013 г. Формат бумаги 60 х 90 1/16 Печ. л. 1. Уч. изд. л. 0,7 Тираж 110 экз. Заказ № 5

Отпечатано на полиграфической базе ИЦиГ СО РАН 630090, Новосибирск, пр. акад. Лаврентьева, 10

Содержание диссертации, кандидата биологических наук, Генаев, Михаил Александрович

Введение.

Глава 1. Обзор литературы.

1.1 Опушение - важный фенотипический признак растений.

1.1.1 Строение трихом.

1.1.2 Функции опушения.

1.1.3 Методы определения опушения растений.

1.2 Методы обработки биологических цифровых изображений.

1.2.1 Основные процедуры подготовки и анализа изображений в биологии.

1.2.2 Комбинированное использование методов обработки изображений.

1.2.3 Библиотеки анализа цифровых изображений.

1.2 Высокопроизводительное фенотипирование при анализе взаимосвязи генотип-фенотип у растений.

1.3 Интеграция и структуризация информации о фенотипах, генотипах и параметрах окружающей среды — актуальная проблема при изучении живых организмов.

Введение Диссертация по биологии, на тему "Разработка методов автоматического определения количественных характеристик опушения листа"

Актуальность работы. Одной из ключевых проблем современной биологии — изучение взаимосвязи между генотипом и фенотипом у живых организмов, в том числе растений. Для определения взаимосвязей между генотипом и фенотипом при анализе комплексных признаков применяются компьютерно-экспериментальные подходы, основанные на методе картирования генов, контролирующих количественные признаки (quantitative trait loci, QTL). Эти подходы основаны на статистическом анализе комбинаций молекулярных маркеров и фенотипических данных (Shavrukov et al., 2010; Kearsey, 1998).

Одной из эффективных технологий, позволяющей получать массовым образом данные о последовательностях маркеров в геноме отдельно взятого организма, является секвенирование нового поколения. Эта технология ориентирована на прочитывание коротких фрагментов нуклеотидных последовательностей (30-200 п.н.), но в массовом порядке и с высокой степенью покрытия, что позволяет идентифицировать в геноме последовательности большого количества маркеров одновременно (Mardis, 2008). Таким образом, высокопроизводительное генотипирование (получение большого пула данных по ДНК-маркерам) в анализе взаимосвязи генотип-фенотип сейчас не является проблемой, как это было еще 10-20 лет назад. В этой связи становится актуальным массовое получение данных по фенотипам растений. Именно поэтому область исследований в биологии, связанная с получением данных о фенотипических признаках растений в массовом порядке (высокопроизводительное фенотипирование), сейчас получает все большее развитие (Eberius et al., 2009).

Совокупность фенотипических признаков организма в последнее время стали называть «феном» (по аналогии с геномом), а область науки, которая посвящена его анализу - феномика (Houle et al., 2010; Furbank et al., 2011). В основе технологий высокопроизводительного фенотипирования растений лежат методы оцифровки морфологических признаков. Разработка быстрых и относительно точных методов автоматического определения фенотипиче-ских признаков необходима для проведения экспериментов по исследованию взаимосвязи генотипа и фенотипа, основанных на анализе тысяч растений (ВепГеу et а1., 2008, Дуа\¥1 е1 а1., 2010; ВгасЫ е1 а1., 2010). Если ранее для фе-нотипирования применялись механические средства (весы, рулетка, штангенциркуль), то в настоящие время появляются технологии, позволяющие получать фенотипические характеристики в автоматическом режиме на основе методов цифровой обработки изображений. Основное преимущество таких технологий - максимальное исключение человека из процесса оценки какого либо признака. Это позволяет: (а) существенно ускорить процесс получения данных за счет автоматизации; (б) увеличить точность оценки фено-типических параметров, устранив субъективизм и неточность измерений, присущих человеку; (в) получать оценки новых характеристик фенотипа, наблюдение или оценка которых ранее были недоступны (например, параметры микроскопических органов растений).

Один из важных фенотипических признаков растений - опушение. Опушение формируется совокупностью эпидермальных образований, которые называются трихомами, и имеет большое физиологическое значение для растения. Оно может защищать растение от вредителей и агрессивного воздействия окружающей среды, влияя на микроклимат вблизи поверхности листа, регулируя такие параметры как влажность, температуру. Трихомы некоторых растений могут синтезировать, накапливать и секретировать различные метаболиты (БсЫкшИег е! а1., 2008). К числу метаболитов, секретируемых трихомами, относятся терпены, производные фенилпропаноидов, метилкетоны, флавоноиды и др., часть из них используются в фармацевтике, пищевой промышленности, парфюмерии. Таким образом, трихомы служат своеобразными «химическими фабриками» по производству ценных продуктов для биохимии и биотехнологии. Между тем в настоящие время в мире не существует технологии высокопроизводительного фенотипирования этого признака.

Существующие методы оценки опушения растений или достаточно дороги и трудоемки или не дают необходимой точности.

Цели и задачи исследования.

Целью работы является разработка метода автоматического определения количественных характеристик опушения листьев растений на основе анализа цифровых микроизображений их сгибов, и сравнительный анализ количественных характеристик опушения листа у растений яровой пшеницы и табака, как модельного растения.

Для достижения заявленной цели были поставлены следующие задачи:

1) Разработать алгоритм автоматической оценки количественных характеристик опушения листа на основе анализа цифровых микроизображений его сгибов у пшеницы и табака.

2) Создать компьютерную программу для анализа количественных характеристик опушения листа пшеницы и табака.

3) Провести массовый анализ количественных характеристик опушения листа сибирских и европейских сортов пшеницы.

4) Провести анализ взаимного расположения трихом на поверхности листа у различных сортов пшеницы.

5) Провести анализ количественных характеристик опушения листьев табака на примере линии SRI и ее генетически-модифицированных вариантов.

6) Разработать интегрированную систему для хранения и анализа данных по взаимосвязи фенотипических признаков растения, генотипа и окружающей среды на примере пшеницы.

Научная новизна работы. В работе предложен метод автоматического определения количественных характеристик опушения листьев растений на основе анализа цифровых микроизображений их сгибов. Метод адаптирован для анализа опушения у пшеницы и табака. Данный метод реализован в программе LHDetect2, доступной в качестве web-сервиса, что впервые позволило обеспечить возможность фенотипирования растений с использованием сети

Интернет. Впервые проведен массовый анализ количественных характеристик опушения листьев пшеницы для нескольких десятков сортов и выявлены их различия у сибирских и европейских сортов. На основе анализа распределений расстояний между ближайшими трихомами выявлены различия в распределении коротких и длинных трихом на поверхности листа для 4 сортов мягкой пшеницы. Впервые проведено сравнение количественных характеристик опушения листьев растений табака Nicotiana tabacum L. линии SRI и ее генно-модифицированных линий, несущих трансгенную конструкцию, ингибирующую экспрессию гена пролиндегидрогеназы и характеризующихся повышенным содержанием пролина. Результаты показали, что генно-модифицированные растения обладают более плотным опушением листа. Для обеспечения информационной поддержки сбора и анализа данных в селекционно-генетическом эксперименте у пшеницы, разработана система WheatPGE, которая позволяет вводить и хранить фенотипические, генотипи-ческие и средовые характеристики для растений и устанавливать взаимосвязь между генотипическими и фенотипическими признаками растений и параметрами окружающей среды.

Теоретическая и практическая ценность работы.

Предложенный метод позволяет оценивать такие характеристики опушения, как плотность трихом, их распределение по длинам, линейные размеры, расстояние между трихомами на поверхности листа. Это позволяет характеризовать опушение с высокой степенью детализации, недоступной прежде. Время обработки изображения программой LHDetect2 составляет менее секунды, что позволяет существенно ускорить процедуру фенотипирования растений и проводить широкомасштабные генетические эксперименты, включающие анализ десятков генотипов и сотен растений.

Массовый анализ опушения у растений 47 сортов пшеницы продемонстрировал, что предложенный метод позволяет количественно оценивать плотность опушения и среднюю длину трихом, четко выделять классы опушенных и неопушенных сортов и выявлять статистические зависимости между плотностью опушения и средней длиной трихом.

Система WheatPGE обеспечивает информационную поддержку (ввод, хранение, обработку) данных о фенотипе, генотипе и окружающей среде растений пшеницы в ходе селекционно-генетического эксперимента и доступна для работы как с персональных компьютеров, так и с мобильных устройств, что позволяет использовать ее в полевых условиях.

Положения, выносимые на защиту.

1) Разработанный алгоритм анализа изображений сгиба листа, реализованный в компьютерной программе LHDetect2, позволяет автоматически с высокой точностью оценивать количественные характеристики опушения листьев пшеницы и табака и обеспечивает эффективное проведение экспериментов по массовому фенотипированию этого признака.

2) Высокая точность предложенного метода при определении количественных характеристик опушения листа позволяет установить, что частичная супрессия гена пролиндегидрогеназы у трансгенных растений табака линии SRI (Nicotiana tabacum L.), приводящая к повышению уровня проли-на, сопровождается увеличением плотности опушения листьев.

3) Созданная компьютерная система WheatPGE обеспечивает информационную поддержку экспериментов по анализу взаимосвязи генотип - фенотип - окружающая среда у пшеницы. i

Апробация работы.

Работа представлена в виде устных и стендовых докладов на научных конференциях, среди которых: «Электронные библиотеки: перспективные методы и технологии, электронные коллекции. XII Всероссийская научная конференция RCDL'2010» (2010, Казань), «VIII Всероссийская научно-практическая конференция студентов, аспирантов и молодых ученых "Молодежь и современные информационные технологии"» (2010, Томск), «XLVIII

Международная научная студенческая конференция» (2010, Новосибирск), «Молодежный научный форум "ЛОМОНОСОВ - 2010"» (2010, Москва), «The 7th International Conference on Bioinformatics of Genome regulation and Structure» (Новосибирск, 2010), «XVI Biotechnology Summer School» (Гданьск, 2010), International Conference «Plant Genetics, Genomics and Biotechnology» (Иркутск, 2012).

Объём и структура диссертации.

Работа состоит из введения, обзора литературы и трех глав. Работа содержит 53 рисунка и 10 таблиц. Список литературы содержит 101 источник.

Публикации.

По материалам диссертации опубликовано 18 работ, из них 4 статьи в рецензируемых научных журналах, входящих в список ВАК:

1) Genaev М.А., Doroshkov A.V., Pshenichnikova Т.А., Kolchanov N.A., Afonnikov D.A. Extraction of quantitative characteristics describing wheat leaf pubescence with a novel image-processing technique // Planta, 2012, N 236, 19431954.

2) Генаев M.A., Дорошков A.B., Пшеничникова T.A., Морозова E.B., Афонников Д.А. Компьютерная система WheatPGE для анализа взаимосвязи фенотип-генотип-окружающая среда у пшеницы // Вавиловский журнал генетики и селекции, 2011, т. 15, № 4, 784-793.

3) Генаев М.А., Дорошков A.B., Пшеничникова Т.А., Морозова Е.В., Симонов A.B., Афонников Д.А. Информационная поддержка селекционно-генетического эксперимента у пшеницы в системе WheatPGE // Математическая биология и биоинформатика, 2012, т. 7, № 2, с. 410-424.

4) Кочетов A.B., Смирнова О.Г., Ибрагимова С.М., Рассказов Д.А., Афонников Д.А., Генаев М.А., Дорошков A.B., Пшеничникова Т.А., Симонов A.B., Морозова Е.В. Информационный портал "Биотехнология растений" - Интернет ресурс для поддержки экспериментов в области генной инженерии растений, генетики и селекции пшеницы // Вавиловский журнал генетики и селекции 2012 Т. 16 № 4/1 С. 838-848.

Благодарности. Автор выражает искреннюю благодарность руководителю диссертации к.б.н. Афонникову Д.А., соавторам и коллегам по работе -к.б.н. Дорошкову A.B., к.б.н. Пшеничниковой Т.А., к.б.н. Ибрагимовой С.М., Морозовой Е.В. за предоставление биологического материала, консультации, ценные советы и помощь в биологической интерпретации результатов.

Заключение Диссертация по теме "Математическая биология, биоинформатика", Генаев, Михаил Александрович

Выводы

1) Разработаны алгоритмы автоматической оценки количественных характеристик опушения листьев растения по микрофотографии сгиба листа для пшеницы и табака.

2) Создана компьютерная программа LHDetect2, реализующая эти алгоритмы; продемонстрирована высокая точность программы при определении количества трихом и их длин у пшеницы и табака.

3) На примере анализа растений 47 сортов яровой пшеницы, имеющих различную степень опушения листа, показано, что предложенный метод позволяет количественно оценивать плотность опушения и среднюю длину трихом, четко выделять классы опушенных и неопушенных сортов и выявлять статистические зависимости между плотностью опушения и средней длиной трихом.

4) На примере анализа растений пшеницы сортов Саратовская 29, Голубка, Hong-mang-mai и линии 102/00І впервые показано, что распределения расстояний по поверхности листа между ближайшими короткими и ближайшими длинными трихомами у растений значимо различаются.

5) Впервые проведено сравнение количественных характеристик опушения листа у модельных трансгенных линий табака сорта Petit Havana SR-1 (SRI), несущих антисмысловой супрессор гена пролиндегидрогеназы ара-бидопсиса, и характеризующегося повышенным содержанием уровня про-лина. Показано, что повышение содержания пролина у трансгенных линий табака сопровождается увеличением плотности опушения листа.

6) Создана интегрированная система WheatPGE для поддержки селекционно-генетических экспериментов у пшеницы, которая позволяет хранить и анализировать данные по взаимосвязи фенотипических признаков растения, генотипа и окружающей среды, осуществляет автоматический мониторинг температуры и влажности воздуха в местах произрастания растений и обеспечивает доступ к работе через мобильные устройства.

Заключение

В работе предложен новый метод определения количественных характеристик опушения листа растений по анализу микроизображения сгиба. Анализ точности метода показал, что ошибки в подсчете числа трихом составляют около 11%, что является приемлемым для решения большого класса задач. Метод является быстрым, что позволяет использовать его в задачах высокопроизводительного фенотипирования.

Метод был адаптирован для анализа опушения у пшеницы и табака.

В работе с использованием данного метода показаны и детально описаны различия в опушении сибирских и европейских сортов пшеницы. Изучены распределения расстояний между ближайшими короткими длинными трихомами для 4 генотипов пшеницы и показано, что распределения коротких и длинных трихом на поверхности листа значимо различаются.

Показано, что генно-модифицированные растения линии SRI табака, несущие генетическую конструкцию, подавляющую экспрессию пролиндегид-рогеназы (pdh) и приводящую к повышенной концентрации пролина имеют более интенсивное опушение по сравнению с растениями контрольной линии SRI.

Для поддержки экспериментов по анализу опушения у растений создана компьютерная система WheatPGE, которая интегрирует данные о фенотипе генотипе и окружающей среде. Разработанные методы позволили собрать информацию об опушении более 2000 растений и провести их массовый анализ.

Предложенный подход является перспективным для применения в задачах анализа генетических векторов, определяющих морфологию опушения у растений.

Библиография Диссертация по биологии, кандидата биологических наук, Генаев, Михаил Александрович, Новосибирск

1. Ajjawi I., Lu Y., Savage L.J., Bell S.M., Last R.L. Large-scale reverse genetics in Arabidopsis: case studies from the Chloroplast 2010 Project. // Plant Physiol. 2010, vol. 152, no. 2, p. 529-540.

2. Bates L.R., Waldren R.P., Tiare I.D. Rpid determination of free proline for water stress studies. // Plant Soil, 1973, vol. 39, p. 205-207.

3. Benfey P.N., Mitchell-Olds T. From genotype to phenotype: systems biology meets natural variation. // Science. 2008, vol. 320, no. 5875, p. 495-497.

4. Bensch R., Ronneberger O., Greese В., Fleck C., Wester K., Huelskamp M., Burkhardt H. Image Analysis of Arabidopsis Trichome Patterning in 4D Confocal Datasets. // IEEE International Symposium on Biomedical Imaging (ISBI), 2009, p. 742-745.

5. Brachi В., Faure N., Horton M., Flahauw E., Vazquez A., Nordborg M., Bergelson J., Cuguen J., Roux F. Linkage and association mapping of Arabidopsis thaliana flowering time in nature. // PLoS Genet. 2010, vol. 6, no. 5, p. el000940.

6. Brox T., Kim Y.-J., Weickert J., Feiden W. Fully-automated Analysisof Muscle Fiber Images with Combined Region and Edge Based Active Contours. // In: Proc. Bildverarbeitung fur die Medizin, 2006, 86-90

7. Carollo V., Matthews D.E., Lazo G.R., Blake T.K., Hummel D.D., Lui N., Hane D.L., Anderson O.D. GrainGenes 2.0. An improved resource for the small-grains community. II Plant Physiol., 2005, vol. 139, no. 2, p. 643-651.

8. Cassab G.I., Varner J.E. Immunocytolocalization of extensin in developing soybean seed coats by immunogold-silver staining and by tissue printing on nitrocellulose paper. J Cell Biol, 1987, vol. 105, no. 6, p. 2581-2588

9. Cédola C.V., Sánchez N.E., Liljesthrom G.G. Effect of tomato leaf hairiness on functional and numerical response of Neoseiulus californicus, Experimental and Applied Acarology. // 2001, vol. 25, p. 819-831.

10. Cohen B.E. Biological imaging: Beyond fluorescence. // Nature, 2010, vol. 467, no. 7314, p. 407-^108.

11. Cootes T., Edwards G., Taylor C. Active appearance models. // In: Proceedings of the European Conference on Computer Vision, 1998, vol. 2, p. 484-498.

12. Cui D., Zhang Q., Li M., Hartman G.L., Zhao Y. Image processing methods for quantitatively detecting soybean rust from multispectral images. // Biosystems engineering, 2010, vol. 107, p. 186-193.

13. Darrigues A., Hall J., van der Knaap E., Francis D.M. Tomato Analyzer-color Test: A New Tool for Efficient Digital Phenotyping. // J. Amer. Soc. Hort. Sci. 2008, vol. 133, no. 4, p. 579-586.

14. Dobrovolskaya O.B., Pshenichnikova T.A., Arbuzova V.S., et al. Molecular Mapping of Genes Determining Hairy Leaf Character in Common Wheat with Respect to Other Species of the Triticeae. // Euphitica, 2007, vol. 155, no. 3,p. 285-293.

15. Eberius M., Lima-Guerra J. High-Throughput Plant Phenotyping -Data Acquisition, Transformation, and Analysis. // In: Bioinformatics: Tools and Applications, Ed.: D. Edwards et al., Springer Science+Business Media, LLC 2009, p. 259-278.

16. Exner V., Hirsch-Hoffmann M., Gruissem W., Hennig L. PlantDB a versatile database for managing plant research. // Plant Methods, 2008, vol. 4, no. 1.

17. Falzon G., Pearson S., Murison R. Analysis of collagen fibre shape changes in breast cancer. // Phys. Med. Biol., 2008, vol. 53, p. 6641-6652.

18. Furbank R.T., Tester M. Phenomics technologies to relieve the phenotyping bottleneck // Cell, 2011, vol. 16, no. 12, p. 635-644.

19. Genaev M.A., Doroshkov A.V., Pshenichnikova T.A., Kolchanov N.A., Afonnikov D.A. Extraction of quantitative characteristics describing wheat leaf pubescence with a novel image-processing technique // Planta, 2012, vol. 236, p. 1943-1954.

20. Gering E., Atkinson C., A rapid method for counting nucleated erythrocytes on stained blood smears by digital image analysis // J Parasitol, 2004, vol. 90, no. 4, p. 879-881.

21. Gill B.S., Appels R., Botha-Oberholster A.-M., et al. A Workshop Report on Wheat Genome Sequencing International Genome Research on Wheat Consortium. // Genetics, 2004, vol. 168, p. 1087-1096.

22. Goff S.A., Ricke D., Lan T.-H., et al. A Draft Sequence of the Rice Genome (Oryza sativa L. ssp. japonica). // Science, 2002, vol. 296, p. 92-100.

23. Golzarian M.R., Frick R.A., Rajendran K., Berger B., Roy S., Tester M., Lun D.S. Accurate inference of shoot biomass from high-throughput images of cereal plants. // Plant Methods, 2011, vol. 7, no. 2.

24. Grubb S.C., Maddatu T.P., Bult C.J., Bogue M.A. Mouse phenome database. // Nucleic Acids Res., 2009, vol. 37, p. D720-D730.

25. Hameed M., Mansoor U., Ashraf M., Rao A.-U.-R. Variation in leaf anatomy in wheat germplasm from varying drought-hit habitats. // Int. J. Agriculture & Biol. 2002, vol. 4, p. 12-16.

26. Hancock J.M., Adams N.C., Aidinis V., Blake A., Bogue M., Brown S.D., Chesler E.J., Davidson D., Duran C., Eppig J.T., Gailus-Durner V., Gates H., Gkoutos G.V., Greenaway S., Hrabe de Angelis M., Kollias G., Leblanc S., Lee

27. Harada E., Kim J.-A., Meyer A.J., Hell R., Clemens S., Choi Y.-E. Expression Profi ling of Tobacco Leaf Trichomes Identifi es Genes for Biotic and Abiotic Stresses. // Plant Cell Physiol., 2010, vol. 51, no. 10, p. 1627-1637.

28. Hartmann A., Czauderna T., Hoffmann R., Stein N., Schreiber F. HTPheno: an image analysis pipeline for high-throughput plant phenotyping. // BMC Bioinformatics. 2011, vol. 12, p. 148.

29. Herridge R.P., Day R.C., Baldwin S., Macknight R.C. Rapid analysis of seed size in Arabidopsis for mutant and QTL discovery. // Plant Methods, 2011, vol. 7, no. 3.

30. High-Throughput Image Reconstruction and Analysis (Bioinformatics & Biomedical Imaging). / Eds. Rao A.R., Cecchi G.A. // Norwood: Artech House, inc., 2009, 339 p.

31. Houle D., Govindaraju D.R., Omholt S. Phenomics: the next challenge. //Nat. Rev. Genet. 2010, vol. 11, no. 12, p. 855-866.

32. Kaminuma E., Heida N., Tsumoto Y., Yamamoto N., Goto N., Okamoto N., Konagaya A., Matsui M., Toyoda T. Automatic quantification of morphological traits via three-dimensional measurement of Arabidopsis. // Plant J.2004, vol. 38, p. 358-365.

33. Kaminuma E., Yoshizumi T., Wada T., Matsui M., Toyoda T. Quantitative analysis of heterogeneous spatial distribution of Arabidopsis leaf trichomes using micro X-ray computed tomography. // Plant J., 2008, vol. 56, p. 470-482.

34. Kaminuma E., Yoshizumi T., Wada T., Matsui M., Toyoda T., Quantitative analysis of heterogeneous spatial distribution of arabidopsis leaf trichomes using micro x-ray computer tomography. // Plant J., 2008, vol. 56, no. 13, p. 470-482.

35. Kearsey J.M. The principles of QTL analysis (a minimal mathematic approach). // J. Exp. Bot., 1998, vol. 49, p. 1619-1623.

36. Krupnov V.A., Tsapaikin A.P. Wheat Leaf Description: Genetic and Ecological Aspects. // Selkh. Biol., Ser. Biol. Rast. 1990, vol. 1, p. 51-57.

37. Larkin J.C., Young N., Priggel M., Marks M.D. The control of trichome spacing and number in Arabidopsis. // Development, 1996, vol. 122, p. 997-1005.

38. Leifer A.M., Fang-Yen C., Gershow M., Alkema M.J., Samuel A.D. Optogenetic manipulation of neural activity in freely moving Caenorhabditis elegans. // Nat. Methods. 2011, vol. 8, p. 147-152.

39. Levin A. Role of trichomes in plant defense. // The Quarterly Review of Biology. 1973, vol. 48, p. 3-15.

40. LHDetect2: Leaf image processing for wheat hairiness. Available at http://wheatdb.org/lhdetect2.

41. Likhenko I.E. On Relation between Leaf Pubescence of Spring Bread Wheat and Economically and Biologi cally Valuable Traits in Western Siberia. // Rastenievodstvo Sel. 2007, vol. 6, p. 25-31.

42. Lockhart D.J., Dong H., Byrne M.C., et al. Expression monitoring by hybridization to high-density oligonucleotide arrays. // Nat. Biotechnol., 1996, vol. 14, p. 1675-1680.

43. Lum C., Maze J. A multivariate analysis of the trichomes of Hedera L., // Watsonia, 1989, vol. 17, no. 4, p. 409^118.

44. Mardis E.R. The impact of next-generation sequencing technology on genetics. // Trends Genet. 2008, vol. 24, p. 133-141.

45. Mathekga, Trichome morphology and ultrastructure of Helichrysum Caespetitium, University of Pretoria, 2008, p. 74-91.

46. Mauricio R. Mapping quantitative trait loci in plants: uses and caveats for evolutionary biology. //Nat. Rev. Genet., 2001, vol. 2, p. 370-381.

47. Mile J., Sala A., Bergamaschi S., Pecchioni N. A genotypic and phe-notypic information source for marker-assisted selection of cereals: the CEREALAB database. // Database, 2012, vol. 2011, article ID baq038, doi: 10.1093/database/baq038.

48. Nagata T., Todoriki S., Hayashi T., Shibata Y., Mori M., Kanegae H., Kikuchi S. g-Radiation Induces Leaf Trichome Formation in Arabidopsis // Plant Physiology, 1999, vol. 120, p. 113-119.

49. NIG Mouse Phenotype Database. http://molossinus.lab.nig.ac.jp/phenotype/index.html

50. Ohlander R., Price K., Reddy D.R. Picture Segmentation Using a Recursive Region Splitting Method. // Computer Graphics and Image Processing, 1978, vol. 8, p. 313-333.

51. Oksanen J. Multivariate Analysis of Ecological Communities in R: vegan tutorial, 2009, 43 p. (http://cc.oulu.fi/~jarioksa/opetus/metodi/vegantutor.pdf).

52. Perazza D., Herzog M., Houlskamp M., Brown S., Dome A.-M., Bonneville J.-M. Trichome cell growth in Arabidopsis thaliana can be derepressed by mutations in at least five genes. // Genetics 1999, vol. 152, p. 461-476.

53. Pshenichnikova T.A., Lapochkina I.F., Shchukina L.V. The inheritance of morphological and biochemical traits introgressed into common wheat (Triticum aestivum L.) from Aegilops speltoides Tausch. // Genet Resour Crop Evol, 2007, vol. 54, p. 287-293.

54. R-project: R: A language and environment for statistical computing, available at http://www.R-project.org.

55. Roberts J J., Gallun R.L., Patterson F.L., et al. Effects of Wheat Leaf Pubescence on the Hessian Fly. // J. Econ. Entomol., 1979, vol. 72, no. 2, p. 211214.

56. Rueden C.T., Eliceiri K.W. Visualization approaches for multidimensional biological image data//BioTechniques, 2007, vol 43, no. 31, p. 33-36.

57. Schena M, Shalon D, Davis RW, Brown PO. Quantitative monitoring of gene expression patterns with a complementary DNA microarray. // Science, 1995, vol.270, p. 467^170.

58. Schillinger J.A., Gallun R.L. Leaf Pubescence of Wheat as a Deterrent to the Cereal Leaf Beetle, Oulema melanopus. // Ann. Entomol. Soc. Am., 1968, vol. 61, no. 4, p. 900-903.

59. Shapiro L.G., Stockman G.C. «Computer Vision», 2001, New Jersey: Prentice-Hall, p. 279-325.

60. Sol Genomic Network, http://solgenomics.net/

61. Szabados L., Savoure A. Proline: a multifunctional amino acid. // Trends in Plant Science, 2009, vol. 15, no. 2, p. 89-97.

62. Tanabata T., Shibaya T., Hori K., Ebana K., Yano M. SmartGrain: High-throughput phenotyping software for measuring seed shape through image analysis. II Plant Physiology. 2012, vol. 160, no. 4, p. 1871-1880.

63. The Visible Human Project. http://www.nlm.nih.gov/research/visible/visiblehuman.html

64. Thorisson G.A., Muilu J., Brookes A.J. Genotype-phenotype databases: challenges and solutions for the post-genomic era. // Nat Rev Genet., 2009, vol. 10, no. l,p. 9-18.

65. Tian D., Tooker J., Peiffer M., Chung S.H., Felton G.W. Role of trichomes in defense against herbivores: comparison of herbivore response to woolly and hairless trichome mutants in tomato (Solanum lycopersicum). // Planta, 2012, vol. 236, p. 1053-1066.

66. Tissier A. Glandular trichomes: what comes after expressed sequence tags? // The Plant Journal, 2012, vol. 70, p. 51-68.

67. Vankadavath R.N., Hussain A.J., Bodanapu R., Kharshiing E., Basha P.O., Gupta S., Sreelakshmi Y., Sharma R. Computer aided data acquisition tool for high-throughput phenotyping of plant populations. // Plant Methods., 2009, vol. 5, p. 18.

68. VPhenoDBS: Maize, http://vphenodbs.rnet.missouri.edu/index.php

69. Weigel D., Mott R. The 1001 Genomes Project for Arabidopsis thaliana. // Genome Biology, 2009, vol. 10, p. 107.

70. Yazdanbakhsh N., Fisahn J. High throughput phenotyping of root growth dynamics, lateral root formation, root architecture and root hair development enabled by PlaRoM. // Functional Plant Biology, 2009, vol. 36, p. 938-946.

71. Young I.T., Gerbrands J.J., van Vliet L.J. Fundamentals of Image processing. // Delft University of Technology, 1997, 113 p.

72. Дадцингтон К., Эволюционная ботаника. // М: "Мир", 1972. 308 с.

73. Дорошков А.В., Арсенина С.И., Пшеничникова Т.А., Афонников Д.А. Применение компьютерного анализа микроизображений листа для оценки характеристик опушения пшеницы Triticum aestivum L. II Информационный вестник ВОГиС, 2009, т. 13, № 1, с. 218-226.

74. Дорошков А.В., Пшеничникова Т.А., Афонников Д.А. Анализ особенностей морфологии и наследования опушения листа пшеницы Triticum aestivum L. С помощью компьютерных методов фенотипирования. // Генетика, 2011, т. 47, № 6, с. 836-841.

75. Драгавцев В.А. Библиография деятелей науки. СПб: ГНУ ГНЦ РФ ВИР, 2005, с. 6.

76. Драгавцев В.А., Цильке Р.А., Рейтер Б.Г. и др. Генетика признаков продуктивности яровых пшениц в Западной Сибири. Новосибирск: СО АН, 1984. 121с.

77. Ибрагимова С.С., Колодяжная Я.С., Герасимова С.В., Кочетов А.В. Частичная супрессия гена пролиндегидрогеназы увеличиваетустойчивость растений к различным видам абиотических стрессов. // Физиология растений, 2012, т. 59, № 1, с. 99-107.

78. Ковалев В.А. Анализ текстуры трехмерных медицинских изображений // Минск: «Белорусская наука», 2008, 263 с.

79. Козлов К.Н. Реконструкция регуляторной сети генов сегментации в эмбрионе дрозофилы по экспериментальным данным изображениям картин активности генов, 2012.

80. Колодяжная Я.С., Титов С.Е., Кочетов A.B., Комарова М.Л., Романова A.B., Коваль B.C., Шумный В.К. Оценка солеустойчивости растений табака Nicotiana tabacum, несущих антисмысловой супрессор гена пролиндегидрогеназы. // Генетика, 2006, т. 42, с. 278-281.

81. Крупнов В.А., Цапайкин А.П. Опушение листьев пшеницы: генетические и экологические аспекты // Сельскохозяйственная биология. Серия «Биология растений». 1990, № 1. с. 51-57.

82. Лотова Л.И. Ботаника: морфология и анатомия высших растений: учебник. / Изд. 3-е, испр. // М.: КомКнига, 2007, 512 с.

83. Мирославов Е.А. Структура и функция эпидермиса листа покрытосемянных растений//Ленинград: «Наука», 1974, 120 с.

84. Рогачев С. Обобщенный Model-View-Controller. URL: http://rsdn.ru/article/patterns/generic-mvc.xml.

85. Серебрякова Т.И., Воронин Н.С., Еленевский А.Г. и др. Ботаника с основами фитоценологии: анатомия и морфология растений: учебник для вузов. // М.: ИКЦ «Академкнига», 2007, 543 с.

86. Тимонин А.К. Ботаника: Высшие растения Т. 3. // М.: Издательский Центр «Академия», 2007, 352 с.

87. Шарова Е.И. Клеточная стенка растений. // С.Пб.: изд-во С.ПбГУ, 2004, 156 с.

88. Яковлев Т.П., Челомбитько В.А. Ботаника: учебник для вузов / Под ред. Р.В. Камелина// С-П.: СпецЛит, издательство СПХФА, 2003, 647 с.