Бесплатный автореферат и диссертация по биологии на тему
Анализ онтогенетических спектров гетерогенных популяций
ВАК РФ 03.02.08, Экология (по отраслям)

Автореферат диссертации по теме "Анализ онтогенетических спектров гетерогенных популяций"

На правах рукописи

г¿¿-е^

ИВАНОВ Сергей Михайлович

АНАЛИЗ ОНТОГЕНЕТИЧЕСКИХ СПЕКТРОВ ГЕТЕРОГЕННЫХ ПОПУЛЯЦИЙ

Специальность: 03.02.08 - экология (биологические науки)

АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата биологических наук

1 1 СЕН 2014

Нижний Новгород 2014

005552371

Работа выполнена на кафедре биологии Федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Марийский государственный университет»

Научный руководитель: доктор биологических наук,

профессор Марийского государственного университета

Глотов Николай Васильевич

Официальные оппоненты: доктор биологических наук, профессор,

ведущий научный сотрудник Института экологии растений и животных УрО РАН Безель Виктор Сергеевич

кандидат биологических наук, старший преподаватель кафедры экологии Нижегородского государственного университета им. Н.И. Лобачевского Якимов Василий Николаевич

Ведущая организация: Институт экологии Волжского бассейна

РАН (г. Тольятти)

Защита диссертации состоится «15» октября 2014 г. в 15:00 часов на заседании диссертационного совета Д 212.166.12 при Нижегородском государственном университете им. Н. И. Лобачевского (ННГУ) по адресу: 603950, г. Нижний Новгород, пр. Гагарина, д. 23, корп. 1, биологический факультет.

E-mail: dis212.166.12@gmail.com факс: (831) 462-30-85

С диссертацией можно ознакомиться в библиотеке и на сайте ННГУ по адресу: https://diss .unn.ru/396, с авторефератом — в сети Интернет на сайте ВАК России по адресу: http://vak2.ed.gov.ru/catalogue.

Автореферат разослан «26» августа 2014 г.

Учёный секретарь диссертационного совета, кандидат биологических наук

М.С. Снегирева

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Исследование онтогенетической (возрастной) структуры популяций растений и лишайников является в настоящее время одним из важных разделов популяционной биологии, имеющим выходы в задачи биоиндикации, сохранения и рационального использования природных ресурсов (Уранов, 1975; White, 1985, Ценопопуляции ..., 1988; Злобин, 1989; Roach, 1993; Михайлова, Воробейчик, 1999; Суетина, 2001; Суетина, Глотов, 2010, Марков, 2012). Оценка и сравнение онтогенетических спектров популяций проводятся при этом или визуально, или с использованием традиционных методов статистики по суммарным данным без учета организации сбора материала и внутренней гетерогенности выборки (Ценопопуляции 1988). В

результате биологические выводы или не используют всю информацию, содержащуюся в собранном полевом материале, или, более того, приводят к искаженным заключениям, упрощая представление об организации природных популяций.

Цель настоящей работы - разработка методов статистического анализа онтогенетической структуры популяции, учитывающих гетерогенность популяций растений и эпифитных лишайников в пространстве (или во времени), адекватных методу сбора полевого материала.

Задачи исследования:

1. Разработать методы оценки и сравнения параметров онтогенетических спектров и сравнения собственно спектров природных популяций.

2.Апробировать предложенные подходы на материалах природных популяций некоторых видов растений и эпифитных лишайников.

3.Реализовать разработанные подходы в удобных для пользователя (биолога) компьютерных программах.

Научая новизна работы. Впервые разработаны подходы к анализу онтогенетических спектров природных популяций при гетерогенности выборок, представленных несколькими субвыборками: оценка и сравнение параметров онтогенетических спектров с помощью процедур ресамплинга (бутстреп, перестановочный тест); использование метода главных компонент; использование регрессионных моделей для упорядоченных классов. Показана эффективность предложенных подходов на материалах из природных популяций некоторых видов растений и эпифитных лишайников. Предложенные методы реализованы в компьютерных программах.

Научно-практическая значимость. Результаты исследований могут быть использованы при характеристике демографической структуры

популяций растений и лишайников в лабораториях, разрабатывающих данную проблематику (Московский педагогический государственный университет, Институт экологии растений и животных УрО РАН, Институт биологии Коми НЦ УрО РАН, Башкирский государственный университет, Центральный сибирский ботанический сад СО РАН). Разработанные подходы используются в научной работе сотрудников кафедры биологии Марийского государственного университета, в учебном процессе при чтении курсов «Математические методы в биологии», «Компьютерная биометрия», при анализе материалов дипломных работ.

Положения, выносимые на защиту:

1.В условиях гетерогенности популяционной выборки эффективными методами оценки и сравнения онтогенетических спектров популяции являются

- анализ параметров (получение точечных и интервальных оценок параметров, сравнение параметров) с помощью методов ресамплинга;

- применение метода главных компонент к распределению частот онтогенетических групп в популяции;

- применение методов порядковой регрессии, учитывающей направленную последовательность онтогенетических переходов, к частотам онтогенетических групп в популяции.

2. Компьютерные программы реализации предлагаемых процедур, удобные для пользователя-биолога

Апробация работы и публикации. Результаты исследований были представлены на конференции преподавателей и студентов Биолого-химического факультета МарГУ «Актуальные проблемы экологии, биологии и химии» (Йошкар-Ола, 2011), на научном семинаре кафедры ботаники и микологии МарГУ (Йошкар-Ола, 2011), на V Международной конференции «Принципы и способы сохранения биоразнообразия» (Йошкар-Ола, 2013).

По теме диссертации опубликовано 7 работ, в том числе 3 в изданиях, рекомендованных ВАК. Создана программа для оценки и сравнения параметров онтогенетических спектров популяций растений и лишайников при гетерогенности выборки «OntoParam» (http ://marsu.ru/structur/BasicUnits/fackultet/bhCprogram.php), получено

свидетельство о государственной регистрации программы для ЭВМ № 2014614672. Создана программа для анализа онтогенетических спектров популяций растений и лишайников при помощи регрессии для упорядоченных классов «OntoORM» (http://marsu.ru/structur/BasicUnits/ fackultet/bhCprogram.php).

Личный вклад автора. Исследования выполнены при непосредственном участии автора на всех этапах работы: формулировка конкретных задач исследования, анализ данных литературы, разработка

методов статистического анализа, апробация предложенных методов на материалах из природных популяций видов растений и зпифитных лишайников, собранных сотрудниками кафедры биологии МарГУ, написании компьютерных программ. Автор принимал участие в популяционных сборах лишайников.

Объем и структура диссертации. Диссертации состоит из введения, 6 глав, заключения, выводов, списка цитированной литературы. Объем работы составляет 116 страниц, в том числе 42 таблицы, 32 рисунка. Список цитированной литературы включает 104 наименования, в том числе 29 на английском языке.

Благодарности. Автор выражает глубокую признательность научному руководителю д.б.н., профессору Н.В. Глотову за неоценимую помощь в работе над диссертацией; Автор благодарит к.ф.-м.н., доцента Г.Ю. Софронова (Macquarie University, Sydney) за помощь в работе над методами анализа, к.б.н, доцента Ю.Г. Суетину и к.б.н., доцента А.Б. Трубянова за обсуждение результатов и критические замечания. Автор признателен за предоставленные материалы к.б.н, доценту О.В. Жукову, к.б.н, доценту JI.B. Прокопьеву, к.б.н, доценту Ю.Г. Суетину, к.б.н А.А. Теплых, аспиранту Е.И. Ямбердову. Автор благодарит сотрудников кафедры биологии МарГУ за полезные советы и внимание. Автор благодарит своих родных и близких за постоянную поддержку.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Глава 1. Онтогенетическая структура популяций растений и

лишайников

В главе рассматриваются принципы дискретного описания онтогенеза растений и эпифитных лишайников (Работнов, 1950; Уранов 1975, Ценопопуляции ..., 1988; Суетина, 2001). Приводятся параметры онтогенетических спектров, которые будут в дальнейшем использоваться в работе. Рассматривается гетерогенность онтогенетических спектров выборок из природных популяций, представленных несколькими субвыборками. Показана необходимость учета гетерогенности онтогенетических спектров субвыборок в пределах выборки при анализе данных.

Глава 2. Материалы и методы

Традиционные методы статистического анализа можно разделить на две большие группы: параметрические и непараметрические. При построении параметрических моделей делается ряд предположений относительно закона распределения анализируемых данных. Если предположения анализа не выполняются, то использование этих методов

может быть некорректным. Применение непараметрических методов не требует предположений относительно принадлежности распределения к каким-либо теоретическим семействам, но для целого ряда параметрических моделей не существуют непараметрических аналогов. Альтернативой традиционным методам является использование процедур ресамплинга (resampling) (Manly, 2007; Шитиков, Розенберг, 2013). В нашей работе используются два метода ресамплинга: бутсгреп (bootstrap), и перестановочный тест (permutation test). Бутстреп часто используется при оценке параметров и построении доверительных интервалов (Эфрон, 1988). Перестановочные тесты применяются для проверки статистических гипотез (Good, 2006).

Метод главных компонент обычно применяется для снижения размерности изучаемых данных и выявления наиболее информативных переменных (Айвазян, 1989). Метод заключается в преобразовании многомерных данных таким образом, чтобы матрица корреляций (или ковариаций) исходных переменных стала диагональной, что возможно для любой невырожденной матрицы. Если матрица главных компонент вырожденная, то несколько из последних главных компонент не будут

вносить вклад в общую изменчивость.

В регрессионной модели для упорядоченных классов (ordinal régression model, Agresti (2002) также использует термин cumulative link models) учитывается последовательность онтогенетических состояний (Kleinbaum, Klein, 2010). Модель в общем виде можно представить следующим образом:

= i = l,..„и; j = l,...,J-l.

В рамках данной модели различия между распределениями выражаются одним числом - Х(3 (эффект).

Предлагаемые методы анализа были апробированы на материалах по онтогенетической структуре двух видов растений - манжетки обыкновенной {Alchemilla vulgaris L.s.l.) и брусники обыкновенной (Vaccinium vitis-idaea L.) - и трех видов эпифитных лишайников -гипогимнии вздутой {Hypogymnia physodes L.), эвернии сливовой (Evernia prunastri (L.) Ach.) и псевдэвернии шелушащейся (Pseudevernia furfuracea (L.) Zopf). Материалы были собраны в разных частях Республики Марий Эл и в черте города Яранска Кировской области. Объем материала представлен в таблице 1.

Глава 3. Гетерогенность онтогенетических спектров популяций

На примере имеющихся у нас данных по природным популяциям растений и лишайников проверяется гомогенность субвыборок в пределах выборок. Подробно рассматривается вопрос о корректности применения,

Таблица 1

Характеристика материала из природных популяций растений и лишайников

Объект исследования Общий объем материала Число выборок Средний объем выборки Пределы объемов выборок Среднее число субвыборок в выборке Средний объем субвыборки Пределы объемов субвыборок

Манжетка обыкновенная 7993 особи 15 532 80-1699 13,9 38,2 1-355

Брусника обыкновенная 38025 парциальных кустов 10 3802 1498-7117 28,8 132 5-778

Гипогиминя вздутая 14775 слоевищ 3 4925 3562-7561 15,3 321,2 4-1229

Эверния слизовая 49803 слоевища 14 3557 197-10373 11,8 301,8 1-2623

Псевдэвершш шелушащаяся 8014 слоевищ 11 728 363-1860 14,5 50,1 1-359

обычного в этом случае, критерия хи-квадрат. На данных по манжетке показано, в каких случаях необходимо проводить объединение соседних строк или столбцов. В случае слабонасыщенных данных лучше попытаться воспользоваться точным критерием Фишера, обобщенным для таблиц сопряженности Я* С (А^еэП, 2002). Для иллюстрации выявленной гетерогенности находили отношение дисперсии частоты особей определенного онтогенетического состояния, вычисленной с учетом гетерогенности субвыборок в пределах выборки (Кокрен, 1976), к дисперсии без учета гетерогенности; для гомогенной выборки это отношение равно 1.

Анализ данных по манжетке показал, что из 15 выборок гетерогенными являются 9 (для одной выборки р = 0,0045, для остальных р < 1,6-10"5), одна выборка очень близка к 1%-му уровню значимости (р = 0,0099), остальные 5 выборок гомогенны (р = 0,016-0,258). В целом данные являются гетерогенными. Для 11 выборок из 15 хотя бы для одного онтогенетического состояния дисперсия с учетом гетерогенности отличается от дисперсии без учета гетерогенности более чем в 3 раза; для одной из выборок по частоте особей онтогенетического состояния & отношение дисперсий больше 19, что свидетельствует о сильной гетерогенности субвыборок в пределах выборки.

Анализ данных по бруснике показал, что все выборки являются сильно гетерогенными (р < 10'13). В каждой выборке хотя бы по одному онтогенетическому состоянию отношение дисперсии с учетом гетерогенности к дисперсии без учета гетерогенности больше 3,5; в двух выборках (5 и ИЗ) отношение больше 10 для некоторых онтогенетических состояний, что явно указывает на гетерогенность выборок.

Анализ данных по гипогимнии показал, что все выборки являются сильно гетерогенными (р < 10"15). Все отношения дисперсий с учетом гетерогенности к дисперсиям без учета гетерогенности больше 3,5. Для онтогенетического состояния V! выборки на липе дисперсии отличаются почти в 80 раз.

Анализ данных по эвернии показал, что все выборки являются сильно гетерогенными (для выборки 6в р = 0,00022, для остальных р < 10"15). Во всех выборках, за исключением одной, отношение дисперсии с учетом гетерогенности к дисперсии без учета гетерогенности больше 10 хотя бы для одного онтогенетичского состояния.

Анализ данных по псевдэвернии показал, что 9 ш 11 выборок являются гетерогенными (р < 0,005). Во всех выборках отношение дисперсии с учетом гетерогенности к оценке без учета гетерогенности больше 2 хотя бы для одного онтогенетичского состояния, для 8 выборок из 11 — больше 4 бы для одного онтогенетичского состояния.

Таким образом, проведенный анализ свидетельствует о выраженной гетерогенности субвыборок в пределах выборки для всех изученых

объектов, следовательно, анализ на основе суммарных спектров выборок будет некоррекктным.

Глава 4. Оценка п сравнение параметров онтогенетических спектров популяций

В главе рассмотрена полная схема алгоритма решения задачи оценки и сравнения параметров онтогенетических спектров выборок - А, I, и 12. Остановимся на непосредственно интересующем нас варианте, когда распределения субвыборок различаются в пределах выборки.

Для проверки гипотезы о равенстве значений параметра во всех выборках проводится перестановочный тест на основе модели I дисперсионного анализа (ДА). Из множества значений параметра разных субвыборок случайным образом формируются новые псевдовыборки того же объема. Для полученной в ходе рандомизации псевдовыборки вычисляем ^-значение из модели I ДА. Процедура рандомизации повторяется многократно (число итераций для всех процедур равно 10000), в результате получаем распределение значений для «переставленных» данных и одно значение для исходных данных Рехр. В предположении равенства значений параметров выборок /^-значения и для исходных данных, и для полученных при «перестановке» должны подчиняться одному распределению. Вероятность отсутствия различий между выборками равна доле тех ^-значений, полученных в ходе рандомизации, которые больше значения для исходных данных > Гехр.

Для проведения попарных сравнений используется перестановочный тест, основанный на парных сравнениях по Шеффе, аналогичный изложенному выше. Отличия заключаются в следующем: «перестановки» осуществляются только между сравниваемыми выборками и вместо Г-значения модели I ДА используется значение из критерия Шеффе.

Для нахождения точечной оценки и доверительного интервала доли изменчивости, вносимой различиями между выборками, используется бутстреп-процедура, основанная на модели II ДА. Шаг процедуры - в пределах каждой выборки проводится бутстреп: из-множества значений параметра субвыборок случайным образом с повторениями формируется новая псевдовыборка. Объем псевдовыборки равен объему выборки. Для полученных псевдовыборок вычисляются доли изменчивости, как это делается в модели II ДА. Шаг бутстрепа повторяется многократно, в результате получаем распределение доли изменчивости (полученных псевдовыборок), на основании которого находим точеную оценку и ее доверительный интервал.

Оценка параметра онтогенетического спектра (в случае гетерогенности выборки) также проводится с помощью процедуры бутстрепа.

Для того, чтобы учесть объем субвыборки используется процедура взвешивания. Дня этого каждому значению параметра, вычисленному для субвыборки, присваивается вес. При анализе индекса возрастности Д в качестве веса субвыборки используется объем выборки, для индекса восстановления используется сумма числа прегенеративных и генеративных особей, для индекса старения - сумма числа прегенеративных, генеративных и постгенеративных. При этом взвешенное среднее значений параметра субвыборок будет равно значению параметра выборки, вычисленному для суммарного спектра выборки. Для того, чтобы вычислить среднюю сумму квадратов, необходимо определить число степеней свободы, то же касается вычисления дисперсий и корреляций. Так как единицей наблюдения является субвыборка, общее число степеней свободы на единицу меньше числа субвыборок.

Выборки манжетки значимо различаются по индексу, возрастности А (р = 0,0003), по индексу восстановления II (р = 0,0001) и по индексу старения 12 (р = 0,0001). Результаты парных сравнений и оценки значения параметра выборок можно представить в наглядной форме (рис. 1). Ось внизу рисунка задает значения параметра, над ней расположена вторая ось, на которой точками отмечены значения А для каждой из выборок. Линии, расположенные выше осей, показывают, что между выборками, над которыми расположены концы этих линий, имеет место статистически значимая разница. Доля ' изменчивости между выборками в общей изменчивости по индексу возрастности Д составляет 0,375 (95%-ый доверительный интервал - 0,225-0,541), по индексу восстановления I, -0,536 (0,422-0,664); по индексу старения 12 - 0,402 (0,286-0,537).

Выборки брусники значимо различаются по всем параметрам онтогенетических спектров: по индексу возрастности р = 0,0001, по индексу восстановления р = 0,0001 и по индексу старения р = 0,0048. Доля изменчивости между выборками в общей изменчивости по индексу возрастности Д составляет 0,208 (95%-ый доверительный интервал - 0,1360,290), по индексу восстановления I, - 0,358 (0,279-0,443); по индексу старения 12 -0,108 (0,034-0,202).

При анализе данных по гипогимнии доля изменчивости между выборками в общей изменчивости по индексу возрастности Д составляет 0,473 (95%-ый доверительный интервал - 0,057-0,807), по индексу восстановления I! - 0,491 (0,019-0,822); по индексу старения 12 - 0,478 (0,233-0,689). При этом оказалось, что доверительные интервалы для доли изменчивости по индексу возрастности и индексу восстановления охватывают 75% и 81% множества возможных значений. Распределения доли влияния, полученные в ходе процедуры ресамплинга, для этих параметров онтогенетических спектров являются двувершинными (рис. 2, слева). Рассмотрение спектров субвыборок гипогимнии (рис. 3) показало,

Жд

0,55

Гр2

-«-у-

К2| ГрЭ Гр1

Ср

М2

|| К1

Рисунок I. Сравнение индекса возрастности Д разных выборок манжетки.

Внизу - шкала значений А; выше - положение выборок на шкале Д; — р < 0,001;---р < 0,01;.....р < 0,05

что онтогенетический спектр дерева 22 липы сильно отличается от онтогенетических спектров других деревьев липы. Если исключить из рассмотрения дерево 22 липа, то распределения доли влияния, получающиеся в ходе ресамплинга, принимают куполообразный вид (рис. 2, справа). Соответственно, при исключении дерева 22 липа изменяются оценки и доверительные интервалы доли межвыборочной изменчивости: оценка по индексу возрастности А составит 0,692 (95%-ый доверительный интервал - 0,489-0,827); по индексу восстановления I, - 0,710 (0,517-0,853); по индексу старения 12 доля межвыборочной изменчивости не меняется — 0,494 (0,218-0,720). Увеличение доли межвыборочных различий при исключении дерева 22 липа объясняется уменьшением внутривыборочных различий в выборке липа.

Выборки эвернии значимо различаются по всем параметрам онтогенетических спектров: по индексу возрастности р = 0,0003, по индексу восстановлешы р = 0,0008 и по индексу старения р = 0,0013. Доля изменчивости между выборками в общей изменчивости по индексу возрастности А составляет 0,381 (95%-ый доверительный интервал - 0,2180,604), по индексу восстановления I, - 0,368 (0,195-0,560); по индексу старения 12 - 0,364 (0,19-0,704).

Выборки псевдэвернии значимо различаются по всем параметрам онтогенетических спектров: по индексу возрастности р = 0,0001, по индексу

5

3 -

0,2 0.4 0,6 0,8 1

1

- ь Як.,

1 г

0,2 0,4 0,6 0,8

Рисунок 2. Гистограммы распределения долей влияния для данных по гипогимнии, слева - весь материал, справа — исключено дерево 22 липа

Рисунок 3. Онтогенетические спектры всех деревьев липы, онтогенетический спектр 22 дерева выделен.

восстановления р = 0,0002. Проведение анализа по индексу старения 12 лишено смысла, так как доля слоевищ постгенеративных онтогенетических состояний меньше половины процента, а в 5 из 11 выборок слоевища постгенеративных состояний и вовсе отсутствуют. Доля изменчивости между выборками в общей изменчивости по индексу возрастности Д составляет 0,361 (95%-ый доверительный интервал - 0,211-0,520), по индексу восстановления I! - 0,300 (0,174-0,451).

Для всех объектов исследования проводились парные сравнение значений параметров выборок с учетом их гетерогенности. Если провести парные сравнения выборок без учета гетерогенности (на основании суммарных спектров выборок), то мы получим, что результаты анализа на основе суммарных спектров выборок сильно расходятся с результатами анализа, учитывающего гетерогенность субвыборок в пределах выборки (табл. 2).

Таблица 2

Число значимых на 1%-ом уровне разниц между выборками при их

попарном сравнении

Объект исследования Параметры Суммарные спектры Общее число парных сравнений

Д I. 17

Брусника обыкновенная 13 24 3 45 45

Манжетка обыкновенная 13 25 29 94 105

Гипогимния вздутая 2 2 ! 3 3

Эверния сливовая 23 9 21 91 91

Псевдэверния шелушащаяся 2 0 0 48 55

Глава 5. Применение метода главных компонент

Алгоритм процедуры заключается в следующем. Для каждой субвыборки каждой выборки вычисляются частоты особей всех онтогенетических состояний. Для полученных частот проводится (»-преобразование. По полученным многомерным данным вычисляется корреляционная матрица, на основании которой находим главные компоненты. Так как корреляционная матрица является вырожденной (сумма частот особей онтогенетических состояний равна 1), то вклад последней главной компоненты в общую изменчивость равен 0. По каждой главной компоненте определяется значимость межвыборочных различий и оценивалась доля межвыборочных различий с помощью бутстрепа и перестановочного теста (глава 4).

Для всех исследованных видов выявлена большая или меньшая, но статистически значимая межвыборочная изменчивость онтогенетических спектров. Положение субвыборок в плоскости главных компонент 1 и 2

Выборка Гр 1 Выборка М 1

—I-:-1-1-1-1 ■ iii.li

-15 -1.0 -0.5 0.0 0.5 1.0 1.5 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

Выборка К Выборка КЗ

п-1-1-:-1-г

-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

РС1

"1-:-1-г

-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

РС1

Рисунок 4. Выборки Гр 1, М 1, К, К 3 манжетки в плоскости 1-2 главных компонент. Площадь кружка пропорциональна объему субвыборки

может существенно различаться. В качестве примера приведены данные по 4 выборкам манжетки (рис. 4).

Сопоставление коэффициентов корреляции признаков (частот особей онтогенетических состояний) с главными компонентами явно указывает на разную корреляционную структуру данных по разным объектам исследования. Связано ли это с видовыми особенностями онтогенетических спектров, с характером межвыборочных различий или с экологическими особенностями местообитаний рассматриваемых видов растений и лишайников, требует специального анализа.

На рисунке 5 показаны кривые роста кумулятивной изменчивости с увеличением числа учитываемых главных компонент. Сравнение этих кривых представляет самостоятельную задачу. Однако очевидны различия между популяциями изученных объектов уже по первой главной компоненте.

псевдэверния.

РС1 РС2 РСЗ РС4 РС5 PCS РС7 РС8

Главные компоненты

Рисунок 5. Рост кумулятивной доли межвыборочной изменчивости с увеличением числа главных компонент

Глава 6. Применение регрессионных моделей для упорядоченных классов

Для того, чтобы оценить значимость межвыборочных различий и долю межвыборочной изменчивости в общей изменчивости онтогенетических спектров, строится регрессионная модель для упорядоченных классов со случайными эффектами выборки и субвыборки, причем эффект субвыборки является вложенным (иерархическая модель, nested model):

'иеы6орка ~V'субвыборка)' "выборка ~ М0> \ Vсубвыборка ~ М0> °Ь )"

15

Доля межвыборочных различий в данном случае определяется так же, как и в модели II дисперсионного анализа:

В качестве функции связи в использовали логистическое распределение (логит-модель) и нормальное распределение (пробит-модель).

Возникает вопрос о правомочности модели регрессии для упорядоченных классов к анализу онтогенетических спектров. Обычно в регрессионных задачах мерой согласия теоретической кривой с экспериментальными данными является величина коэффициента детерминации К2. По всей совокупности экспериментальных данных из природных популяций каждого рассматриваемого нами вида растений и лишайников были вычислены теоретические (ожидаемые на основе модели) численности особей всех онтогенетических состояний во всех субвыборках и сопоставлены с наблюдаемыми численностями. Во всех случаях получены высокие значения коэффициентов детерминации (0,8280,941). Таким образом, модель регрессии для упорядоченных классов достаточно хорошо описывает изменчивость онтогенетических спектров.

Для проверки значимости различий между выборками используется критерий отношения правдоподобий.

Выборки манжетки значимо различаются и для логит-модели (р = 1,16-Ю"9), и для пробит-модели (р = 2,78-Ю'10). Оценка доли межвыборочной изменчивости в структуре общей изменчивости для логит-модели равна 0,465, для пробит-модели - 0,510. На рисунке 6 выборки (подписаны снизу) расположены слева направо в порядке увеличения эффекта выборки ивыборка (изображены закрашенными кружками). Незакрашенные кружки - эффект субвыборок Х(3 . Упорядоченные классы позволяют получить наглядное изображение относительной величины межи внутригрупповой изменчивости

Выборки брусники значимо различаются и для логит-модели (р = 1,01-Ю"11), и для пробит-модели (р = 8,39-Ю"10). Оценка доли межвыборочной изменчивости в структуре общей изменчивости для логит-модели равна 0,244, для пробит-модели - 0,213.

Выборки гипогимнии значимо различаются и для логит-модели (р = 1,30-10"7), и для пробит-модели (р = 1,48-10"7). Оценка доли межвыборочной изменчивости в структуре общей изменчивости для логит-модели равна 0,641, для пробит-модели - 0,634.

Выборки эвернии значимо различаются и для логит-модели (р = 1,22-10"7), и для пробит-модели (р = 1,04-10"8). Оценка доли межвыборочной изменчивости в структуре общей изменчивости для логит-модели равна 0,326, для пробит-модели - 0,368.

Выборки псевдэвернии значимо различаются и для логит-модели (р = 6,68-10"4), и для пробит-модели (р = 4,28-Ю"4).Оценка доли межвыборочной изменчивости в структуре общей изменчивости для логит-модели равна 0,297, для пробит-модели - 0,303.

Результаты, полученные с помощью логит- и пробит-моделей, практически не различаются. При возрастании эффекта выборки на рисунках отчетливо прослеживается внутривыборочная изменчивость («разность» эффектов субвыборок). Разумеется, соотношение межвыборочных и внутривыборочных различий (явно разных, по крайней мере, для некоторых выборок) не может совпадать ни с долей влияния, ни с соотношением меж-/внутривыборочной дисперсии.

Использование регрессии для упорядоченных классов для решения задачи анализа онтогенетических спектров гетерогенных популяций ранее не проводилось, однако эта модель используется в медицине (например, Bender, Grouven, 1997; Zayeri, 2005; Baker, 2009).

ЗАКЛЮЧЕНИЕ

Разработаны три подхода к анализу онтогенетических спектров популяций: 1) оценка и сравнение параметров онтогенетических спектров, 2) использование метода главных компонент, 3) использование регрессионных моделей для упорядоченных классов. Принципиально важно подчеркнуть, что все три подхода непосредственно учитывают гетерогенность выборок, чего нет в принятом упрощенном анализе, где рассматриваются суммарные данные в неявном предположен™ гомогенности выборок. Важно отметить и различия между подходами. При первом подходе проводится анализ параметров, а не собственно онтогенетических спектров распределений, естественно, при этом используется не вся информация, содержащаяся в экспериментальных данных. При втором подходе анализируются частоты онтогенетических состояний, то есть собственно распределения, однако не учитывается последовательность онтогенетических состояний, вообще говоря, она может быть произвольной. В третьем подходе анализируются частоты онтогенетических состояний с учетом их последовательности от j к sc.

Для всех исследованных объектов показано наличие статистически значимых различий между онтогенетическими спектрами выборок. Однако, на примере множественных сравнений параметров спектров выборок (с учетом внутривыборочной гетерогенности) и множественных сравнений суммарных спектров выборок (без учета внутривыборочной гетерогенности) выявлена некорректность последнего подхода, игнорирующего избыточную изменчивость и приводящего к ошибочным заключениям о различиях между спектрами выборок.

Было проведено сопоставление результатов полученных с помощью трех предложенных методов. В качестве сравниваемых «признаков» возьмем все парные разности между выборками: I) разность между значениями параметра (Д, I, и 12) (оценка и сравнение параметров спектров), 2) евклидово расстояние между выборками (метод главных компонент) и 3) разность между величинами эффектов выборок (регрессия для упорядоченных классов). По этим данным были вычислены коэффициенты ранговой корреляции Спирмена. Сравнение результатов применения метода главных компонент и регрессии для упорядоченных классов показало, что все коэффициенты корреляции статистически высоко значимо отличаются от 0, но их значения не очень велики (0,39-0,60). Это связно, очевидно, с тем, что метод главных компонент не учитывает, а регрессия для упорядоченных классов учитывает последовательность онтогенетических состояний. Результаты по регрессии для упорядоченных классов для разных объектов сильно коррелируют с индексом возрастности Д (0,57-0,84), результаты метода главных компонент также коррелируют с Д, однако значения коэффициентов корреляции меньше (0,28-0,64). Это связано, очевидно, с тем обстоятельством, что Д (как и регрессия для упорядоченных классов) за счет включения в этот показатель весов онтогенетических состояний фактически учитывает последовательность онтогенетических состояний. Корреляции главных компонент и регрессии для упорядоченных классов с индексами 1г и 12 для разных объектов проявляется не столь однозначно, то есть сравнение спектров выборок, скорее, дополняет, а не заменяет сравнение параметров 1[ и 12.

В каждом из предложенных подходов можно оценить долю изменчивости между выборками в общей изменчивости онтогенетических спектров, что в популяционной биологии растений и лишайников ранее не проводилось. В таблице 3 приведена сводка оценки доли межвыборочной изменчивости с использованием разных методов. Заметим, что подробный анализ этих данных, выявление связи межвыборочной изменчивости спектров с разнообразием экологических условий местообитаний, динамикой и развитием местных популяций и т.п. должен быть предметом специального исследования. Для брусники межвыборочная изменчивость параметров и эффектов регресс™ относительно мала, несколько большую оценку дает метод главных компонент, не учитывающий упорядоченность онтогенетических состояний. Относительно большая доля межвыборочной изменчивости характерна для манжетки, при этом метод главных компонент и регрессия для упорядоченных классов дают близкие результаты. Из всех материалов наибольшую межвыборочную изменчивость спектров показывает гипогимния, что связано, скорее всего, с тем, что слоевища разных выборок взяты с разных форофитов. Оценки для эвернии ниже, хотя и здесь выборки взяты с разных форофитов. Наконец,

Таблица 3

Оценка доли межвыборочной изменчивости в структуре общей изменчивости онтогенетических спектров разными методами_

Объект исследования Анализ по параметрам Метод главных компонент Регрессия для упорядоченных классов

Д I. h логит пробит

Брусника обыкновенная 0,208 0,358 0,108 0,407 0,244 0,213

Манжетка обыкновенная 0,375 0,536 0,402 0,460 0,465 0,51

Гипогимния вздутая 0,692 0,710 0,494 0,525 0,641 0,634

Эверния сливовая 0,381 0,368 0,364 0,431 0,326 0,368

Псевдэверния шелушащаяся 0,361 0,300 - 0,268 0,297 0,303

низкие значения межвыборочной изменчивости онтогенетических спектров у псевдэвернии обусловлены, скорее всего, плохой сохранностью слоевищ поздних онтогенетических состояний.

Направление дальнейших исследований мы видим, с одной стороны, в совершенствовании предложенных методов анализа, а с другой, в углубленном исследовании экологических аспектов изменчивости онтогенетических спектров популяций растений и лишайников.

ВЫВОДЫ

1. Для выборок, каждая из которых представлена рядом субвыборок, из природных популяций двух видов растений - манжетки обыкновенной (Alchemilla vulgaris L.s.l.) и брусники обыкновенной (Vaccinium vitis-idaea L.) - и трех видов эпифитных лишайников - гипогимнии вздутой (Hypogymnia physodes L.), эвернии сливовой (Evernia prunastri (L.) Ach.) и псевдэвернии шелушащейся (Pseudevernia Jurfuracea (L.) Zopf) -показана выраженная гетерогенность онтогенетических спектров субвыборок в пределах выборки.

2. Для гетерогенных выборок из природных популяций с помощью методов ресамплинга (бутстреп, перестановочный тест) получены точечные и интервальные оценки параметров онтогенетических

спектров (индекса возрастности А, индекса восстановления I) и индекса старения 12), точечные и интервальные оценки доли межвыборочной изменчивости в общей изменчивости параметров, предложен критерий для сравнения параметров выборок.

3. Сравнение онтогенетических спектров гетерогенных выборок с помощью метода главных компонент и регрессии для упорядоченных классов позволяет устанавливать статистическую значимость межвыборочных разниц и оценивать долю межвыборочной изменчивости в общей изменчивости онтогенетических спектров.

4. Сопоставление разных методов анализа онтогенетических спектров гетерогенных выборок на материалах из природных популяций изученных видов растений и эпифитных лишайников дает согласованные результаты и указывает на то, что предложенные подходы взаимно дополняют друг друга.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ Работы, опубликованные в изданиях перечня ВАК:

Глотов, Н.В. Демографическая структура популяции эпифитного лишайника Evernia prunastri (L.) Ach. в липняках Республики Марий Эл / Н.В. Глотов, Ю.Г. Суетина, А.Б. Трубянов, Е.И. Ямбердова, С.М. Иванов // Вестник Удмуртского университета. - 2012. - Вып. 3 - С. 41-49.

Глотов, Н.В. Онтогенетические спектры популяций эпифитного лишайника Pseudevernia furfurасеа (L.) Zopf / Н.В. Глотов, Г.Ю. Софронов, С.М. Иванов, A.A. Теплых, Ю.Г. Суетина // Современные проблемы науки и образования. - 2014. - № 3. - URL: http://www.science-education.ru/117-13744 (дата обращения: 01.07.2014).

Жукова, О. В. Онтогенетические спектры ценопопуляций Alchemilla vulgaris L.s.l. / O.B. Жукова, С.М. Иванов, Н.В. Глотов // Вестник Удмуртского университета: Биология. Науки о Земле. - 2014. - Вып. 2. - С. 14-20.

Другие публикации:

Иванов, С.М. О задаче сравнения гетерогенных выборок (качественные признаки) / С.М. Иванов // Актуальные проблемы экологии, биологии и химии: Материалы конференции по итогам НИР биолого-химического факультета за 2011 год. - Йошкар-Ола: МарГУ, 2012. -С. 44-45.

Иванов, С.М. Применение метода главных компонент при анализе онтогенетических спектров популяций / С.М. Иванов, Г.Ю. Софронов,

H.В. Глотов // Материалы V Международной научной конференции. — Йошкар-Ола: Map. гос. ун-т, 2013. - Часть II. - С. 197-202.

Глотов, H.B. OntoParam: программа для оценки и сравнения параметров онтогенетических спектров популяций растений и лишайников при гетерогенности выборки / Н.В. Глотов, С.М. Иванов // URL: http://marsu.rii/structur/BasicUnits/fackultet/bhi7program.php (дата обращения:

I.07.2014). - Свидетельство о государственной регистрации программы для ЭВМ №2014614672.

Иванов, С.М. OntoORM: программа для анализа онтогенетических спектров популяций растений и лишайников при помощи регрессии для упорядоченных классов. / С.М. Иванов // URL: http://marsu.ru/structur/ BasicUnits/fackuItet/bhf/program.php (дата обращения: 1.07.2014).

Подписано в печать 13.08.2014 г. Формат 60x84/16. Усл. печ. л. 1,0. Тираж 100. Заказ №К1/1335

Отпечатано с готового оригинал-макета в котщентре «LANFORT» 424001, г. Йошкар-Ола, Гагарина, 2.