Бесплатный автореферат и диссертация по сельскому хозяйству на тему
РАЗРАБОТКА КОМПЬЮТЕРНЫХ ПРОГРАММ И ВАРИАЦИОННО-СТАТИСТИЧЕСКИЙ АНАЛИЗ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ В ПЛОДОВОДСТВЕ
ВАК РФ 06.01.07, Плодоводство, виноградарство
Автореферат диссертации по теме "РАЗРАБОТКА КОМПЬЮТЕРНЫХ ПРОГРАММ И ВАРИАЦИОННО-СТАТИСТИЧЕСКИЙ АНАЛИЗ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ В ПЛОДОВОДСТВЕ"
На правах рукописи
Фролова Светлана Викторовна
РАЗРАБОТКА КОМПЬЮТЕРНЫХ ПРОГРАММ И ВАРИАЦИОННО-СТАТИСТИЧЕСКИЙ АНАЛИЗ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ В ПЛОДОВОДСТВЕ
кандидата сельскохозяйственных наук
МИЧУРИНСК - 2003
Диссертационная работа выполнена в Мичуринском государственном аграрном университете (МнчГАУ)
Научные руководители:
доктор сельскохозяйственных наук, профессор, лауреат государственной премии Российской Федерации, заслуженный деятель науки Российской Федерации Потапов Виктор Александрович кандидат физико-математических наук, доцент Петрушин Владимир Николаевич
Цедущая орган им tutu:
Саратовский государственный аграрный университет им. Н.И.Вавилова.
Защита диссертации состоится 24 « декабря » 2003 г. в 13м на заседании диссертационного совета Д 220.04 i .0 ]. при Мичуринском государственном аграрном университете (МнчГАУ) по адресу: 393760, Тамбовская область, г. Мичуринск ул. Интернациональная, 101.
С диссертацией можно ознакомиться в библиотеке Мичуринского государственного аграрного университета.
Автореферат разослан 21 « номбря » 2003 г.
Отзывы на автореферат в двух экземплярах, заверенные и скреплённые гербовой печатью, просим направлять учёному секретарю диссертационного совета.
Учёный сгкрстлрь днссцнактжшио сонета Д2Ж041.01„ каллилат сельскохозяйственных наук, старший научный сотрудник
Официальные оппоненты:
доктор сельскохозяйственных наук, профессор Бутенко Анатолий Иванович кандидат сельскохозяйственных наук -ЩербенБв Геннадий Яковлевич
Обшан характеристика работы
Ак->УЙЛК1ШГТ1. работы
Установлено, что применение статистических методов позволяет определить необходимое количество основных показателей, которые относительно полно характеризовали бы конкретную совокупность, сформировать репрезентативные выборки иг генеральных совокупностей, сделать надежные заключения о различиях, установить наличие или отсутствие связей между различными признаками.
Важной задачей вариационной статистики, которая успешно решается при грамотном не полью вам и и сс методов, является оптимизация экспериментов, означающая получение максимально возможного количества информации при минимальных затратах труда, средств и времени на проведение исследован и П.
Математическая статистика позволяет оценить экспериментальные данные в отношении точности результатов и достоверности выводов, т.е. установть те допустимые пределы, в которых сделанные выводы являются определёнными и достаточно надежными. Большое значение статистические методы имеют для разыскивания связи, сопряженности, соотношения или корреляции между изучаемыми показателями.
Методы математической статистики не вскрывают сущности и причин явлений (хотя и значительно помогают этому), но описывают, формулируют количественную сторону этих явлений.
Знание современных методов статистической обработки необходимо не только для количественной характеристики наблюдений и полученных в опыте данных, но и на всех этапах эксперимента от планирования до интерпретации окончательных результатов.
На кафедре плодоводства Мичуринского государственного аграрного университета (МичГАУ, бывший Плодоовощной институт имени И.В.Мичурина) профессором Еулаговским В.Н. селекционным путем были получены морозостойкие и зимостойкие слаСорослые клоновыс подвои яблони. На их основе стало возможным создание и возделывание интенсивных высокопродуктивных слаборослых садов в средней полосе России и других регионах с суровыми климатическими условиями.
Исследования с этими подвоями по многим аспектам ведутся в ряде научных учреждений России и других стран, необходимость применения статистических методов в оценке различий, а также специфика опыюв в 1шодоводстве и явились основанием для выполнения настоящей диссертационно ¡1 работы. Цель и задачи исследоианий
Цель работы - разработка комплексной компьютерной программы вари ациопно-сготистич ее кого анализа экспериментальных данных в плодоводстве.
ЦН5МСХА | литарйтурел
Чала<111 - разработка, написание, , тестирование (проверка правильное П1 работы) программы на примерах различных плодовых объектов по разделам:
и вычисление среднего арифметическою, среднего квадратичного отклонения, ошибки среднею арифметического, коэффициента вариации, точности определения среднего арифметическою; он редел ей не существенности ра ¡личий между выборками; и определение существен пост различий между сопряженными выборками;
и определение % сопряженности и существенности различий при данной
проценте сопряженности; и определение необходимого числа повторносгей; и выбраковка сомнительных показателей;
и оценка нри падл еж иостн выборки к нормальному распределению; и определение коэффициента корреляции, уравнение ретреееии; и дисперсионный анализ однофа кторио I о опыта, заложенной) но
стандартной схеме; ■ ■ •
и дисперсионный анализ однофаторного опыта, заложенного по метолу
рен до минированных повторений; и дисперсионный анализ олпофа к горного опыта, заложенного по методу ре н лом н з и ро ваш I ы х повторений, с восстановлением выпавших делянок;
и дисперсионный анализ двух факторного опыта;
и схема определения существенности различий одноч и еловых данных но групповым средним.
Анализ и оценка полученных тестов для различных показателей роста и плодоношения яблони. Научная мовнзнл н практическая ценность
0 пер вые был предложен системный программный подход к нарианионно-статистическому анали ту экспериментальных данных в плодоводстве. Разработанная программа содержит плотно взаимосвязанные между собой алгоритмы обработки данных, т.е.'для одних и тех же выборок выводится к анализу комплекс различных характеристик, а также имеется сравнительная характеристика для различных генеральных совокупностей (одновременно можно сравнивать статистиМеские характеристики или устанавливать существенность различия перебором попарно 100 выборок). Впервые предложена компьютерная программа определения существенности различий между сопряженными выборками, а также процента сопряженности и определения существенности различий при данном проценте сопряженности. Впервые предложена программа определения необходимого количества повторностей н выбраковки сомнительных показателей. Приведены алгоритмы определения принадлежности выборки нормальному распределению и построения уравнения линейной зависимости. Впервые предложено использование программного алгоритма проведения дисперсионного анализа с выпавшими во время опыта данными. Впервые
повторении. Впервые предложен компьютерный вариант схемы дисперсионного анализа с различным количеством новторностей. С теоретической точки зрения - приведён алгоритм использования теории больших уклонении для оценки объёма повторной выборки при отсутствии сведений о распределении генеральной совокупности, использование которого позволяет плодоводам корректно ставить опыты и эксперименты и правильно использовать для анализа полученных результатов алгоритмы вариационной статистики, Впервые предложена схема оценки существенности различий од ночи еловых данных по групповым средним. Апробации работы
Основные результаты исследований были доложены на заседаниях кафедры плодоводства МичГау; международиuх научно-методических конференциях «Методика исследований и вариационная статистика в научном плодоводстве» (Мичуринск, 1998), «Роль сортов и новых технологий в интенсивном садоводстве» (Орйл, 2003) Публикации результатов исследований
По материалам диссертации опубликовано 8 статей к методические рскоменлзнии.
О бьём >1 структура диссертации
Диссертация изложена на 150 страницах машинописного текста и включает обоснование, восемь глав, выводы и практические рекомендации; содержит 28 таблиц, 1 рисунок, список использованной литературы состоит из 148 источников, в том числе на иностранном языке-15. 11а защиту выносятся следующие основные положения:
Т. Новые и усовершенствованные методики исследований плодовых объектов в вариационной статистике.
2. Обоснование применения теории больших уклонений для оценки объема повторной выборки при неизвестном распределении генеральной совокупности.
3. Применение алгоритмов обработки экспериментальных данных с использованием новых информационных технологий с саженцами плодовых деревьев.
Результаты исследований Во введении обоснована актуальность темы, определена научная новизна и практическая ценность. ГЛАВА К Обзор литературы
Осуществлен обзор публикаций и других литературных данных, касающийся исследований и достижений в вариационной статистике, а также в плодоводстве, в частности'сведения о сорто-подвойных комбинациях и вариационно-статистических исследованиях непосредственно в плодоводстве.
ГЛАВА 2. Условий и объекты исследований Условия проведения исследований
Исследования проведены в 1998 - 2003 гг. при кафедре плодоводства Мичуринского государственного аграрного университета (МичГАУ) -
бывший Плодоовощной институт км. И.В. Мичурина (1931-1994 гг.) и Мичуринская государственная сельскохозяйственная академия (1994-1999), в питомнике учхоза "Комсомолец",
Объектами исследований, проведения первичных учетов, являлись данные кафедры плодоводства МичГЛУ. Экспериментальные замеры, полученные автором в питомнике учхоза "Комсомолец" - конкретные формы подвоев, сортоподвойные комбинации (саженцы сортов: Уэлси, Северный Синап. Жигулевское, Лобо на подвоях 54-118,62-396,69-6-217).
ГЛАВА 3. Средние величины и нх характеристики.
Описываются основные вариационно-статистические характеристики к алгоритмы, которые использованы при создании программы, а также Теоретическое обоснование и примеры их использования по различным показателям плодовых культур (величины окружности штамбов саженцев, количество почек, высота стебля и др.). Для определения тех или иных величин в программе при обработке данных использовались следующие формулы.
Если сумму всех вариант (Х1+ х» + ..Дх,) обозначить через а число всех вариант через п, то формула для определения среднего
арифметического примет следующий вид: л
п
для вычисления дисперсии и среднего квадратичного отклонения
, . 2 Х(х-.г)
используются формулы :<т -
я -1
х - wwifciMwe найлкн)ение
1иСх-хУ
О» S = ^г —-—|——, где * - среднее арифметическое выборки
п • обьйм выборки
Коэффициент вариации вычисляют по формуле:
к inn х~среднее арифметическое выборки
f = — чОО) где
х . S - среднее квадратичное отклонение выборки
Формула вычисления ошибки средней арифметической имеет вид: j
т = -м-, л)* т— ошибка еыборочного среднего арифметического; Vrt
& — среднее квадратическое отклонение; п — число и теремий. повторностей.
Точность среднего арифметического определяют по формуле:
р з —.100, л)е от— ошибка выборочном среднего арифметического; я
х-среднее арифметическое выборки
Критерий существенности пли достоверности разности: fi-^wÜ;"—, где d-разность средних арифметических mj - ошибка этой pa тости
т*пь пи
глава 4. Показатели учётов
Важной задачей любого исследователя является вычисление объёма вторичной выборки лля оценки числовых характеристик распределения любого количественного признака, являющегося одним из биологических показателей растения.
Объекты исследований приведены »таблице: ]. Длина окружности штамбов яблони сорт« Кении шафранный на третий гол
10,6 ил 11,9 1 11 л _ЦзЗ 12Д 1-' 10.9 па 12,1 ЮЛ 12,7' 12.4 12,1 10^4 11,7 12.1 МЛ 12.7 14.8
11,9 12Л 11,5 9,7 11,9 10,9
143 11Л 11,6 12,9 12.5 12.5 13Л 10,9 11.6 11,8 12,7 11,6 14^
ыл 10.6 11 14,6 |2,2~[ 13^4 _'•«-' ИЗ 11,9 12,4 12.0 12.2 12,0 12.7"* 10,7 ¡3.6 12Д 10,6 10,7 12,2 Ш. 14,1
13,7 1М 12,7
П,6 11Л | 10,7 10,9 14.0 12,1 12,7 ИД 12.2 13.0
ОбьСм выборки л--75, размах варьирования Я Л'™."Л'«.414,8-9,7 = 5,1(см), Среднее значение Л' = 1,23(см), дисперсия с2=1,43.
Выборка репрезентативна (т.е. дзет устойчивые оценки числовых характеристик распределения генеральной совокупности), так как при у-0,996+0,894 размах выборки составляет 0,9+0,95 размаха генеральной совокупности. Проверка по критерию Пирсона показала, что с надёжностью у-0,99 у нас нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Следовательно, можно считать, что выборочная средняя подчиняется ^распределению Стьюдента. Объем вторичной выборки при этом определяется по формуле:
.V
I - значение критерия СтъхХкнтз Л»я внСрочной надёжности у объема первичной выборки.
Л - выборочная точность о»ки*.и среднего значения.
При 1^0,95; Д^0,5 см мы получили и-23.
Такой объём вторичной выборки дал результаты, которые наталкивают на мысль о неустойчивости оценок
Л' 11,8 | 12.3 12,5 12.3 12.2
а" 0.72 | 1,73 2.0 1.87 1.03
Пять различных выборок объемом 23 дают приемлемую оценку средней, ко значения о2 отличаются слишком значительно, чтобы их считать устойчивой оценкой.
Вели же делать расчёт объёма выборки на основании эмпирических данных, используют теорию больших уклонений,
|дел-с<>ъ«м »гордой р^итераАПлую оадгнгу сред
< р№1<и>иос1 ью л и «ос» мо /,
- норчнрованмое ьабякияаемоезначеие окружности штамба
-;р -абсашмнаипсчрсшностъ.
Объбм вторичной выборки ирн у-0,95; Л-0,5 см по эмпирическим данным равен 35.
По пяти рамичным выборкам этого объема получены следующие
.v 12,2 12.5 12,4 12,3 123
о* 1.58 1,56 1,73 1.39 1.77
По сравнению с вычислениями в предположении нормального распределения получены гораздо более устойчивые оценки числовых характеристик генеральной совокупности.
С учетом ошибки в оценке среднего квадратичного отклонения, объём вторичной выборки получаем из формулы
л*
При у "0,95; п^-30.
При таком объёме вторичной выборки получены (по пяти различным) следующие оценки числовых характеристик генеральной совокупности:_
X 12,0 12^ 12,5 12,4 12,3
ог 1,48 1,62 2,05 1.41 1,31
Полученные оценки близки к эмпирическим, причем их изменчивость существенно ниже той, которая получается без уч&га ошибки среднего квадрзтнчсского отклонения.
Такая оценочная разница обусловлена рядом причин: критерий Пирсона является мягким критерием, т.к. оценивает плотность распределения вероятностей и слишком зависит от способа группировки данных; оценка объема вторичной выборки по I- распределению Сгьюдента по идеально плавно меняющейся симметричной кривой без всяких ограничений на значение аргумента, чго в природе встретить практически невозможно; числовые оценки, получаемые из первичной выборки, приближенны, и дают приближенное значение объема вторичной выборки. Поэтому целесообразно
для расчёта объвма применять теорию больших уклонений, которая не требует предварительной оценки распределения количественного признака, пригодна как для непрерывных так и дискретных случайных величин, либо, при применении каких-либо распределении, учитывать ошибки в оценках параметров этих распределений по первичной выборке. Формула для определения необходимой численности выборки (п): 12(1±к)-о1
п • -, л>е
л"
{ - критерий ожидаемой вероятности репльтата
среднее каадратичеекое отклонение (определяют предварительно пробными выборками);
Л- догтустииоя погрешность при изучении конкретного показателя, определяется исследователем; к-коэффициент.
Уравнение кривой нормального распределения должно иметь такой вид:
Р'Яъ'*4''
Она представляет непрерывную, плавную, симметричную кривую, которая называется нормальной вариационной кривой, где
Ри — плотность вероятности пояагения переменной х; о— среднее квадратинеское отклонении я — постоянное число, равное 3, ¡4159.,.;
е — основание натуральных яолзрифиов. равное 2,71825...; х— варьирующий приток.
Нормированное отклонение определяется формулой:
17
ГЛАВА 5. Опенка различий Получаемые статистические характеристики необходимы не столько сами по себе, сколько для сравнения или сопоставления между собой пар выборок, для которых получены данные величины, так как порой очень важно оценить существование или отсутствие влияния изучаемого фактора на исследуемые величины.
Имеется много разных способов определения существенности различий между выборками. Одним из таковых является 1 -критерий существенности Сгьюденто. Существенность разности определяется но формуле:
<1 • •
¿де Л - разность Средних, 3 л- ои*ибха этойренноста.
Но I -критерий указывает на существенность различий лишь в том случае, когда они (различия) закономерны, неслучайны, А как быть, если эти различия незакономерны, но каждый элемент выборки (после воздействия на
опытные растения исследуемым фактором) превосходит (либо меньше) соответствующий ему элемент искомой выборки. Такие выборки выделены в
отдельный класс н называются сопряженными. Для выявления существенности различий между такими выборками имеется следующая формула;
Л»?
■У г Ошибка рагности средних ариф иетических, Л - Гатость м?м*)у соответствующими парами выборок, п • Количество цементов, Хл - средияя ртностъ. Коэффициент корреляции вычислялся по формуле:-
хиу~ тначения величин «абтзОйлчыг нриыаков. г- Коэффициент линейной связи, близость его к О означает либо отсутствие связи либо - связь нелинейную.
Вычисление значений коэффициентов а и Ь в уравнении регрессии:
ГЛАВА. 6. Стационарный опыт
Стационарные опыты при изучении различных технологических вопросов в садоводстве закладывают в основном трех видов, с размещением вариантов по той или иной схеме: стандартные (контрольные варианты чередуются через один, два или три варианта испытуемых), систематические (с одинаковой последовательностью размещения вариантов в повторениях) и опыты со случайным (рекломизированным) размещением вариантов в повторениях. Мовторность опытов обычно применяют трех четырехкратную.
В данной главе подробно опиезны алгоритмы однофакторного и двухфакторного дисперсионного анализа с одинаковым и различным числом ловторностсй, а также с восстановлением выпавших данных. Здесь же описан алгоритм анализа од нечисловых данных, описанный ниже.
В статистической и научной литературе по разным специальностям, в журналах, статьях, авторефератах и других изданиях часто приводятся данные, не подтверждённые вариационно-статистическими показателями, что очень затрудняет, а скорее исключает надежность их оценки и
достоверность положительности или отрицательности вариантов и результатов.
Однако приведенные данные не дают оснований для достоверного определения наиболее урожайных сортов и существенности различий между конкретными сортам».
Для оценки достоверности превосходства урожайности того m и иного сорта необходимо вычислить НСР по имеющимся данным.
Как уже было замечено ранее для вычисления МСР (проведения дисперсионного анализа) необходимо наличие значений нескольких вариантов по некоторым повториостям, а именно матрицы.
Для получения таковой матрицы ми значения одночнеловых данных, считаем вторым столбцом, а первый и третий столбец получаем, прибавляя и отнимая соответственно допустимую 10% погрешность значений.
ГЛАВА 7. Руководство по пользованию компьютерной программой.
Данное руководство помогает использовать программу как людям, работающим с вычислительной техникой, так и мало знакомым с ней.
Для того чтобы запустить программу статистической обработки данных на выполнение, можно воспользоваться одним m любых имеющихся для этого способов, опишем наиболее простой из них, для пользователей мало связанных с вычислительной техникой, или совсем не работающих на ней. При включении компьютера на большинстве из современных машин, автоматически загружается системная программа, предназначенная для удобства общения между пользователем и компьютером, операционная оболочка (система) WINDOWS. При атом на экране появляется рабочий стол, на котором располагаются значки некоторых программ. Один из них — это значок необходимой нам программы, которая " имеет имя - ASTRA (ASTRA, EXE).
Теперь для запуска программы, нам остается подвести указатель мышки к искомому значку и дважды (непрерывно) щелкнуть правой кнопкой мышц.
При запуске программы на экране появляется окно, изображенное на рисунке ниже, в котором имеются пронумерованные пункты меню возможной проработки программы, а также место для ввода цифры определяющей соответствующий ей пункт. Совеем ne обязательно соблюдать последовательность ввода пунктов, так как все необходимые промежуточные величины будут вычисляться автоматически. После каждого выбираемого вами пункта меню вам будет предложено ввести величины, касающиеся вашего личного опыта. После проработки программы по выбранному пункту и получению результатов, вам предложат закончить работу (если вы вычислили вс£, uro хотели) или вернуться к пунктам главного меню. При возврате к меню, вы вновь можете выбрать один из предложенных пунктов, к вам будут выданы соответствующие результаты. Назад в меню можно возвращаться сколько угодно раз, обсчитывая те или иные параметры для введенных единожды выборок. Почт все вычисляемые величины могут
сразу вычисляться для нескольких выборок (не больше 100). Для получения результатов по новому опыту работу' с программой необходимо закончить и запустить программу заново, ёслн при наборе данных была донушена ошибка, набранные данные можно стереть клавишей I *r.fi'ckspace |
Но нельзя вносить изменения после ввода данных, если уже нажималась клавиша J Enter I
В этом случае, для новых данных, программу прид&тся запускать заново. Таким образом, ввод данных всегда подразумевает нажатие клавиши [ J Enter \
Далее рассмотрим, как работает вышеупомянутая программа на примере данных, полученных в питомнике учхоза «Комсомолец», а также предоставленных научным руководителем В.Л.Потаповым и другими сотрудниками МичГАУ.
Внешний вил главного меню программы: _
1. Вычисление среднего арн фм этического,
среднего квадратичного отклонения, ошибки среднего а рнфметнческого, коэффициента вариации, точности оа редел синя среднего а рн фмети чес кого.
2. Определение существен кости рязлнчнй ■ между выборками.
3. Определение сушественностн различий между сопряженными выборками.
4. Определение % сопряженности н сушестпсииостн различий при данном проценте сопряженности.
5. Определение необходимои» числа повторы остей,
6. Выбраковка сомнительных показателей.
7. Опенка принадлежности выборки к нормальному распределению.
8. Определение коэффициента корреляции, уравнение регрессии.
Лнспепсиоиный »«алнз;
9. Одиофакторного опыта.
10. Двуафакгорно)« опыта.
11. Анализ одночнелооых данных.
Введите номер необходимого пункта: н нажмите клавишу Enter
Для выходя из программы
Введите-0 •_
?□
Вычисление статистических характеристик
Для вычисления статистических характеристик (среднего арифметического, среднего квадратичного отклонения, ошибки среднего арифметического, коэффициента вариации, точности определения среднего арифметического), нужно выбрать первый из пунктов предложенного меню и нажать цифру 1.
При выборе этого пункта (первично), вас попросят ввести количество повторностсй для которых будут вычисляться данные величины. Л затем будет необходимо ввести по одному элементы каждой обрабатываемой выборки.
Рассмотрим несколько примеров выборок и их вариационно-статистических характеристик по данным, напученным автором в питомнике учхоза «(Комсомолец» в 1998 году.. По мнению автора, исследования зги являются интересными потому, что в них рассматриваются не малые (п<30),а большие выборки.
Были сделаны замеры по двум сортам (Жигулёвское и Уэлси) на карликовом (62-396) и полу карликовом (54-118) подвое. По каждому сорту на отдельном подвое по 210 замеров (окружность штамбов саженцев, см). I: Сорг-ЖигулСйское, полной 61-396 2: Сорт -Жигулёвское, молвой 54-118 3: Сор г — Уши, полной 62-396 4; Сорт-Умен, полной 54-11Я
Полученные данные были обработаны с помощью написанной нами компьютерной программы по определению вариационно-статистических характеристик выборочных величин.
Для указанных выше выборок, результат работы программы был получен а следующем виде:
п N М а М р% \'Го
1 210 136,6 0.65 0,16 0,01 2 25
2 210 1573 0,75 «,1б 0,01 2 22
3 210 та 0,63 0,13 0,01 1 21
4 210 165.1 0,79 0,19 0,01 2 24
п — Номер выборки N - Количество элементен выборки 8 - Сумма элементов выборки
¡VI - Среднее арифметическое значение элементов выборки а - Среднее квадратичное отклонение т - Ошибка среднего арифметического Р% - Точность определения среднего арифметического У% -Коэффициент вариации
(При ручном подсчете нам бы пришлось просчитывать все эти величины но формулам, представленным в главе 3, данной работы).
Затем, нажатием одно Л клавиши, можно либо вернуться в меню и обработать данные выборки по другим нунктам, либо закончить работу с программой. Причём совсем не обязательно начинать с первого пункта, работать можно и с каждым пунктом независимо от других, если в каком-то из пунктов уже в вожмись обрабатываемые величины, то при выадве других пунктов запрашиваемые результаты будут выводиться сразу.
Определение су шест ценности различий между выборками
Для определения существенности различий на компьютере, при вызове одноименного пункта меню нашей программы, после ввода данных выборок из таблицы 3:
Л. Окружности штамба и сажен исв (замеры получены авюроч в учяозе «Комсомолец» <х-(щ.к> 1998 г.) __
ЖнгулЕаское (62396) 0.6 0,6 0,4 0.4 0,6 0,4 03 0,4 0,6 03 03 0,7 03 03
Жигулёвское (54-118) 0,9 ОД 0,6 03 03 1,1 ко 0.9 03 03 03 03 03 03
Умей (62-396) 0,7 0.5 0.3 ад 0,7 03 0,6 03 03 03 03 03 0,9 0.3
Уэлсн (54-118) 0,7 0,9 03 0,7 03 03 0,7 03 1,0 03 м 13 03 03
программа выдаст следующий результат: I -критерий 1-2 выборками 2.87 I -критерий 1-3 выборками 0.57 I -критерий 1-4 выборками 5.04 Т -критерий 20 выборками' 2.12 t -критерий 2-4 выборками 1.18 I -критерий 3-4 выборками 3.77
Причём чуть ниже полученных данных высветятся необходимые лля анализа табличные значения.
Примечании п даиноч пункте программы допуск*пси оСрабогка выборок, как с одинаковый количеством -мементов, так н с различным количеством, при зюч колмчеаво прилагаемых лротрамме выборок для обработки должно быть не меньше 2-х.
Определение сушестпенности различий между сопряженным к выборками
Рассмотрим работу программы по определению существенности различий между сопряженными выборками на примере количества почек .(шт.) саженцев двухлеток сортов Лобо и Северный Синап на подвое 54-118 (замеры получены автором в учхозе Комсомолец осенью 1999 г.) Лобо: 47,38,52,49,49,41,46,52 Северный
Синаи: 39,35,39,44,44, 40,45,51
Запустим программу на выполнение. Выберем пункт меню 3.
Введём данные по запросу программы (количество выборок, количество
элементов в выборках, значения элементов выборок)
Получим следующий результат:! -критерий 1-2 выборками - 3.11
И
н3,11(Ц4„ ^3,11> ^ "2,31) и убеждаемся, что разница существенна (в пользу сорта Л обо).
Определение % сопряженности и существенности различий при данном нроненте сопряженности
Часто при исследовании возникают выборки, в которых не 100%, а иной % сопряженности, т.е. в 70,80 случаях иэ 100 наглядно видны различия, но ни один из методов не укажет на су шест вен ностъ различий. Если отобрать сопряженные пары, и исследовать полученные совокупности как сопряжённые выборки, то выявляется существенность различий. Рассмотрим пример высот саженцев одного сорта на различных подвоях.
Данные для исследований получены второй работы в нкточннке )ч>ои «Комсомолец» осенью 1999 юла для сажснисв двухлеток:
СЕВЕРНЫЙ СИНАП 34-118 50 60 70 90 99 № 73 ¡08 ¡09 ¡28 90,7
СЕВЕРНЫЙ СИНАП 69-6-217 ¡04 ¡05 по ¡09 107 101 56 П9 ¡¡8 ¡08 ¡03,7
Если мы запустим пункт 4. программы обработки данных, компьютер выбракует не сопряженные пары (а их веет три из десяти имеющихся) и исследует полученные выборки как сопряженные, мы получим:
% сопряженности между 1-й—2-й выборками =70% 1- Критерий 1-2 выборками 3,65
(ф*,, - 3,65 > - 2,23. Таким образом, мы получили, что при 70% сопряженности различия между выборками существенны с точки зрения высоты саженца, в пользу нодвоя 69-6-217(хотя при других методах существенность различий не была выявлена).
Примечание! и данном пункте программы допускается обработка выборок, как с одинаковым количеством -мемелтов, так и с различным количеством, При вяолс выборок с равным количеством, лишние элементы больших выборок «обрубаются», именно для обработки данных но угочу пункту, при работе с другими пунктами ввел (иные выборки будут рассматривать«! полностью. Определение необходимого числа новторностей
Естественно, что все исследователи работают с выборками, выборочными наблюдениями, замерами, анализами, вариационными рядами и т.д., стремясь приблизиться к максимально возможной оценке генеральной совокупности или, хотя бы достаточно большой популяции конкретных растений, в том числе и плодовых. Как уже отмечалось ранее, существуют правила, позволяющие получить максимально возможную информацию при минимальных объемах выборок и, следовательно, при минимальных затратах, а именно выяснилось, что обьем выборки должен иметь границы, зависящие от желаемой н возможной точности наблюдений, а также уровня вероятности и вариабельности изучаемого показателя.
Рассмотрим работу программы но определению необходимого числа ловторностей на примере выборки высоты саженцев яблони на подвое
\
54-11$, сорт Лобо, донные собраны в питомнике учхоза «Комсомолец» осенью 1999 гола.
После выбора соответствующего пункта меню программы и ввода
следующих величин _
) 82 1 54 ! 99 | 100 | 44 8 80 | 91.5 I 104 | 107 I 103 I 54 I 135 I 7Э I 1011 109 | 1|Г] Результатом программы получим: Необходимое число повториостеП 0-19 п - Среднее «=9.
Выбраковка сомнительных показателей .
Для обработки данных по этому пункту меню вводим выборки, которые необходимо проверить на наличие сомнительных показателей. Результатом работы программы будут новые выборки, из которых уже выбракованы сомнительные элементы.
Рассмотрим при мер обработки данных программой поэтому пункту.
1. Запустим программу на выполнение.
2. При появлении на экране главного меню программы, выберем пункт б.
3. При запросе о количестве обрабатываемых выборок, введём цифру 1.
4. При запросе о вводе элементов выборки введём данные замеров количества почек у саженцев двухлеток сорта Северный синап, подвой
54-118:
24 26 29 35 40 27 38 36 38
42 20 2Я 30 37 45 39 35 39
44 44 44 47 50 51 33 40 43
45 34 52 за 80 12 30 35
Ввод необходимо производить последовательно по одному элементу по мере запроса программы. . ■ .
В результате мы получим следующее: Выборки имеют вид:
До выйряковки
1: 24 26 29 35 40 27 38 36 38 42 20 28 30 37 45 39 35 39 44 44 44
47 50 5< 33 4Й 43 45 34 92 38 ЯП 12 30 35 После выбраковки -■ .
1:24262935 40 27 38363842 202830 3745 393539 44 44 44 47 50 5! 33 40 43 45 34 92 38 ■ 12 30 35
• Сомнительными в данной выборке на первый взгляд были 2 элемента— 12 и 80, но выбракованным, в соответствии с вышеуказанной формулой, оказался лишь один-80. ■ -
Нужно заметить, что после выбраковки сомнительных элементов, в программе происходит автоматический пересчёт всех статистических характеристик, н уже новые характеристики будут использованы при дальнейших исследованиях.
Оценка принадлежности выборки к нормальному распределению -
При выборе данного пункта необходимо, как впрочем, и для вех остальных пунктов при первичном вызове, ввести количество обрабатываемых выборок, а затем и сами это выборки. Программа по
лзнному пункту автоматически отбраковывает сомнительные элементы выборок. Разбивает выборки на классы и находит частоты по каждому классу, частоты фактические и теоретические и, если разница между частотами не больше 5% - призна&тся, что выборка имеет нормальное распределение, п противном случае, что распределение не является нормальным.
Так, например, при обработке данным пунктом выборок штамбов (см) саженцев 2-х леток сорта Лобо (данные 1999 г.)
[0.6 |0.4 |(Ь6 11.0 Ю-9 Ил [О Л ¡1.0 |1.0 10.1 10.7 | ОД 10.9 | 1.1 | 1.1 | Результатом будет следующее сообщение: 1-я выборка:
0.6 0.4 0.6 1.0 0.9 1,0 0.8 КО 1.0 0.1 0.7 0.8 0.9 1.1 1.1 Имеет нормальное распределение
(Примечание: Сообщение 1-н выдаётся поточу, что одновременно л тгом пункте могут обрабпыватьея несколько выборок)
(Примечание: все выше рассмотренные пункты просран мы взаимосвязаны между собоК, а именно при га пуске программы можно выбрать один т ник н затем закончить работу с профаммоП или снова выбрать один из пунктов основною меню программы н получить необходимую информацию об уже введённых данных) Определение коэффициента корреляции и уравнение регрессии Рассмотрим пример работы программы по определению корреляционных
№ Клоповые поя вой Окужность штамба, см
На 7-й гсш в саду На 15>й гол в салу
1 2-46-112 16 29
2 2-46-43 18 35
3 2-46-113 16 28
4 2-46-77 15 35
5 3-17-38 17 35
6 3-77-12 20 35
7 3-6-47 IX 29
в 3-4-98 23 42
9 3-3-72 23 38
10 3-3-3 21 43
11 163-5-44 16 30
12 2-18-246 21 41
13 2-18-246 22 38
14 2-19-385 20 35
По запросу программы первоначально вводится количество обрабатываемых выборок (их должно быть 2), а затем сами эти выборки (по запросу программы выборки вводятся по одному элементу) Коэффициент корреляции г=0.78 Уравнение регресс»к имеет вид: У- 9.18+137»
Дисперсионный анализ однофякторпого опыта
При выборе данного пункта программы на экране компьютера высвечивается новое меню, которое имеет следующий вид:_
1. Дисперсионный в налит Введите номер необходимого пункта!
олнофаигорного опыта, заложенного П нажмите клавишу ЕШсг
по стандартной схеме.
2. Дисперсионный анализ Для выхода из программы
однофакториого опыга. Введите • 0
заложенного по методу та
рейдом нзнровянных
повторений.
3. Дисперсионный анализ
одиофакторного опыта.
заложенного по методу
рейдом изнрованн ых
повторений, с
восстановлением выпавших
делянок.
и предоставляется возможность обработки данных по одному из предложенных алгоритмов:
Рассмотрим последовательно, как будет вестись обработка данных каждым из этих пунктов программы.
1. Дисперсионный «нали^ оцнофакторного опыта, заложенного по стандартной схеме
Рассмотрим на примере опыта по изучению сроков поссва сидератов, заложенного по стандартной > схеме (Потапов и др., 1990) в хозяйстве «Зелёный Гай» Мичуринского района. В опыте использовано 7 учётных рядов (посадка 8X4) деревьев Антоновки обыкновенной, каждый ряд (всего 116 посадочных мест) разделён на 3 равных повторения, в каждом по 30 учетных деревьев.
4. Длиии окружности штамба 14-летнии деревьев Антоновки обыкновенной при разных условиях содержания почвы в междурядьях сада (см) на 7-Я гол ведения опыта ___■'• '___
Условное обозначение варнанта Вариант Номер повлорностн
I И Ш
Контроль 1 Ч(рныЙ пар 47,6 47.4 47,8
1 Весенние сидераты в каким междурядье 48,1 493 48,2
2 Летние екдерагы в каждом междурядье 50,0 473 4&3
Контроль 2 3 Черный пар 47,3 47>8 442.
Весенние ендераты через меяедурядье 48,5 49,5
4 Легниесндерагы через междурядье 49,2 48Д 50,1
Контроль3 Чёрный пар 47.7' 48,6 48,7
Результатом работы данного пункта программы будет вычисление
фактического значения критерия Фишера.'_
Фактическое значение Критерия Фишера =1.26 Число степеней свободы *=в
Необходимым условием вычисления НСР валяется превосходство найденного программой фактического значения критерия Фишера над табличным
I ¿Вычислять НСР 2) Не вычислять НСР
Введите номер необяоднмого пункта
?0_
а) при вводе цифры I. программа вычислит НСР. НСРде в сравнении с контролем = 1.56
НСРи в сравнении со средним значением ь0.99
б) при вводе цифры 2 программа закончит работу без вычислений.
2. ^Дисперсионный анализ однофакторного опыта, заложенного по методу рсиломтиропапиых повторений Рассмотрим работу программы на примере влияния глубины предпосадочной вспашки (Потапов и др., 1990) на некоторые ростовые показатели яблоки.
5. Влияние глубины предпосадочной вспашки на плошадь листьев 7-летпих
Глубина предпосадочной вспаиисн, см Номер повторности
1 г J
25 18.6 17,9 "V
40 26,4 21,3 23,1
60 2'JJ 27J 25,9
Напомню, что для обработки данных но этому опыту:
1) Запускаем программу на выполнение
2) В главном меню программы выбираем пункт - Дисперсионный анализ однофакторного опыта
3) В предложенном далее меню выбираем пункт - Дисперсионный анализ однофакторного опыт, заложенного по методу рендомизированных повторений
После этого, на экране появляется новое меню, имеющее вид
Получаем запрос:_
1. Дисперсионный аиялнтдля вариантов с <иинакопой поитериостью.
2. Дисперсионный анализ для вариантов с различной повториостью.
После набора числа нажмите клавишу Enter
?□
Количество повторностей в данном опыте одинаково, поэтому мы вводим цифру 1.
Результатом работы данного пункта программы будет также вычисление
фактического значения критерия Фишера. _
д»ктичгс*<х--».«чг ннс Критерия <1»и ютра «-45.41 Число ггспсней свободы »4
Необходимым условием вычисления НСР является превосходство и а Идеи ного программой фактического значения критерия Фншера ни табличным
1)Вычнс.1ять НСР
2) Не вычислить НСР
Введите номер веоб«однмого пункта
?Г1___
при вводе цифры 1, программа вычислит НСР, иначе закончит работу без вычислений.
При обработке данных по данному пункту программы, а именно: дисперсионный анализ однофакторного опыта, заложенного по методу рендоми зироваиных повторений, допускается и дисперсионный анализ для
на примере опыта
РЯ1НОЙ ЭКСЛОШШЖ
вариантов с различной повтор!гостью.
Рассмотрим работу' программы в этом направлении
(Потапов и др. ,1990),
Л Склон Средняя длина окружности штамбов по рядам деревьев Числа порториоетгй ** л
1 2 Южный Северный 29.529,831,1:31.930,031.431,2; 7
35,7:49,935,136.035.0; 5
3 Севсро-заладный 36.135,435,236^35,7353; 36,136.536.0, 10
V 22
Программа вычислит
Для 1-го н 2-го вариантов при П| ™ 7 и = 5, НСРт
Для первого н третьего вариантов л I - 7 и П} - 10,
Длям^ро^ третьего
3. Дисперсионный анализ однофакторного опыта, заложенного по методу пенломнищованны« повторений с восстановлением выпавших делянок.
Обработка опытных данных этим пунктом программы аналогична обработке данных по пунюу нашей программы - дисперсионный анализ для вариантов с одинаковой повтор носило, за тем исключением, что вместо утерянных данных программа просит вас вводить 0. Допускается обработка опыта, в котором одно или два потерянных значения. Необходимые поправки при проведении дисперсионного анализа программа вычисляет автоматически.
(Потапов и др. ,1*>90); Изучали влияние предпосадочного удобрения и »несения азота на плаитании земляники. Влияние предпосадочно! о удобрения (фактор Л) изучали в следующих вариантах; 0-Й - контроль (бе! удобрений), 1-й — внесение фосфорно-калийных удобрений из расчета Рм>К<л и 2-й - внесение навои по 30 т/га * фосфор и калий Р«,К«1. Влияние внесения азота на плантации земляники (фактор В) ту чал и в следующих вариантах: 1-й - контроль (аюг не вносили), 2-й - - внесение М^ весной, 3-й -Ы«, после уборки урожая, 4-ый - Ы^ ,1 весной » Ь1>г ^ ноете уборки урожая и 5-й — И»* весной 4 N,1 после уборки урожая. Требуется установить наличие или отсутствие влияния нрел и осадочной» удобрения и внесения люта на плантации, а также их взаимодействия на урожайность земляники.
7. С]>елн«» (та 4 юла) поделимпчнаи урожайикегь кмлинпки (ii/ib), чивйп im «Ifjitn uri Гай» ____
Фактор А, предпосадочное удобрение; - Фактор It, азотные удобрения. Номер повторности Хк»„ -Г
I: 2 3 4- - ■
0 ■ 79 80 № 72 317 79
2 KS 88 «9 92 357 89
3 89 93 103 92 377 44
•1 92 89 98 95 374 94
5 96 106 105 104 411 103
1 72 84 92 77 325 81
85 90 100 88 363 91
3 103 97 102 91 393 98
4 91 109 91 93 384 96
5 8» 99 10» 96 JK4 96
2 7« 94 95 90 349 87
2 87 87 100 97 371 93
3 м • 92 101 95 377 94
4 88 108 104 95 395 99
5 91 1 104 1)3 91 399 100
Еп 1308 1420 I4K0 1368 5576 .V -93
При необходимости обработки данных по ш>му пункту, нужно будет ввести сначала количество вариантов по каждому из факторов (тго соо i не« сг пенно числа 3 и 5), а затем количество повторное! ей (программа выдаёт запрос по виолу) - 4, После ното - обработка ведётся аналогично обработке по олнофакторному опыту, а именно, выдаются запросы о вводе данных, перебирая для каждою значения одного н! факторов значения фактора другого и соатвеютвуюшей повторности.
Результатом работы программы будет:
1. Значение НСР по 1 -му фактору.
2. Значение НСР но 2-му факюру.
3. Значение MCP по взаимодействию факторов.
4. Среднее значение НСР.
л
Анализ одночисловых данных
При выборе этого пункта программы для обработки данных необходимо будет ввести количество одночисловых данных, а затем сами эти числа. После ввода необходимого на экран высвечивается матрица обработки одночисловых данных, а также вычисляется НСР.
Выводы
1. Впервые была разработана комплексная программа, обеспечивающая обработку экспериментальных данных в плодоводстве.
2. Программирование представляет научный и практический интерес, как с точки зрения познания и применения процесса составления программ, так и ускорения анализа экспериментальных данных с плодовыми и другими культурами по количественным признакам, имеющим определённые размерности.
3. Разработаны одиннадцать программ по различным вариационно-статистическим алгоритмам.
4. Особый интерес представляют следующие программы обработки данных:
и по определению необходимого количества повторностсй; и по работе с экспериментальными данными, имеющими
сопряженные показатели; и применения анализа неортогональных схем экспериментального
материала; и но восстановлен и ю утерянных данных; и по проведению анализа по одночисловых данным.
5. Показано, что важное теоретическое значение имеет использование теории больших уклонений для оценки объема экспериментальной выборки при отсутствии сведений о распределении генеральной совокупности.
6. Использование программы в десятки раз сокращает время обработки и анализа полученного экспериментального материала.
7. Точность и корректность получаемых результатов по разработанным программам отвечает современным требованиям высшей математики и вариационной статистики.
8. ■ Применение разработанных программ позволяет проводить обработку экспериментальных данных исследователям различного уровня знаний в области вариационной статистики и новых информационных технологий.
Рекомендации науке и образованию Рекомендовать использовать в научно-исследовательской работе в различных научных организациях и учреждениях, где исследуются экспериментальные данные но количественным признакам, имеющие определённые размерности.
Список опублнкопаиных работ:
1. Теоретическая оценка оссиметрнчных распределений биологических показателей.// Сборник докладов Международной научно-методической конференции 1998 г., т. 2, Мичуринск - с. 6-8 (в соавторстве).
2. Критерий Колмогорова-Смирнова^/ Сборник докладов Международной научно-методической конференции 1998 г., т, 3, Мичуринск - с. 5-7 (в соавторстве).
3. Критерий ван ден ВарденаУ/Сборник докладов Международной научно-методической конференции 1998 г., т. 3, Мичуринск - с. 9-11 (в соавторстве).
4. Критерий знаков.// Сборник докладов Международной научно-методической конференции 1998 г„ т. 3, Мичуринск - с. 11-13 (в соавторстве).
5. Критерий серий7/ Сборник докладов Международной научно-методической конференции 1998 г., т, 3, Мичуринск - с. 13-16 (в соавторстве).
6. Оценка объёма вторичной выборки окружности штамба яблони.// Сборник докладов Международной научно-методической конференции 1998 г.,т. 3, Мичуринск-с. 41-44 (в соавторстве).
7. Вычисление вариационно-статистических характеристик на компьютере,// Научно-производственный журнал «Вестник МичГАУ» серия плодоводство, цветоводство и овошеводство, 2001 г., т. I, МичГАУ - Мичуринск - с. 155-160 (в соавторстве).
8. К вопросу классификации слаборослых (слоновых подвоев я блоки М Сборник докладов Международной научно-методической конференции 2003 г., т. 3, ОрЕл - с. 268-269 (в соавторстве).
9. Алгоритм опенки различий между одночисловыми экспериментальными данными.// Методические рекомендации 2003 г., МичГАУ - Мичуринск - С. 14 (в соавторстве).
Отпечатано в типографии МнчГЛУ Подписано в печать 20,11,03. г. Форчат 60x84 1/16, Бумага офсетная Як 1. Усл.печ.л. 1,33 Тираж 100 7*3. Ризограф Заказ №10733
Мичуринский Iадударстъенный аграрный университет 393760, Тамбовская обл., г.Мичуринск, ул. Интернациональная, 101, тел.+7(07545) 5-26-35 E-mail: meauigmich.ru
И9974
- Фролова, Светлана Викторовна
- кандидата сельскохозяйственных наук
- Волгоград, 2003
- ВАК 06.01.07
- Вариационно-статистические характеристики показателей роста и плодоношения яблони на слаборослых клоновых подвоях и необходимая повторность в исследованиях
- Разработка компьютерных программ и вариационно-статистический анализ экспериментальных данных в плодоводстве
- Удельная продуктивность сортов и слаборослых клоновых подвоев яблони
- Алгоритмы вариационной статистики и методики исследований в плодоводстве
- Прогнозирование оптимальных сроков эксплуатации слаборослых яблоневых садов на основе бонитировки в условиях ЦЧР