Бесплатный автореферат и диссертация по биологии на тему
Разработка методологии оценки надежности результатов геногеографических моделей в популяционно-генетических исследованиях
ВАК РФ 03.00.15, Генетика
Автореферат диссертации по теме "Разработка методологии оценки надежности результатов геногеографических моделей в популяционно-генетических исследованиях"
РОССИЙСКАЯ АКАДЕМИЯ МЕДИЦИНСКИХ НАУК МЕДИКО-ГЕНЕТИЧЕСКИЙ НАУЧНЫЙ ЦЕНТР
На правах рукописи УДК 575.577
Р Г Б ОД
НУРБАЕВ Серик Долдашевнч
- 1 ^сО 2000
РАЗРАБОТКА МЕТОДОЛОГИИ ОЦЕНКИ НАДЕЖНОСТИ
РЕЗУЛЬТАТОВ ГЕНОГЕОГРАФИЧЕСКИХ МОДЕЛЕЙ В ПОПУЛЯЦИОННО-ГЕНЕТИЧЕСКИХ ИССЛЕДОВАНИЯХ
03.00.15 - Генетика
Автореферат диссертации на соискание ученой степени доктора биологических наук
Москва 2000
Работа выполнена в лаборатории генетической эпидемиологии Института клинической генетики Медико-генетического научного центра Российской академии медицинских наук
Официальные оппоненты:
доктор биологических наук,
профессор Ю.А. Ревазова доктор медицинских наук:,
профессор Б.А. Кобринский
доктор биологических наук В.Е. Дерябин
Ведущее научное учреждение:
Российский государственный медицинский университет
Защита диссертации состоится "_"_2000 г.
в_часов на заседании Диссертационного совета Д.ОО 1.16.01 при
Медико-генетическом научном центре РАМН по адресу: 115478 Москва, ул. Москворечье, 1.
Автореферат разослан "_"_" 2000 г.
Ученый секретарь Диссертационного совета доктор биологических наук, профессор Л.Ф. Курило
^окС^ь, о
1.ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ 1.1. Актуальность проблемы
Установление закономерностей генетических процессом, происходящих » популяциях, составляет основную проблему популяционной генетики. При решении этой проблемы основным инструментом является математическое моделирование и генетико-статистический анализ.
При создании геиетико-математических моделей обязательным требованием является проверка адекватности модели. Оценка адекватности модели возможна в случае учета фактора надежности исходных данных и корректного описания исследуемого процесса. При этом обеспечение адекватности модели и обеспечение необходимого уровня надежности выдвигают противоположные требования. С одной стороны, построение адекватной модели требует учета широкого набора факторов, характеризующих исследуемый процесс, и, с другой стороны, высоко надежных экспериментальных данных. В результате поставленную проблему не всегда удается решить корректно и экономично. При построении модели требование надежности предполагает или включение только тех составляющих модели, которые удовлетворяют требованиям надежности, или такое сочетание составляющих (системная связь) модели, которые в совокупности также удовлетворяют требованиям надежности. В целом, при описании генетической структуры природных популяций проблема надежности полученных результатов и/или собранных данных в популяционно-генетичеешх исследованиях становится важным звеном для корректного анализа и понимания генетических процессов, происходящих в генофонде.
В последнее десятилетие в связи с развитием вычислительной техники в популяционной генетике широко используются методы математической компьютерной картографии, благодаря чему возникает новая область популяционной генетики - компьютерная геногеография (СауаШ-БГогга й а1.,1995; ВагЬ1уаш,1987, 1994; Рычков, Балановская,1992). Эта область является одной из наиболее сложных в популяционной генетике как в плане общей методологии, так и по сложности используемых моделей. Именно поэтому на примере этого сложного, бурно развивающегося раздела популяционной генетики, мы решили отработать методологию оценки надежности (достоверности) геногеографического моделирования на основе приложения теории надежности.
Основной задачей геногеографии является анализ генетической структуры
популяций и изучение пространственных закономерностей генетических процессов, происходящих в природных популяциях. Для выявления этих закономерностей в геногеографии разработаны различные подходы [Menozzi et al., 1978; Рынков, Балановская, 1990; Cavalli-Sforza et al., 1995;Mourrieras et al., 1997].
Помимо картографического анализа, для изучения пространственных закономерностей в генетической изменчивости популяций используется ряд других методов [Siatkin, 1976, 1987; Karlin, Richter-Dyn, 1976; Sokal, Oden, 1978; Sofcai, 1979, 1988, 1991; Sokal, Menozzi, 1982; Sokal et al. 1989, 1991,1999; Barbujani, 1987; Barbujani, Sokal, 1990, 1991; Barbujani et al. 1989, 1994; Hardihg, 1990]. Из них можно выделить три основных: 1) анализ клинальной изменчивости; 2) пространственный автокорреляционный анализ, позволяющий дифференцировать клинальную изменчивость, изоляцию расстоянием и действия других факторов определяющих распространение генов; 3) "wombling", позволяющий выделять на картах генетически значимые границы в распространении генов, связанные с градиентами отбора или факторами изоляции популяций. Каждый из этих методов имеет свои премущества и недостатки. Однако наиболее полным и всесторонним анализом является комплексный, включающий как все эти методы, так и позволяющий провести многомерный анализ с исходными картами частот генов, метод компьютерных интерполяционных карт распространения reHOB(Cavalli-Sforza et al.,1995; Балановская и др.,1990). Этот метод позволяет не только дать единую оценку для всего генофонда («синтетические» карты), но и увидеть (не только клинальную изменчивость), как распределен оцениваемый фактор в пределах ареала генофонда. Кроме того, интерполяционные процедуры позволяют анализировать не только распределение частот генетических маркеров, но такие популяционно-статистические характеристики популяции как случайный инбридинг(Почешхова, 1998), эффективный размер популяции, дрейф генов (Евсюкови др., 1996; Почешхова, 1998), плотность популяции(Евсюков и др.,1999), распространенность наследственных заболевании в популяциях(Гинтер и др., 1999; Петрин и др., 1996), распространенность общих мультифакториальных заболевании в популяциях(Рычков и др., 1996,1998) и др. При этом любое значение геногеографической карты, полученное в результате интерполяционной процедуры, является прогнозом. Поэтому принципиально важной для развития геногеографии становится оценка надежности картографического прогноза (вероятности его осуществления).
Чем интенсивнее внедряются интерполяционные карты в инструментарий популяционной генетики, тем острее становится вопрос: насколько сам характер исходного материала задает ничем не устранимую неточность(ненадежность) таких карт. К характеру исходного материала относятся и размер популяционной выборки (от которого зависит доверительный интервал частоты гена), и число изученных популяций, и их пространственное распределение в картируемом ареале, и природные преграды при продвижении носителей генов (моря, горные хребты, пустыни и т.д.), и социальные барьеры для популяций человека (этнические, конфессиональные, административные границы) и т.д.
Дальнейшая трансформация геногеографических карт картографо-статистическими методами, как с использованием подходов одномерного, так и многомерного моделирования с учетом надежности геногеографического прогноза позволяет более точно определить генетическую структуру популяции.
В мировой литературе отсутствуют какие-либо попытки количественно оценить надежность геногеографических карт, что чрезвычайно сужает возможности использования геногеографических подходов. Исследователи предлагают качественные или косвенные оценки надежности карт (например, через количество изученных популяций или средний размер выборки), но такие оценки дают лишь некие общие представления о надежности модели и чрезвычайно субъективны (ВагЬфш е1 а!., 1994; БокаМ 979,8ока1 а а1.,1999а,б;Яепс1тс ^ а1„ 1999).
Создавшаяся противоречивая ситуация - отсутствие методологии количественных оценок надежности при ясно осознаваемой их необходимости -связана с тем, что используемые в популяционной генетике традиционные исторически сложившиеся подходы не позволяют корректно решить эту задачу.
В данной работе предлагается принципиально новая концепция и методология оценки надежности картографического прогноза. При ее создании были использованы подходы и методология теории надежности. Специально разработанные нами для популяционной генетики математические модели, алгоритмы и оригинальное программное обеспечение позволяют оценивать надежность карты в каждой ее точке. Результатом дайной работы является новая карта, отражающая пространственную гетерогенность в оценке надежности признака. Карта надежности показывает: какова вероятность того, что полученный результат совпадет с картографическим прогнозом в пределах доверительного интервала карты, при проведении популяционно-генетического исследования биологического объекта в
любой точке карты. Полученное значение вероятности и будет соответствовать оценке надежности картографического моделирования в данной точке пространства карты.
В целом оценка надежности результатов генетико-математических моделей является краеугольным камнем как в геногеографии, так и в других областях популяционной генетики. Использование аппарата теории надежности открывает новые перспективы для разработки математических моделей и корректного использования уже накопленного арсенала средств математического моделирования. Решение этой проблемы будет способствовать надежному анализу и интерпретации получаемых результатов в популяционно-генетических исследованиях.
1.2. Цель и задачи исследования
Цель работы: разработать новый методологический подход оценивания надежности результатов геногеографического моделирования и на его основе модифицировать методологию геногеографии в популяционно-генетических исследованиях.
Задачи исследовании:
1. Разработать новый методологический подход к оцениванию надежности результатов геногеографического моделирования(концепция, математический аппарат, алгоритм, программное обеспечение), используя методологию понятийного аппарата теории надежности.
2. Разработать методы, алгоритмы и программное обеспечение для оценивания пространственно варьирующей надежности картографических моделей с помощью принципиально новых карт - карт надежности геногеографических характеристик, учитывающих влияние (как в отдельности, так и совокупного) следующих основных параметров надежности картографических моделей:
а) числа и пространственного распределения в пределах картируемой территории генетически изученных популяций;
б) размера выборки из каждой популяции и частоты гена, обусловливающих степень достоверности исходной генетической информации;
в) гетерогенности ареала генофонда, приводящей к анизотропной структуре миграций генов в пределах картируемой территории.
3. Разработать методы и программное обеспечение для оценивания надежности комбинированных (синтетических) карт, получающихся после
трансформации исходных карт картографо-статистическими методами.
4. Используя созданную методологию оценивания надежности построить карты надежности различных признаков для модельных генофондов:
а) для генофондов различных иерархических уровней (от субэтнических групп до населения Старого Света в целом);
б) для различных характеристик генетической структуры (классические и ДНК маркеры, квазигенетические маркеры, менделирующая наследственная патология, показатели инбридинга, "сиптстичсские" карты главных компонент, карты корреляций, мультифакториальные болезни ) популяции;
5.На основе методологии надежности картографических моделей создать новый метод построения карт межпопуляционного разнообразия генофонда на основе 051 статистик Нея
1.3. Научная новизиа и практическая значимость
Понятийный аппарат популяционной генетики и популяционио-генетические исследования в целом основаны на использовании математических моделей (разного уровня обобщения). Разработка концепции, понятийного аппарата, алгоритмов и оригинального программного обеспечения для оценки надежности результатов любых популяционно-генетических моделей является важным и актуальным достижением математической популяционной генетики.
В инструментарий популяционной генетики введен принципиально новый подход и новый математический аппарат - теория надежности. Новый подход позволяет оценивать достоверность получаемых результатов в обширной области популяционно-генетических исследований.
Впервые создана методология оценки надежности геногеографнческнх (картографических) моделей генофондов. Понятийный и математический аппарат теории надежности обеспечивает систематизацию результатов изучения генетической структуры популяций по степени достоверности исходных данных.
Впервые осуществлены количественные способы оценки надежности статистико-картографических моделей географического варьирования как отдельных признаков, так и их совокупностей "синтетических" карт генофонда в целом).
Впервые разработана модификация методов одно и многомерных статистических процедур обработки карт с учетом надежности (достоверности') исходных гсногеографичсских моделей.
Впервые разработан способ гепогеографичсского изучения
межпопуляционного разнообразия генофонда с учетом надежности картографического прогноза.
Показана высокая ценность новых гсногеографических методов (с учетом оценки надежности в популяционно-генетических исследованиях) в определении генетической структуры популяции. Продемонстрированы преимущества применения подходов теории надежности в популяционной генетике, возможность более точного описания популяционно-генетической структуры как одного этноса, так и гетерогенных в этническом отношении модельных генофондов.
Впервые получены оценки надежности картографического анализа и построены карты с учетом разработанной методологии :
• для генофондов народонаселения различного происхождения и разного иерархического ранга (республики Марий Эл, Мордовия, Адыгея, народы Кавказа, Восточной Европы, Европы в целом);
• для признаков различной природы (иммуно-биохимические маркеры, ДНК- маркеры, квазигенетические маркеры, отягощенность наследственной патологией, инбридинг, фенофонд);
• для признаков с различным уровнем полиморфизма (высокополиморфных генетических маркеров, низкочастотных генов наследственной патологии и квазигенетических маркеров)
Впервые получены оценки надежности географического варьирования отягощенности наследственными заболеваниями в различных регионах России.
Впервые построены с использованием разработанной методологии надежности геногеографические модели статистик отдельных генов в
народонаселении Европы.
Практическая значимость работы. Создана новая методология количественной оценки надежности геногеографических карт. Карты надежности применяются для интерпретации картографических моделей и выявления закономерностей в пространственной изменчивости популяционно-генетических признаков, а также при дальнейшем картографо-статистическом анализе генофонда ( карты корреляций, главных компонент изменчивости генофонда, генетических расстояний, межпопуляционного разнообразия генофонда и иных показателей популяционно-генетической структуры).
Разработанная методология нашла применение в различных областях науки: в популяционной генетике, в медицинской генетике, антропологии, экологии
археологии и эпидемиологии.
Разработанные методология оценки надежности результатов в геногеографическом моделировании и программные обеспечения внедрены и используются в тематических научных исследованиях в следующих научных учреждениях: в МГНЦ РАМН, в ИМГ РАН, в МГУ им. М.В. Ломоносова, в Кубанской медицинской академии, в Мордовском государственном университете дружбы народов им. Н.П. Огарева, в институте Ревматологии РАМН.
_1.4. Положения, выноснмые на защиту
1. Методология использования подходов теории надежности для оценки результатов геногеографического моделирования.
2. Методы и программное обеспечение для оценки надежности результатов геногеографического моделирования с учетом:
а) числа и пространственного распределения генетически изученных популяций;
б) размера выборки из каждой популяции и частоты гена;
в) гетерогенности ареала генофонда, обусловленной неравномерной структурой миграций генов между популяциями.
3. Методы и программное обеспечение для построения карт главных компонент изменчивости генофонда, карт корреляции, карт ковариации, генетических расстояний, трендовых карт с учетом надежности исходных геногеографических карт.
4. Карты надежности для модельных генофондов и различных характеристик генофонда: распространения частот генов, квазигенетических маркеров, отягощенности наследственной патологией, инбридинга, комбинированных (синтетических) карт генофондов.
5. Карты надежности главных компонент изменчивости генофондов различных иерархических уровней населения Евразии на основе карт распространения частот генов (классические и ДНК маркеры), частот фамилий (квазигенетические маркеры), частот генов, вызывающих аутосомно-рецессивную патологию.
1.5. Апробация работы Основные результаты данной работы были доложены на 1,11,III Международном конгрессе этнографов и антропологов (Рязань, 1995, Уфа,1997, Москва, 1999); конференциях Российского отделения Европейской ассоциации антропологов "Новые методы и новые подходы в современной антропологии"(Москва, 1996), "Раса: миф или реальность" (Москва, 1998), 5 межлабораторных семинарах ИКГ МГНЦ РАМН (1996,1998), Международном конгрессе антропологов (Хельсинки, 1997), II Всероссийском популяционном семинаре "Жизнь популяций в гетерогенной среде" (Йошкар-Ола, 1998), 1 школе ВОГиС "Экологическая генетика" (Санкт-Петербург, 1998), IV Двойном конгрессе Международной ассоциации по изучению палеонтологии человека и Международной ассоциации по изучению биологии человека (Сан-Сити, ЮАР, 1998), конференции Американского общества генетики человека (Колорадо, 1998), конференции «Вторые Антропологические чтения памяти академика В.П. Алексеева» (Москва, 1999), на конференции по геному человека(Австралия, 1999).
1.6. Публикации результатов исследования По теме диссертации опубликованы 45 работ в отечественных и зарубежных изданиях.
1.7. Структура и объем работы Диссертация изложена на 298 страницах и состоит из введения, обзора литературы, пяти глав собственных результатов, заключения, выводов и списка литературы. Работа иллюстрирована 26 таблицами и 74 рисунками. Библиографический указатель включает 308 источников ( из них 130 отечественных и 178 зарубежных).
МАТЕРИАЛЫ И МЕТОДЫ ПРИНЦИПИАЛЬНЫЕ ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ ПОДХОДОВ ТЕОРИИ НАДЕЖНОСТИ В ПОПУЛЯЦИОННОЙ ГЕНЕТИКЕ Основные положения теории надежности успешно применяются при исследовании различных биологических систем (Нейман, 1966; Кольтовер,1978; Гродзинский,1980; Кочубинский,1985; Pellerey, 1996; Hernandez, 1996). Исследователи, работающие в области радиобиологии, первыми пришли к выводу о необходимости введения в обиход иных представлений, чем в теории вероятности и математической статистике для систематизации различных факторов, определяющих динамику живых систем. В частности, была сделана попытка провести некоторые аналогии между механизмами и машинами с одной стороны, и
живыми организмами с другой стороны. Было показано, что основные положения теории надежности, применяемые в механических системах, удачно и практически без изменения можно применять для описания надежности и устойчивости биологических систем (Кольтовер,1982; Кутлахмедов,1980).
Группировка событий по "ярусам" системы (принцип иерархии) не только подтвердила наличие функционального сходства в организации функционирования машин и организмов (принцип дублирования), но и очертила некоторые особенности, свойственные только саморегулирующимся системам (принцип поливариантности комбинаций разных процессов на каждом уровне иерархии).
Идеи и подходы, использующие теорию надежности, не отрицают всего арсенала фактов, накопленного ранее. Происходит лишь переоценка значимости в понимании того, что мы привыкли называть устойчивостью биологических систем. Концепция надежности биологических систем предполагает такую систематизацию имеющихся фактов, которая позволяет переосмыслить и по новому оценить реальные сложные взаимосвязи этих систем [Астафьев,1978].
В настоящее время в биологических науках начинают широко использоваться приложения теории надежности: при изучении различных биологических систем (экологическая система, система клеток, клеточных популяций и тканей, процессов старения, репарации и др (Зорин,1985; Андреев,1985; Жестяников,1985; Цейтлин, 1985), надежности отдельных биологических подсистем (желудочно-кишечный тракт, сердечно-сосудистая система, иммунная система, мозг и т.д.) [Полюхов, 1985; Печуркин,1985; Поликарпов, 1985; Сватков, 1985]. При этом теория надежности "рассматривается как важный эвристический метод исследования биологических объектов. Подобный подход возможен на любом уровне интеграции" (Кутлахмедов,1985, стр.7).
Однако в большинстве случаев теория надежности в биологии применяется для оценки надежности биологических систем при ее возмущении со стороны внешними факторами [Гродзинский,1974]. Например, решается задача определения надежности клеточных популяций тканей при воздействии радиации [Батыгин,1977].
В природных популяциях также присутствуют иерархия популяционных структур (Алтухов, 1995). Различные факторы (экологические, социальные для человека), приводящие к стрессу в популяциях, можно рассматривать как внешнее возмущающее действие на популяциопную систему. В этом случае можно создать модель популяционной системы с позиции теории надежности. Моделируя различные
возмущающие факторы, воздействующие на данную систему, можно определить «запасы прочности» популяции или систем популяций, что является очень важным в задачах мониторинга народнохозяйственных пород животных, рыб и т.п. Этот аспект имеет кроме теоретического, чисто практическое значение в использовании подходов теории надежности.
Еще один аспект приложения теории надежности - методология более точной оценки достоверности (надежности) различных статистических характеристик и мер связи выборок математическим моделированием. Например, применение тех или иных мер статистических связей часто предполагает, что различные статистические показатели выборки имеют нормальное или близкое к нему распределения (Глотов и др., 1982; 8ока!До1С, 1981). Данное положение особенно актуально в случаях, когда принимается решение на основе коэффициента линейной корреляции Пирсона, I критерия Стьюдента, Бб! статистик Райта и пр. В большинстве случаев это требование не выполняется и исследователи вынуждены нормализовать исходные данные различными способами. Во избежание процедур нормализации, следует воспользоваться методами численного ресэмплинга (ЕГгоп,1982), что, по крайной мере, снимает вопрос о типе распределения полученных оценок мер связи (метод «бутстрэп») и вопросы смещенности статистик (метод «джекнайф») (Вейер,1995). В теории надежности названные подходы численного ресэмплинга составляют основу увеличения надежности систем способами резервирования и дублирования функционально схожих элементов(Гнеденко,1968).
Относительно редко применяются подходы теории надежности для оценки результатов моделирования в биологии, когда используемая математическая модель (картографическая модель, модели биоценоза, модели систем транспорта кислорода из окружающей среды ко всем тканям организма) сама является системой. Именно этот подход и использовался в нашей работе - оценка надежности популяционно-генетических исследований.
Необходимо отметить, что нам неизвестны работы, оценивающие надежность результатов популяционно-генетических исследований. В этом отношении данное исследование является пионерским.
ОСНОВНЫЕ ДАННЫЕ И ИСТОЧИНКИ ИНФОРМАЦИИ Основная генетическая информация о генофонде населения России и
сопредельных стран собрана в Банке данных "GENE POOL" . В данном Банке в настоящий момент собрана информация примерно по 100 генетическим системам, охватывающая около 6000 популяций мира. Для создания карт главных компонент изменчивости генофонда для коренного населения Восточной Европы по классическим маркерам были использованы частоты 100 аллелей 34 полиморфных локусов: ABO, ACPI, АК1, СЗ, CER, CV, DI, E2, ESD, FUT2, FY, G6PD, GC, GM, GLOl, HLA-A, HLA-B, HLA-C, HP, JK, KELL, KP, LE, LU, MN, PI, PGD, PGM1, PI, PTC, RH-C, RH-D, RH-E, SE, TF. Карты главных компонент изменчивости генофонда для региона Восточной Европы по ДНК маркерам были построены с использованием частот 48 аллелей 4 полиморфных локусов. При создании карт главных компонент изменчивости генофонда для коренного населения республики Адыгея по квазигенетическим маркерам (фамилия) были использованы частоты 1326 фамилий.
Информация об отягощенности наследственными заболеваниями в популяциях России и стран СНГ собрана в Банке "Меднко-генетическая и популяцнонно-генетическая структура популяций России" (per. №0229805137). В данном Банке в настоящий момент собрана информация об отягощенности менделирующими наследственными болезнями населения России и некоторых сопредельных стран (около 300 нозологических форм). При создании карт главных компонент изменчивости генофонда для коренного населения республики Мари Эл по аутосомно-рецессивным генам были использованы частоты 45 генов моногенной наследственной патологии.
Вся исходная информация формализована, имеет четко определенную структуру и передается в виде форматированных файлов. КОМПЬЮТЕРНАЯ ГЕНОГЕОГРА ФИЯ ОСНОВНЫЕ МЕТОДЫ И ПРИНЦИПЫ.
В основе любой геногеографической карты лежит цифровая модель KapTbi(Cavalli-Sforza et al.,1995; Рычков,Балановская,1992). На компьютерную картографическую основу наносятся изученные популяции. Карта покрывается равномерной сеткой ("листок в клетку"'). Для каждого узла сетки рассчитывается ожидаемое (интерполированное) значение признака способом средневзвешенной интерполяции с ортогональными полиномами (Cavalli-Sforza et al.,1987, Сербенюк и др., 1990) в данной точке географического пространства. Когда проведен расчет для всех узлов сетки - получаем равномерную числовую матрицу. Она и является цифровой моделью карты: псе статистические расчеты и преобразования проводятся именно с ней, т.е. с точными значениями признака в каждом узле сетки. Во всех
геногеографических построениях параметры моделирования приняты следующие: степень полинома-0, радиус влияния весовой функции-10, степень сглаживающих полиномов-6 (Балановская и др., 1994).
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
1 .МАТЕМАТИЧЕСКИЕ МЕТОДЫ ОЦЕНКИ НАДЕЖНОСТИ В ГЕНОГЕОГРАФИЧЕСКИХ ИССЛЕДОВАНИЯХ.
Для успешного применения геногеографического подхода к изучению пространственной изменчивости любого генетического или фенотипического признака в картируемом ареале генофонда необходимо выполнение двух основных требований : во-первых, признаки должны обладать изменчивостью в исследуемом ареале; во-вторых, сам ареал должен быть охвачен более или менее изученными популяциями (Серебровский. 1928,1930).
После того, как картографическая модель распространения признака построена, необходимо дать количественную и качественную оценки надежности (достоверности) картографического прогноза в каждой точке географического пространства. Пусть а0 - оценка признака, полученная геногеографическим методом, а а„ - истинное значение данного признака. Тогда говорят, что оценка а„ построена с абсолютной точностью е>0 и надежностью (вероятностью, достоверностью) Р, если для нее справедливо соотношение
РИ О В (|яв-а„|<е)= Р (1.0)
При анализе надежности геногеографического прогноза рассмотрим влияние следующих факторов на показатель надежности:
1. Числа и географического расположения изученных популяций в исследуемом ареале. Неравномерность в географическом распределении и числе изученных популяций определяет различную надежность картографического прогноза в различных частях ареала.
2. Генетическая гетерогенность исследуемого ареала. Для карт генофонда значимы лишь те препятствия, которые ограничивают свободу обмена генов в географических группах. Для популяций человека такими препятствиями являются не только природные (пустыни, моря, горные хребты и др.), но и социальные преграды (конфессиональные, этнические, лингвистические и пр.).
3. Показатель надежности(достоверности') п исходных изученных популяциях. При изучении признака в конкретных популяциях вопрос достоверности значения признака приобретает веский смысл при геногеографических исследованиях, поскольку на основе количественного значения данного признака строится прогноз в данном ареале. Следовательно, чем меньше выборочная ошибка значения признака в исходной популяции, тем надежнее (точнее) будет геногеографический прогноз. ТЕОРЕТИЧЕСКАЯ ОСНОВА ОЦЕНКИ НАДЕЖНОСТИ ГЕНОГЕОГРАФИЧЕСКИХ
МОДЕЛЕЙ.
В теории надежности оценка надежности (безотказного функционирования) системы, т.е. тотального объекта О(т) ¡2, Ъ ■■■), функционально состоящего из множества системно организованных ¡-тых элементов со своими параметрами , есть оценка вероятности работоспособности системы в заданных условиях. В качестве количественной оценки надежности принимаем вероятность осуществления прогноза - сохранения заданного состояния системы. Она количественно оценивает возможность "отказа" системы, или, в случае геногеографических карт, - возможность ошибочного прогнозирования значения признака.
Определение системы. Картографическая модель является системой, состоящей из изученных популяций, картографической сетки, параметров интерполяционной процедуры построения карт. В этом случае каждый узел картографической сетки есть система , состоящая из и„ элементов, сумма данных систем в свою очередь определяет надсистему XV из S¡ систем. Поскольку при определении значения картируемого признака в данном узле участвуют только те популяции, которые находятся в пределах радиуса Я, то количества популяций меняются от одного узла до следующего. Только в одном частном случае значение ип=соп51 когда 11=со.
Определение элемента системы. Элементы системы - это и есть изученные популяции в географическом пространстве, участвующие при построении карты. Под надежностью элемента системы мы понимаем достоверность определения признака в изученных популяциях согласно равенству (1.0) . Например, для частот генов надежность элемента есть: с какой вероятностью (надежностью) определена частота гена в данной популяции с заранее заданной точностью.
Определение надежности системы. Таким образом, в нашем распоряжении
есть отдельные системы состоящие из и„ элементов: необходимо определить их надежность. Состояние всех элементов системы мы будем задавать двоичным
вектором е(х) = [<?! (х), е2 (х),.....,еп (х)] где е1 (х) = 1, если элемент
ненадежен, £, (х) = 0, если элемент надежен. Под термином надежный элемент
мы подразумеваем когда Р>Ркр , а когда Р<Р,ф мы принимаем элемент как ненадежный, где Ркр - некоторый пороговый уровень вероятности. Вследствие наложенных выше ограничений все множество Е=(е) из 2" разбивается на два подмножества: Е=Е+ + Е_ , где Е+ . - множество надежных состояний системы. Е_ - множество ненадежных состояний системы. Ниже множество Е+ мы будем определять, задавая соединение элементов в системе. На это разбиение в теории надежности всегда накладывается так называемое условие монотонности. Чтобы сформулировать его, введем в множества векторов упорядоченность -скажем, что е=(е|,С2,....е„)<е1=(С| '^'.....е,,1), если для любого 1 с,<с,'. Тогда условие монотонности записывается так: для любых векторов е и е1 из условий е<е' и е£Е_ следует, что е'еЕ_. Иными словами, если система находится в ненадежном состоянии с, то дополнительные ненадежные элементы, при которых мы попадаем в новое состояние е1, не могут перевести систему в надежное состояние.
Существует два общих метода, которые позволяют находить или оценивать надежность системы с независимо отказывающимися элементами при произвольном соединении этих элементов. Это метод путей и сечений и рекурентный метод.
ПАРАМЕТР ПРОСТРАНСТВЕННОГО РАСПРЕДЕЛЕНИЯ ГЕНЕТИЧЕСКИ ИЗУЧЕННЫХ ПОПУЛЯЦИЙ. Задача: оценить надежность (степень достоверности) геногеографического прогноза распределения частоты признака в заданных пределах точности в любой точке географического ареала.
Напоминаем, что в классическом подходе (Са\'а1П-81огга « а1.,1995; Рычков,Балановская,1992) интерполируется(картируется) только среднее значение признака в исследуемом ареале. При этом вопросы о дисперсии и о корреляционных моментах картируемого признака в географическом пространстве остаются открытыми.
Для решения данной задачи применим подход теории случайных процсссов(полсй). В нашем случае прогноз признака (интерполяционная карта) в
географическом пространстве является реализацией случайного поля в промежутках между изученными популяциями. Тогда можно записать так: /(1и,х) = 8(и)р(х]),
где функция р{х) - зависящее от неслучайного аргумента х расстояние, а функция £(£/) зависящее от случайного аргумента и значение признака.
Для простоты рассмотрим плоский случай (рис.1). Пусть в популяциях А и В известны значения признака с определенным доверительном интервалом. С помощью полинома производим интерполяцию признака в пространстве между А и В. Причем значение признака является случайной величиной, заключенной в пределах доверительного интервала. Тогда траектория прогноза есть случайный процесс, где переменными выступают неслучайный аргумент, расстояние х и случайный аргумент значения признака(ов). Значение признака разыгрывается методом Монте-Карло. В результате мы имеем в каждой точке географического пространства не только среднее значение признака, но и дисперсию и корреляционную функцию данного признака.
Рис. I Представление картографического прогноза как результата случайного поля, зависящего от неслучайного аргумента расстояния х и случайного аргумента значения признака в точках А и В.
Первое основное допуи^ение: На показатель надежности интерполированного признака в любой точке изученные популяции влияют независимо друг от друга.
Так как исходные популяции влияют независимо друг от друга на надежность прогноза, то обычно используется для оценки надежности принцип параллельных систем. Тогда надежность системы в каждом узле картографической сетки с координатами х^ определяется как:
где р, - комбинированная надежность элемента системы, зависящая как от значения достоверности признака в исходных популяциях так и от расстояния от исследуемой точки до исходных популяций, К - количество исходных популяций.
Результаты численного моделирования показывают, что использование в качестве корреляционной функции метода средневзвешенной интерполяции с ортогональными полиномами, приводит ошибку интерполяции к гамма распределению.
К
(1.1)
Плотность распределения в данном случае имеет следующий вид
(1.2)
(1.3)
о
где
евклидово расстояние от
текущего узла картографической сетки до изученных популяций. Среднее значение и дисперсия выражаются как:
СО
где а- параметр формы, -Я-параметр масштаба, Г(г) = \дт 'б 0Дв -
где а-
гамма
о
функция.
Параметр формы изменяется: 0< а <1. Параметр масштаба: 0< Л < +=о. В нашем случае популяционпо-генетический смысл данных коэффициентов следующий. Параметр формы а численно отражает надежность (достоверность) постпоения оценки признака с известной точностью в исходных изученных популяциях. Параметр Л отражает уровень строгости, предъявляемый к надежности анализируемой системы.
Определение уровня строгости для гепогеографических моделей является самостоятельной задачей. Согласно формулам (1.4), дисперсия стремится к 0, когда Л стремится к +°о.
В технических системах показатель Л опытным путем стандартизован и, как правило, принимает значения от 0.5 до 0.9 (Л=1-1/к) (Половко, 1989). В геногеографических моделях данный фактор, Л не стандартизован.
В качестве примера рассмотрим геногеографическое моделирование распространения частоты аллеля глиоксалазы1 СЬ01*1 в коренном населении республики Марий Эл. На рис.2 приведена карта распространения частоты данного аллеля. На территории республики Марий Эл наблюдается четкая долготная изменчивость указанного аллеля. Наименьшее значение (менее 0.17) на востоке республики с постепенным увеличением частоты (более 0.52) на западе республики. При этом коэффициент парной корреляции с долготой местности составляет гдол=-0.801, с широтой местности гшир=-0.007, а множественный коэффициент корреляции с долготой и широтой местности гмн=0.670 (Р>0.999).
Для универсальности необходимо предъявлять к картам надежности признаков единое требование. Предлагается универсальная шкала в баллах для карт надежности со следующими интервалами .
Табл.1
Соответствие баллов значениям вероятности геногографического прогноза
Баллы 1 2 3 4 5
Значения
Вероятности р<0.90 0.90<р<0.95 0.95<р<0.975 0.975<р<0.99 0.99<р
Прогноза
Далее рассмотрим влияние параметров а , Л на показатель надежности геногеографического прогноза.
11НШ ГШ (11'1 1 ШШШ 1Ш1Ш1 ПРИ и
ео ю 4«»
Рис.2 Карта распространения частоты гена глиоксалазы1 йЬ01*1 в коренном населении республики Марий Эл.
ВЛИЯНИЯ ПАРАМЕТРА Л НА НАДЕЖНОСТЬ КАРТОГРАФИЧЕСКОГО
ПРОГНОЗА
Согласно формулам (1.1, 1.2,1.3), моделируем надежность картографического прогноза распространения данного аллеля в регионе. Для простоты принимаем, что в исходных изученных популяциях надежность(достоверность) изучения частоты гена равно 1, т.е. а- параметр формы - равен 1.
На рис.3б,в,г,д приведены карты надежности геногеографического прогноза в зависимости от уровня строгости X. В табл.2 приведены эти же результаты в табличном виде. Результаты моделирования показывают, что увеличение уровня строгости приводит к уменьшению доли территории с высокими показателями надежности. При увеличении параметра к (Л=1-1/к) к +оо можно переходить от картографического моделирования к обычному статистическому моделированию исходных популяций. Динамика изменения доли территории с различными показателями надежности (см. таб.1) (ось У в %) в зависимости от параметра к (ось X) приведена на рис.За. Значения вероятности соответствующие баллам приведены в табл.1. Символом Ме обозначена среднее значение надежности картографического прогноза по ареалу.
120 100 80 60 40 20 0
3 4
баллы при £(2,3,4,10)
10
Ш1 балл □ 2 балл 3 балл П4 балл ■ 5 балл □Ме
Рис. За Зависимость изменения доли территорий (%) от уровня строгости (к)
Таким образом, уровень строгости, предъявляемый к надежности анализируемой системы, является важнейшим параметром моделирования надежности геногеографического прогноза. На основании нашего опыта можно рекомендовать принимать значения данного параметра равным к= 3 или к=4.
Табл.2
Изменение доли территорий (%) с различной оценкой надежности картирования (Р) в зависимости от заданного уровня строгости (Я=1-1/к)
Оценка надежности уровень строгости к
Вероятность Р Баллы 2 3 4 10
0.00<Р<0.90 1 5.292 37.169 56.923 91.938
0.90<Р<0.95 2 4.923 7.631 5.908 2.769
0.95<Р<0.975 3 6.892 7.262 4.677 1.108
0.975<Р<0.99 4 9.785 6.400 5.785 1.046
0.99<Р<1.00 5 73.108 41.538 26.708 3.138
Средняя надежность карты Р 98.35 86.68 70.62 24.03
РАЗМЕР ВЫБОРКИ ИЗ ПОПУЛЯЦИИ, ОБУСЛОВЛИВАЮЩИЙ СТЕПЕНЬ ДОСТОВЕРНОСТИ ИСХОДНОЙ ГЕНЕТИЧЕСКОЙ ИНФОРМАЦИИ.
В данном случае параметр а меняется для каждой популяции. Плотность вероятности ошибок интерполяции вычисляется с помощью (1.2),(1.3), а надежность геногеографического прогпоза определяется как и в предыдущем случае выражением (1.1). Для моделирования рассмотрим предыдущий пример, распределение частоты гена глиоксалазы1 0Ь01*1 в коренном населении республики Марий Эл. При этом уровень строгости принимаем равным к=3 для всех случаев моделирования. Для выяснения влияния параметра достоверности (надежности) определения частоты
1011Ш11Ш1 1Ц11ШП 1:1 1:!
Г1С0П1ШШ ШШ I * Г IX ( I)
р-
г*
шш-шшшгп шин шп. ш.^гчи И11ШШ11 юишидт игооот
Г14С11С111 1111X111 I II III I С II I ип и ? вр <а м ар от«
Рис.36 Моделирование надежности геногеографического прогноза: уровень строгости к= 2
к.
Щ1ШШШ 1Ш1ШГ1 1 = 1 1=]
Г1С1
шш-тшшш шш( ни», «»мщи лшпкш пиишпп *й<ек1е111 114111111 1И1111СК11 11Т1
100 м
Рис.Зв Моделирование надежности геногеографического прогноза: уровень строгости к=Ь
НЩШШШ 1Ш1ШТ1 ] = 1
Рис.Зг Моделирование надежности геногеографического прогноза: уровень строгости к=4
ЩШШШ1 ЩИНШ ]Г1 1:11
Рис.Зд Моделирование надежности геногеографического прогноза : уровень строгости ¿=10
аллеля в исходных популяциях, рассмотрим следующие случаи:
1. частота во всех рассматриваемых популяциях определена с достоверностью 1.
2. частота во всех рассматриваемых популяциях определена с достоверностью 0.5
3. частота во всех рассматриваемых популяциях определена с достоверностью 0.1 На рис.4 а,б приведены карты надежности распространения данного гена в зависимости от степени достоверности исходной генетической информации при постоянном уровне строгости к=3.
В случае моделирования надежности геногеографического прогноза, когда достоверность оценки частоты признака в исходных популяциях равна 1, карта надежности совпадает с картой, показанной на рис.Зв.
Следует отметить, что рис.4а иллюстрирует замечательный принцип: способ конструирования более надежной системы из менее надежных элементов (Нейман, 1966). В популяционной генетике это означает, как правило, объединение малочисленных географически близких выборок в одну общую выборку. Как видно из данного рисунка, несколько популяций, находящихся на близком расстоянии друг от друга, дают более высокую степень надежности, чем отдельно взятые популяции.
ЩП1ПШП 1Ш1ШП ¡--¡л
п в,да? ЕМ1ШШ Ш1Ш1 ■ > 111 (11 «ла .... , < О" 5 Г
1 1 .00 лз м
V ( --V % X к
» * ^ 4« «0 ЛЬ* • МП А** * ЖМ кШ'За
ШШ-ГПШШГИ 1171111 НИН, 1||>||>||Н ШИПКИ! 111ШИШ11 пгоооооо
пни 11 н шиш ■ I л ■ < ■ ( с с > 1 1111 во с ао ¿о № ю
Рис.4а. Моделирование надежности геногеографического прогноза, когда достоверность в исходных популяциях равна 0.5
ЩШШШ1 1ЦШШ1 1:5 1=0.1
шаеииш 1Ш1Ш 11 г 71 (11
ЩШ-ГП11П1СМ 11Г11М Щ1П. п»|т|Х| Ш1Ш1Ш1 >111111111111 1"!™ИИ
г |<| II е 1 I I 11111111 | ■ | ||1 I еи I 11Г1 ад о ар <р ер ю 1оа м
Рис. 46. Моделирование надежности геногеографического прогноза, когда достоверность в исходных популяциях равна 0.1
Кроме того, рис.4б иллюстрирует другую особенность предложенного
подхода: если надежность оценки признака в исходных популяциях недостаточна, то
карта надежности указывает на тот факт, что географическая карта признака
недостоверна целиком по всему ареалу. В табл.3 приведены эти же результаты в
табличном виде. Изменение доли территории с различными показателями
надежности (ось У в %) в зависимости от параметра а (ось X) приведена на рис.4в.
120 100 80 60 40 20 0
1
-- 1
-Г-— И!
0,99 0,5 0,1
баллы при Р(0.99, 0.5, 0.1)
□ 1 балл
□ 2 балл
□ 3 балл 14 балл
3 5 балл □Ме
Рис. 4в. Зависимость изменения доли территорий (%) от значения достоверности определения частоты признака (а).
Таким образом, геногеографическое изучение любого выборочного популяционио-генетического признака из генеральной совокупности предполагает предварительную оценку их достоверности. Без этой оценки геногеографический анализ может привести к неверным выводам.
Табл.3
Изменение доли территорий (%) с различной оценкой надежности картирования (Р) в зависимости от достоверности(надежность) определения частоты признака в исходных популяциях а
Оценка надежности Надежность в исходных популяциях
Вероятность Р Баллы 0.99 0.5 0.1
0.00<Р<0.90 1 37.169 82.585 100
0.90<Р<0.95 2 7.631 11.569 0
0.95<Р<0.975 3 7.262 5.538 0
0.975<Р<0.99 4 6.400 0.308 0
0.99<Рй1.00 5 41.538 0 0
Средняя надежность Р 86.68 58.32 13.75
НЕРАВНОМЕРНАЯ СТРУКТУРА МИГРАЦИЙ ГЕНОВ МЕЖДУ ИЗУЧЕННЫМИ ПОПУЛЯЦИЯМИ.
Две составляющие оценки надежности картографических моделей, рассмотренные выше, обеспечивают полноту анализа в случае генетической изотропности ареала. В большинстве случаев, между популяциями или группами популяций существует неравномерная структура миграций. Следовательно, необходимо учитывать данный аспект при анализе надежности геногеографического прогноза частоты генов в географическом ареале. Для решения данной проблемы предлагается следующий способ: исследуемый ареал необходимо разграничить субареалами подразделенное™, используя те или иные соображения. Здесь имеются в ввиду или демографические данные, или данные этнографические, или данные экологические, позволяющие очертить субареалы рассматриваемых групп. Это означает, что внутри субареалов мы предполагаем пространство генетически изотропным. Факторы изоляции отдельных субареалов здесь могут быть как природные, так и социальные. Далее необходимо определить структуру миграции между группами. В настоящее время накоплено значительное количество математических моделей, дающих удовлетворительные результаты при анализе структуры миграции между субареалами.
Пусть некоторый ареал состоит из п подразделенных групп, субареалов.
Необходимо оценить надежность картографического прогноза популяционно-генетического признака с учетом подразделенности популяций. Процедура расчета в таком случае выглядит так : если прогнозируемая точка 01 попадает в ареал п1, то те популяции, которые попадают в данный ареал (популяции А, В), входят с весом 1, а те популяции, которые находятся в ареале не-п1 ( популяция С в ареале п2, популяция Д в ареале пЗ), в расчет попадают с коэффициентами АП1.„2 , Ап1.„з соответственно (рис.5). Т.е. как бы "чужие" популяции "отодвигаются" на А раза больше, чем их истинное расстояние от данной точки (рис.5). Данный коэффициент в
уравнении (1.3) учитывается так : йщ = Ап • ^(х, — Х()2 +- (}>, — у^ )2
евклидово расстояние от текущего узла картографической сетки до изученных популяций 1, где А„=1/<рП1.„. В общем случае для п субарелов (подразделений) должна быть известна матрица структуры миграции размером п*п.
Рис. 5 Моделирование надежности с учетом миграционной проницаемости между популяциями.
Коэффициент ф в дальнейшем будем называть коэффициентом миграционной проницаемости. Он может изменяться от 0 до 1. Когда обмен генов между группами отсутствует, то данный коэффициент равен 0, при генетически изотропном пространстве он равен 1. Плотность вероятности ошибок интерполяции вычисляется с помощью (1.2), (1.3), а надежность определяется выражением (1.1).
В качестве примера рассмотрим карты надежности геногеографического прогноза распределения частоты гена глиоксадазы1 0Ь01*1 в коренном населении республики Марий Эл. При этом уровень строгости принимаем равным к=3 и достоверность в исходных популяциях а=1 для всех случаев моделирования. Для выяснения влияния коэффициента миграционной проницаемости для марийской популяции, подразделенной на две субэтнические группы - горные и луговые мари, — рассмотрим следующие случаи:
1. коэффициент миграционной проницаемости между двумя группами равен 0.75
2. коэффициент миграционной проницаемости между двумя группами равен 0.5
3. коэффициент миграционной проницаемости между двумя группами равен 0
На рис.6 б,в,г приведены карты надежности распространения данного гена в зависимости от коэффициента миграционной проницаемости при постоянных уровнях строгости (кг=3) и достоверности в исходных популяциях (а=1). Обращает внимание на себе тот факт, что при 0 миграционном проницаемости (рис.бг) надежность картографического прогноза локализуется ячейкообразно в пределах рассматриваемых генетически изотропных групп. Динамика изменения доли территории с различными показателями надежности (ось У в %) в зависимости от параметра коэффициента миграционной проницаемости (ось X) приведена на рис. 6а.
100 -, 80 60 40 20
□ 1 балл Я 2 балл ШЗ балл
■ 4 балл
■ 5 балл
■ Ме
0,75 0,5 0
баллы при (0.75,0.5, 0)
Рис. 6а. Зависимость изменения доли территорий (%) от значения коэффициента миграционной проницаемости (<р).
Как показывают результаты моделирования, игнорирование данного
важнейшего параметра неравномерной структуры миграции генофонда может
привести к ошибочным выводам относительно генетической структуры популяции.
Следует отметить, что с помощью коэффициента миграционной проницаемости
можно учесть любые препятствия на пути распространения генов в географическом ареале популяции. В табл.4 приведены эти же результаты в табличном виде.
Табл.4
Изменение доли территорий (%) с различной оценкой надежности картирования (Р) в зависимости от коэффициента миграционной проницаемости <р
Оценка надежности Коэффициент миграционной Проницаемости
Вероятность Р Баллы 0.75 0.5 0
0.00<Р<0.90 1 14.215 21.354 24.923
0.90<Р<0.95 2 6.092 4.369 2.954
0.95<Р<0.975 3 6.277 4.369 3.692
0.975<Р<0.99 4 6.215 5.292 4.738
0.99<Р<1.00 5 67.20 64.615 63.692
Средняя надежность карты Р 95.08 91.17 86.56
ЩШШНИ ЫППЕП I"! И-!»
ШШ-ГШИШШ 11ГНН III!!, <и»|Ш|п )ППШ([|| )!11Ш1Ш11 '¡2000000
> 1 < : 11 с I 1 | ^шип I I д 11 I 11 г « I 1 I т и га о » <р ю
Рис.66 Моделирование надежности распространения гена глиоксалазы] ОЬО!* 1 в марийском населении. Случай, когда коэффициент миграционной проницаемости между горными и луговыми мари ср=0.75
1Ц1ШШ1П 11]Ш1Ш 1=1 И-*'
¿.С* ir.1l'
1Ш11-Г1ШИ1ГГ11 11ГШ1 |ИП. и||||Т||Х| ТШШШН Ш11ШШ11 ПОЛНОЮ
I I С « К I Е I I I 1Х111НЕ1 1Ц|(Ч11(К]11 11Г1 И О Ю ¿0 Ю » 101 «
Рис.бв Моделирование надежности распространения гена глиоксалазы1 0,01* ! в марийском населении. Случай, когда коэффициент миграционной проницаемости между горными и луговыми мари (р=0.5
1Ц1ШШШ ЩИШП 1:1 (=1.1»
Рис.бг Моделирование надежности распространения гена глиоксалазы 1 0.01*1 в марийском населении. Случай, когда коэффициент миграционной проницаемости между горными и луговыми мари <р=0
КОМПЬЮТЕРНАЯ ТЕХНОЛОГИЯ КОМЛЕКСНОЙ ОЦЕНКИ НАДЕЖНОСТИ ПО СОВОКУПНОСТИ РАЗЛИЧНЫХ ПАРАМЕТРОВ НАДЕЖНОСТИ.
Для практического пользователя представляет интерес одновременный учет выше проанализированных трех факторов: параметр пространственного распределения генетически изученных популяций, параметр степени достоверности исходной генетической информации, параметр неравномерной структуры миграции генофонда. В данном случае надежность системы анализируется согласно формуле (1.1). В качестве плотности вероятности ошибок интерполяции используются формулы (1.2), (1.3). Географические расстояния модифицируются согласно коэффициентам миграционной проницаемости. Вычисляется достоверность определения популяционно-генетического признака в исходных популяциях (Животовский, 1992).
Следует отметить, что учет одновременно трех факторов возможен только в , комплексных популяционно-генетических исследованиях. В этом случае, как правило, известны частоты генетических маркеров в различных популяциях, границы элементарных популяций, матрица миграции между популяциями и др. Такое комплексное исследование проведено в населении республики Марий Эл, благодаря чему стало возможным оценивание карты надежности с учетом всех трех основных факторов популяционной структуры в ареале генофонда. На рис.7 приведена карта распространения частоты аллеля глиоксалазы1 ОШ1*1 в марийском населении республики Марий Эл с одновременным учетом вышеперечисленных трех факторов надежности. При этом коэффициент корреляции с долготой местности составил гдол=-0.717, с широтой местности гшир=-0.184, коэффициент множественной корреляции с долготой и широтой местности гмнЮ.541 (Р>0.999). В табл.5 приведены сравнительные характеристики основных популяционно-генетических показателей до применения процедур надежности геногеографического прогноза и после. Данные результаты показывают, что процедура анализа надежности не изменяет минимальные и максимальные значения частоты аллеля. Остальные статистические и популяционно-генетические показатели меняются в различной степени.
Следовательно, при геногеграфическом анализе необходимо учитывать показатель надежности геногеографического прогноза с тем, чтобы избежать ошибочных выводов при исследовании генетической структуры популяции.
Табл.5
Сравнительные характеристики основных популяционно-генетичсских показателей гена СЬО*1 до и после применения процедур оценки надежности геногеографического прогноза
Популяционно- Без учета С учетом
генетические надежности надежности
Показатели
Min 0.2960 0.2960
Мах 0.5660 0.5660
Mean 0.4682 0.4611
Дисперсия 0.0020 0.0017
Gst 0.0081 0.0068
Ht 0.2490 0.2485
Hs 0.2470 0.2468
гдол -0.801 -0.717
-0.007 -0.184
1*мн 0.670 0.541
ипш гш сим 1 iiriimi liciinii шп п
Рис.7 Карта распространения частоты аллеля глиоксалазы1 GLOJ*l с учетом
надежности в коренном населении республики Марий Эл
2. МЕТОДОЛОГИЯ ПОСТРОЕНИЯ КОМБИНИРОВАННЫХ (СИНТЕТИЧЕСКИХ) КАРТ С УЧЕТОМ НАДЕЖНОСТИ ГЕНОГЕОГРАФИЧЕСКОГО ПРОГНОЗА.
Комбинированные (синтетические) карты получаются в результате расчетного моделирования исходных карт. Под расчетным моделированием мы понимаем любые операции над цифровыми моделями карт, такие как операции сложения, вычитания, умножения, деления, другие алгебраические операции, корреляционный анализ, кластерный, компонентный, анализ генетических расстояний и др. анализы. Приводим формулы основных операций над цифровыми моделями карт признака с учетом надежности картографического прогноза.
п п
Среднее арифметическое значение признака Мц = ^ / ^ (2.1 а)
/=| /=1
Среднее геометрическое значение признака Од =1 | ) ' (2.1 б)
П " — "
Дисперсия признака Вд =-~яУ (2-2)
И-1 ы ы
Ковариация двух признаков
(Щр,д)=-
и-1
1
Е ¿ЛЧГ<1)2 / = 1 4
п п Т.Р .1.Р.
/=1 рч=1
(2.3)
где р„ ф - значения признаков, /"-надежность (достоверность) определения значения признака.
Ввиду того, что практически во всех типах анализа применяется стандартный подход оценки надежности комбинированных признаков, методологию продемонстрируем на примере анализа главных компонент. Для оценки надежности (синтетических) комбинированных признаков можно предложить два равноценных варианта, имеющих как свои достоинства, так и недостатки.
Первый вариант: Пусть в каждой точке картографического узла показатель надежности есть непрерывная случайная величина. Тогда можно определить математическое ожидание этой случайной величины как
1 М
(2.4)
где 0^1 надежность картографического прогноза признака / в данной точке с координатами Х| у^ N - количество признаков.
При этом порядок построения суммарной карты надежности главных компонент выглядит так:
1 .Строятся карты надежности исходных признаков.
2.В каждом узле картографической сетки вычисляется средняя надежность по формуле (2.4)
В результате получим результирующую карту средней надежности комплекса признаков. Затем с помощью карты надежности сортируются те значения цифровой матрицы исходных карт, которые удовлетворяют заданному уровню надежности. Таким образом, в результате данной операции мы имеем отсортированные значения цифровой матрицы, которые выступают как исходные данные для дальнейшего(компонентного) анализа. Премущество данного подхода состоит в том, что мы можем определить визуально ареалы, удовлетворяющие заданным условиям надежности. Основным недостатком является равная таксономическая ценность как хорошо изученных признаков, так и слабо изученных признаков. Второй вариант. В данном случае значение признака в каждом узле картографической сетки имеет собственный вес. В качестве веса выступает показатель надежности картографического прогноза признака в данном узле. Тогда коэффициент корреляции по Пирсону между картами вычисляется по формуле
где q, р значения признаков в узлах картографической сетки , Рр Рц показатели надежности геногеографического прогноза в картографическом узле соответствующих признаков, п- размер массива картографической сетки. Далее главные компоненты строятся по стандартной методике. Премущество данного подхода состоит в том, что мы можем точно определить вклад каждого признака в анализ главных компонент с учетом п\ таксономической ценности (надежности).
п
^РМ-рШ1Ъ-Ч)
г
(2.5)
Основным недостатком является невозможность визуализации ареала по критериям надежности.
Для примера приводим карты 1 главной компоненты изменчивости генофонда мари по иммуно-биохимическим маркерам 33 аллелей 10 локусов (ЛВО, TF, GC, PI, HP, AHS, F13B, ACPI, PGM1, GLOl). На рис.8а приведена карта 1 главной компоненты без учета методологии надежности, т.е. построенная стандартной методикой. В данном случае количество узлов цифровой матрицы составило 1625 единиц. При этом доля первых трех главных компонент забирала 72.8 % общей изменчивости частот аллелей.
Согласно выше указанной методике(первый вариант), построим карты надежности главного компонента генофонда мари (рис.8б). После учета карты надежности главных компонент были получены следующие результаты: количество узлов цифровой матрицы составило 1478 единиц, доля территории не удовлетворяющих критерию надежности, т.е. та доля, где надежность картографического прогноза ниже 0.95, не превышала 9.05 % от всей исследуемой территории. На картах данная территория указана как белое пятно (на северо-западе республики) генетически изученной территории республики (рис.9). Применяемые в анализе главных компонент коэффициенты корреляции рассчитывались по 1478
I1IIII П11Ш 11ШШМ М1ШЦ1 Ш1 (IS шш Н injm)
шт-rum и гш шин щи, ni>imin ншпкп) шдшшш
Г I С С I 1 С I 1 1 111ДК1111 I I | I | I к и I liri SO О 99 ÍD Ю BO too»
LIU Ю-'-"--'-1--'-J
Рис.За Карта I главной компоненты изменчивости генофонда мари (без учета методологии надежности)
ЩШМП ШШНШ1ШИИ ПИШИ 1Ш11[\1Ш1 1111 ГМШ1Д1 Ш1
Рис.86. Карта надежности геногеографического прогноза главных компонент изменчивости генофонда мари
методолгии надежности)
«надежным» точкам, вместо 1625 точек. А доли первых трех главных компонент в этом случае составляли 66.6 % от общей дисперсии, т.е. несколько уменьшились по сравнению с исходной моделью.
Таким образом, построение карты главных компонент без учета надежности может привести к неверным результатам и, следовательно, их необходимо учитывать.
З.ОЦЕНКА НАДЕЖНОСТИ ГЕНОГЕОГРАФИЧЕСКИХ МОДЕЛЕЙ.
Частоты генов В настоящее время накоплен большой материал по всему миру о частотах генов. Частоты генов служат исходными данными и для различных популяционно-генетических моделей. Поэтому при геногеографическом моделировании оценка надежности распространения частот генов по ареалу популяции приобретает важное значение для понимания и трактовки популяционно-генетических процессов, происходящих в популяциях. Учет показателя надежности геногеографического прогноза распространения частот генов в ареале, бесспорно, увеличивает разрешающую способность геногеографического подхода для оценки генетической структуры популяции. Для примера рассмотрим карту распространения частоты аллеля ЬАС*Я системы лактазы в Европе (рис. 10а.). Данный рецессивный аллель контролирует процесс непереносимости молока здорового взрослого населения (Козлов, 1996). На рис.106 приведена карта надежности географического прогноза данного аллеля. Учет показателя надежности позволил отсечь 71.685% территории не удовлетворяющей критериям надежности (вероятность прогноза менее 0.95) для дальнейшего картографо-стагистического анализа. При этом данное изменение территории, удовлетворяющее требованиям надежности (достоверность прогноза выше 0.95) позволило получить следующие популяционно-гецетические характеристики данного аллеля (см. таб. 6).
Рас. 10а. Распространение частоты ачлеля ¿АС*Лв коренном населении Европы.
luillltu ГШШШШШШ ШИШ Uli UPI 1 Ш1ЦШ11Ш1 11?IIS
iiiut-rtiHMifeil имиI днл, tiiMimii nirnuKl lllllllMliril 11 < (11 (11 I ti in) к miiiiieiii mi им
JfJCWOCW эте о зов iw wo ют tsw»
Рис.106. Карта надежности геногеографического прогноза частоты аллеля ЬАС*Я в коренном населении Европы
Табл.6
Сравнительные характеристики основных популяционно-генетических показателей гена ЬАС*И до и после применения процедур
Популяционно- Без учета С учетом
генетические надежности надежности
показатели
Min 0.128 0.128
Мах 0.954 0.954
Mean 0.664 0.569
Дисперсия 0.0377 0.0332
Gst 0.169 0.136
Ht 0.223 0.245
Hs 0.185 0.212
Соотношение регрессии до применения процедуры надежности:
Частота гена = 0.007745*долгота-0.008718*широта+0.858802
Соотношение регрессии после применения процедуры надежности:
Частота гена = 0.009949*долгота-0.015217*широта+1.113632 Учет надежности гспогсографического прогноза распространенности частоты аллеля ЬАС*Я в Европе, позволил уточнить коэффициентов уравнения регрессии зависимости частоты аллеля от географических координат. Уравнение получено с испльзованием метода географической взвешенной рсгресии(РоШепп£11ат, 1997).
^ИСПОЛЬЗОВАНИЕ РАЗРАБОТАННЫХ МЕТОДИК ДЛЯ ПОСТРОЕНИЯ "СИНТЕТИЧЕСКИХ" КАРТ ГЛАВНЫХ КОМПОНЕНТ ИЗМЕНЧИВОСТИ МОДЕЛЬНЫХ ГЕНОФОНДОВ
Карты главных компонент генофонда являются результатом анализа совокупности карт отдельных признаков - генов. Провести анализ главных компонент без картографирования генофонда нельзя по чисто технической причине - исходная информация о генах несопоставима. Практически каждый локус изучен по собственному, отличающемуся от других, набору популяций: они различаются по количеству популяций, по их составу, по географическому размещению популяций. Это делает исходную информацию о генах несопоставимой и недоступной для прямого анализа главных компонент генофонда. Применение картографического подхода позволяет обойти данное препятствие только при одном условии, - когда имеется инструмент прогностической ценности того или иного гена, участвующего в анализе главных компонент. В результате анализа мы имеем новые признаки -главные компоненты, обобщающие информацию о изменчивости всех исходных признаков. Ниже приводятся конкретные примеры карт надежности главных компонент, различных генетических признаков на различных модельных генофондах.
Классические и ДНК маркеры. Для модельного региона Восточной Европы были построены главные компоненты генофонда по классическим маркерам для 100 аллелей по 34 локусам. По маркерам ДНК в анализ главных компонент были включены 48 аллелей по 4 локусам. Затем были построены карты надежности указанных синтетических признаков. Следует отметить, что коэффициент ранговой корреляции по Спирману между главными компонентами изменчивости генофондов по классическим маркерам и по ДНК - маркерам был до применения процедуры теории надежности геногеографического прогноза р=0.157, а после применения процедуры надежности р=0.834. Учет фактора надежности позволил более точно определить представления об изменчивости генофонда Восточной Европы, определяемыми классическими и ДНК маркерами.
Кеашгепетические маркеры. В исследовании генетической структуры популяции часто используют не прямые частоты генетических маркеров, а, так называемые, квазигенетические маркеры (Ревазов, 1987). Оценка надежности геногеографического прогноза квазигенетических маркеров в географическом ареале приобретает важное практическое значение в связи с их привлечением к оценке генетических процессов, происходящих в природных популяциях. Для коренного
населения республики Адыгея были построены карты главных компоненты по частотам фамилий (1326 фамилий) по стандартной методике без учета надежности (рис. 11 а). После построения карт надежности синтетического признака (рис.116), были заново перестроены карты главных компонент с учетом надежности (рис. 12а). Учет фактора надежности геногеографического прогноза позволил снизить долю дисперсии забираемой первыми 3-мя главными компонентами изменчивости частоты фамилии с 37.6% до 24.6%. Кроме того, были рассчитаны значения главных компонент в исходных точках, без интерполяции и на их основе были построены карты главных компонент (рис.126). В результате были получены следующие коэффициенты корреляции. Между картой 1 главной компоненты по исходным точкам и аналогичной картой без учета надежности 0.6056, а с картой с учетом надежности 0.9675. Данный факт указывает, что при геногеографическом анализе множественных генетических признаков вопросы надежности геногеографического прогноза приобретают особенную актуальность, т.к. неучет данного фактора может привести к ошибочным выводам.
Аутосомпо-рецессиеная моногенная патология. Накопление и систематизация данных по геногеографии наследственных болезней имеют важное значение как для практического здравоохранение, так и фундаментальной науки. В нашей стране эти исследования выделились в особую область - популяционную географию наследственных болезней (Гинтер,1978). Этот раздел популяционной и клинической генетики направлен на изучение закономерностей распространения наследственных болезней в зависимости от разных (социальных, демографических, этнических, географических и т.д.) факторов.
Решение вопроса оценки надежности распространенности груза наследственных болезней в популяциях становится важным звеном при определении их генетической структуры.
В ходе медико-генетического обследования населения Марий Эл были получены оценки частот 45 генов по аутосомно-рецессивной (АР) моногенной патологии для марийского населения республики. Установлено, что карта главных компонент изменчивости генофонда по классическим маркерам и карта главных компонент изменчивости по аутосомно-рецессивным генам имеют коэффициент корреляции по Спирману р=0.782. Однако методология учета надежности геногеографического прогноза позволила изменить данный коэффициент до р=0.736.
1 ниш шиши »»шиит» и мним {»«ни цт щашч)
К ш В1
N - 701 Ш а 'З.Х58 ПАХ ш У,7417
тм». .то
д.р_ч.У
ПОГЦШШ ШШН 14 111 п )
.щ з.тэд 9 т гчго |
■шп-гшшссп! мшЫ штт, нк]т)мГ1Ш1тк1 шцштн 7иэ«лто
(»1(114111 МД13 111 1111М14С1Х 11Т1 ^ ^? *
Рис.11а. Карта 1 главной компоненты изменчивости генофонда по квазигенетическим маркерам в коренном населении Адыгеи.
|||еч»сп пртпц^петт» >у«пж
1ШОЖ1Я »¿ОС» I * IГ I 111
идм-мнпмш) ыш! цт, мпмпи пптнм) нциинт Г М < I ( 4 С 1 Д 11ЦП11 ППП11(1: 1171
ШТ
Рис.1 ¡6. Карта надежности главной компоненты изменчивости генофонда по квазигенетическим маркерам в коренном населении Адыгеи.
квазигенетаческгш маркерам населения Адыгеи (с учетом надежности).
К Ш 67 N - 935 пт ж -8.5Л» ЛИХ • .9733
км». .ет
"^¡ШШШГшШГТГГТТТТГ
(»(«■Кен 1(1
т
ТТ. икити Гштпмм! ШЛПШГИ III II ПИШИ 117 1
Рис. 126. Карта I главной компоненты изменчивости генофонда но квазигенетическгш маркерам населения Адыгеи (по исходным точкам без
интерполяции).
5. ГЕНОГЕОГРАФИЧЕСКИЙ АНАЛИЗ ДРУГИХ ПАРАМЕТРОВ ГЕНОФОНДОВ.
Пространство главных компонент.
Использование пространства главных компонент стало традиционным при решении многих биологических задач. Создается оно с помощью простой процедуры: ось ординат соответствует одной компоненте, ось абсцисс - другой компоненте, а анализируемые группы - в соответствии со значениями этих компонент - размещены в той или иной части созданного пространства. Несмотря на простоту такой диаграммы, в процессе визуального анализа взаиморасположения изученных групп создается образ, несущий новую информацию о группах. Пространство главных компонент становится важным инструментом для осмысления результатов, их критической интерпретации и сопоставления с накопленной ранее информацией о взаимодействии изучаемых групп. Использование карт "надежности" помогает выбрать для анализа из всей совокупности интерполированных значений лишь те элементы матрицы, которые обладают высокой прогностической ценностью, так как карты надежности несут из всей совокупности интерполированных значений лишь те элементы матрицы, которые обладают высокой прогностической ценностью.
Поэтому те области карты, которые не были обеспечены исходной информацией (мало изученные популяции или изученные по малому числу маркеров, или недостаточный размер выборки, или этнически гетрогенный ареал ), можно исключить из анализа главных компонент. В качестве примера приведено пространство главных компонент генофонда народов Восточной Европы по 1 и 2 главным компонентам. На рис.13а приведены отдельные этносы в "ненадежном" пространстве, а на рис.136 в "надежном " пространстве главных компонент. Как видно, учет надежности позволяет существенно корректировать получаемые результаты, в частности, этносы выделяются в самостоятельную группу, не связанную с остальными группами сколь-либо существенным образом . Межпопуляционпое разнообразие генофонда.
Размах межпопуляционного генного разнообразия - важнейшая характеристика как генофонда в целом, так и отдельных генетических маркеров. Наиболее общепринятым является описание межпопуляционной дифференциации в терминах Р5Т-статистики Райта и С5Т-статистики Нея представляющей дальнейшее развитие Райтовского подхода(Р5т ^057). На рис.14 приведена карта Ре! статистик
компонент.
-НА£ЕЙйЕ- ПРОСТРАНСТВО 1 и 2 ГЛАВНЫХ КОГШЕНТ В.ЕВРОПЫ русские
---'- у Ч*/. .'г-.Л
эстонцы
мордва
Л-
белорусы Д . -
украинцы
а *
-в.« -Л.9
Рис. 136. Расположение этносов в "надежном " пространстве главных компонент аллеля 1АСЧ1 в населении Европы. Для геногеографического изучения изменчивости показателя Р5Т предлагается следующий способ: 1. Строится карта распространения частоты интересующего аллсля на картируемой территории (см. рис. 10а).
2. Строится карта надежности геиогсографического прогноза данного аллеля на этой же территории (см. рис. 106).
3. Далее способом «плывущего окна» строится карта межпопуляционного разнообразия на основе GSt статистики по формуле.
Fst = Gst = Dp / р{ 1 - р) (5.1)
где Dp-дисперсия исследуемого аллеля в окне вычисляется по формуле (2.2), среднее значение аллеля в окне вычисляется по формуле (2.1). В качестве весов выступает показатель надежности картографического прогноза рассматриваемого аллеля. Данная карта, демонстрирует сильную гетрогенность Gst статистики аллеля LAC*R в ареале генофонда. Значения Gst статистики меняется от 0 до 0.24. Светлый интервал показывает географию низкого значения данной статистики, темный интервал высокое значение и серый интервал умеренное значение Gst статистик в рассматриваемом ареале.
Кроме того, разработанная методика органически соединяет все имеющегося три способа изучения генетической структуры популяции: а) частот исследуемых аллелей б) генного разнообразия в) селективной структуры генофонда картографическим способом, при учете показателя надежности картографического прогноза.
Рис. 14. Распространение оценок Gsl аллеля LAC*R в коренном населении Европы.
44 Выводы
1. На основе теории надежности создан принципиально новый подход для оценки достоверности результатов в популяционно-генетических исследованиях. Теория надежности используется наряду с традиционным аппаратом теории вероятности н математической статистики, существенно расширяя их возможности. На основе подхода и понятийного аппарата теории надежности создано новое направление оценки достоверности картографических моделей в полуляционнон генетике, позволяющее выйти на новый уровень корректной интерпретации и обобщения популяционно-гснетических данных.
2. Разработаны математический аппарат и программное обеспечение для оценки надежности картографических моделей в гепогеографин с учетом трех основных факторов:
а) размера выборки из популяции и частоты признака;
б) географического распределения генетически изученных популяций в пределах ареала генофонда;
в) гетерогенности генофонда, приводящей к неравномерной структуре миграций генов в ареале генофонда.
3. Предложена модификация методов одно и многомерных статистических процедур обработки карт с учетом надежности (достоверности) исходных геногеографических моделей популяционно-генетических признаков. Создан их математический аппарат и программное обеспечение.
4. Проведен многомерный статистический анализ главных компонент и пространства главных компонент для различных генофондов на основе количественной оценки надежности их составляющих. Разработанный подход позволяет не только классифицировать данные по степени надежности, но и отбирать для дальнейшего анализа данные с определенным уровнем надежности. Показано, что использование теории надежности позволяет получать наиболее достоверные результаты (коэффициент корреляции главных компонент без интерполяции (по исходным точкам) и с интерполяцией с учетом надежности г=0.9675).
5. Доказана высокая эффективность используемых подходов и применимость математического аппарата учета надежности при картографическом моделировании иерархически различных генофондов (Старого Света, Европы, Восточной Европы, Кавказа, Марий Эл, Мордовии, Адыгеи).
6. Продемонстрирована адекватность разработанных подходов и методологии при картографическом моделировании признаков различной природы: генетических маркеров (классических и ДНК), квазигенетических маркеров, инбридинга, генов наследственных болезней, мультифакториальных болезней.
7. Создан математический аппарат и программное обеспечение для построения карт межпопуляционного разнообразия генофонда (Се! статистика Нея) с учетом надежности геногеографического прогноза. Разработанная методика впервые позволила соединить все три способа изучения генетической структуры популяции: а) частоты генов в популяции; б) генное разнообразие; в) селективную структуру с помощью картографического моделирования.
Список основных работ, опубликованных по теме диссертации
1. Компьютерная технология геногеографического изучения генофонда. 1 .Статистическая информация геногеографической карты. //Генетика, 1994., Т.ЗО, №7, С.951-965 (соав.: Балановская Е.В., Рычков Ю.Г.)
2. Компьютерная технология геногеографического изучения генофонда.
2.Статистическая трансформация карт.//Генетика,1994, Т.ЗО., №11, С.1538-1555 (соав.: Балановская Е.В., Рычков Ю.Г.)
3. Компьютерная технология геногеографического изучения генофонда.
3.Выделение трендовых поверхностей.//Генетика,1995, Т.31., №4, С.536-559 (соав.: Балановская Е.В.)
4. Генофонд, геногеография и заболеваемость населения (по данным о Северной Осетии).//Успехи современной генетики., 1996, вып.20, С. (соав.: Балановская Е.В., Рычков Ю.Г. Жукова О.В., Шнейдер Ю.В.)
5. Популяционно-генетическое изучение наследственных заболеваний нервной системы в Мордовии.//Журнал Регионология.,1996, №2, С.153-160 (в соав.: Балановская Е.В., Иноземцева B.C., Перепелов A.B., Петрин А.Н., Руденская Г.Е., Ситников В.Ф.)
6. Генетическая эпидемиология наследственных болезней нервной системы. Наследственные болезни нервной системы в Мордовии., Саранск, Изд. Мордовского государственного университета, 1996,С.97-112 (в соав.: Перепелов A.B., Иноземцева B.C., Петрин А.Н., Ситников В.Ф., Балановская Е.В., Руденская Г.Е.)
7. Компьютерная технология геногеографического изучения генофонда. 4.Популяции в пространстве главных компонент.//Генетика, 1997, Т.ЗЗ., №12, С.1693-1710 (соав.: Балановская Е.В.)
8. Genogeography of the LAC*R gene in the Old World, Russia and Urals Variation in the Human Genome: Acquiring, Handling and Storing the Date Helsinki, 1997,Finland (в соав.: Kozlov A.I. Balanovskaya E.V. Lisitsyn D.D. Vershubsky G.G.)
9. Геногеография и генофонд. Пространство главных компонент. Сб. "Новые методы и новые подходы в современной антропологии". М.: Старый сад,1997, С.99-115 (соав.: Балановская Е.В.)
10.Геногеография и генофонд. Оценивание надежности карты. Сб. "Новые методы и новые подходы в современной антропологии". М.: Старый сад,1997, С.116-132 (соав.: Балановская Е.В.)
11.Историческая геногеография Восточной Европы. Сб. "Горизонты антропологии", М.: Русский мир,1997, С.152-162 ( в соав.: Рынков Ю.Г., Балановская Е.В.)
12.Наследственные болезни нервной системы в Мордовии.//Генетика,1997,Т.ЗЗ., №6, С.836-843 ( в соав.: Петрин А.Н., Перепелов A.B., Балановская Е.В., Ситников В.Ф., Руденская Г.Е.)
13.Геногеография генофонда и витальных характеристик башкир. Резюме докладов и сообщений Второго международного конгресса этнографов и антропологов. Уфа, Восточный университет, 1997, С.68 ( в соав.: Балановская Е.В., Спицына Н.Х.)
14.Селективная структура генофонда. I. Возможности изучения // Генетика. 1997. Т.ЗЗ. № 11. С. 1572-1588. .(в соав.: Е.В. Балановская)
15.Геногеография наследственной патологии в населении Мордовии. Резюме докладов и сообщений Второго международного конгресса этнографов и антропологов. Уфа, Восточный университет, 1997, С.69 (в соав.: Перепелов A.B., Петрин А.Н., Балановская Е.В., Ситников В.Ф., Иноземцева B.C.)
16.Геногеографическое положение башкир в системе уральских генофондов. Резюме докладов и сообщений Второго международного конгресса этнографов и антропологов. Уфа, Восточный университет, 1997, С.64 (в соав.: Балановская Е.В., Спицына Н.Х.)
17.Геногеография первичной гиполактазии в популяциях Старого Света. //Генетика, 1998,Т.34.,№4,С.551-561 (в соав.: Козлов А.И., Балановская Е.В., Балановский О.П.)
18.Новый ДНК-маркер как расово-диагностический признак. Тезисы докладов международной конференции Европейской ассоциации антропологов "Раса: миф и реальность", М.: Старый Сад, 1998, С.25-26 (в соав.: Беляева О.В., Балановский О.П., Спицын В.А., Гусева И.А., Эрдес Ш., Хуснутдинова Э.К., Микулич А.И., Лимборская С.А.)
19.Молекулярно-генеггический полиморфизм в изучении народонаселения: геногеография Восточной Европы. Тезисы докладов международной конференции Европейской ассоциации антропологов "Раса: миф и реальность", М.: Старый Сад, 1998, С.59-60 ( в соав.: Лимборская С.А., Балановский О.П.)
20.Генофонд Кавказа в контексте расы. Тезисы докладов международной конференции Европейской ассоциации антропологов "Раса: миф и реальность", М.: Старый Сад, 1998, С.21-22 ( в соав.: Балановская Е.В., Почешхова Э.А.)
21.Генофонд адыгов: прошлое в настоящем. Тезисы докладов международной конференции Европейской ассоциации антропологов "Раса: миф и реальность", М.: Старый Сад, 1998, С.71-72 ( в соав.: Почешхова Э.А., Балановская Е.В., Балановский О.П.)
22.Разнообразие наследственной патологии у населения республики Марий Эл и ее дифференциация по частотам генов наследственных болезней // Генетика. 1998. Т.34. № 7. С. 963-972. (в соав.: Гинтер Е.К., Мамедова Р.А., Козлова С.И., и др.)
23.Climate-Dependent Genetic Variation of alpha-2HS-G!ycoprotein.//Human Biology, June 1998, v.70, №3,pp.463-475 ( в соав.: V. A. Spitsyn, O.L. Kravchuk, D. Krause, W. Kuchheuser)
24. An estimation of the burden of hereditary pathology on the basis of theory of reliability.// The Am. J. of Human Genetics, v.63, p.263,1998 (в соав.: E.K. Ginter.E.V. Balanovskya, O.P. Balanovsky)
25.Компьютерная технология геногеографического изучения генофонда. V. Оценивание надежности карт // Генетика. 1998. Т.34. № 6. С.825-838. .(в соав.: Е.В. Балановская)
26. Study of polymorphism at a vntrlocus3' to the apolipoprotein b gene in the udmurt population.// Human Heredity, 1999, v. p. (в соав.: V.A. Spitsyn,M.V. Khorte,T.V. Pogoda, P.A. Slominsky,R.K. Agapova,S.A. Limborska)
27.Межпопудяционное разнообразие генофонда: аппроксимация Р-распределением // Генетика. 1998. Т.34. № 7. С.1004-1008.(в соав.: Е.В. Балановская)
28.Селективная структура генофонда. II. Стандартная технология определения через FST-статистики // Генетика. 1998. Т.34. № 9. С.1307-1321 (в соав.: Е.В. Балановская)
29.Селективная структура генофонда. III. Технология определения через FST -статистики методом численного ресэмплинга // Генетика. 1998. Т.34. № 10. С. 1434-1446 (в соав.: Е.В. Балановская)
30.Селективная структура генофонда. IV. Технология определения через показатель интенсивности отбора Rs//Генетика. 1998. Т.34. № 11 С.1559-1573 .(в соав.: Е.В. Балановская)
31 .Геногеография коренного населения Марий Эл ( по данным иммуно-биохимическом полиморфизме).//Генетика, 1998, Т.34. Jfe 12. С.1037-1041 (в соав.: Кравчук О.И., Балановский О.П., Спицын В.А., Гинтер Е.К.)
32.East European Lowland as an area of longtime interaction between Caucasoid and Mongoloid peoples. //The Am. J. of Human Genetics, 1998,v.63, p.215 ( в соав.: S.A. Limborska, P.A. Slominsky, M.I. Shadrina, S.N. Popova, O.V. Belyaeva, T.V. Pogoda, O.P. Balanovsky, D.A. Verbenko, E.K. Khusnutdinova, V.A. Spitsyn, A.I. Mikulich)
33."Синтетические" карты генофонда мари ( по данным об иммуно-биохимическом полиморфизме).//Генетика, 1999, Т.35. № 2. С.312-321 (в соав.: Кравчук О.И., Балановский О.П., Макаров С.В., Спицын В.А., Гинтер Е.К.)
34.Оценивание надежности в популяционно-генетических исследованиях. Резюме докладов и сообщений III конгресса этнографов и антропологов. Москва, 1999, С.112
35.Пространственная изменчивость показателя случайного инбридинга (картографический анализ квазигенетических маркеров).//Жизнь популяций в гетерогенной среде. Йошкар-Ола: Периодика Марий Эл, 1998, С.64-66 (в соав.: Почешхова Э.А., Балановский О.П., Балановская Е.В.)
36.Картографический анализ генетических расстояний и главных компонент изменчивости генофонда мари.//Жизнь популяций в гетерогенной среде. Йошкар-Ола: Периодика Марий Эл, 1998, С.60-62 (в соав.: Кравчук О.И., Балановский О.П., Балановская Е.В.)
37.Компыотсрная геногсография: картографирование корреляций между параметрами генофонда и среды.//Жизнь популяций в гетерогенной среде. Йошкар-Ола: Периодика Марий Эл, 1998, С.63-64 (в соав.: Балановская Е.В., Балановский О.П., Почешхова Э.А., Боровинских A.A.)
38.Геногеографические аспекты жизни популяций (генофонд человека).//Жизнь популяций в гетерогенной среде. Йошкар-Ола: Периодика Марий Эл, 1998, С.53-62 (в соав.: Балановская Е.В., Кравчук О.И., Балановский О.П., Почешхова Э.А., Боровинских A.A.)
39.Геногеографический анализ подразделенной популяции. I. Генофонд адыгов в системе кавказских генофондов.//Генетика, 1999, т.35,№6, С.818-830 (в соав.: Балановская Е.В., Почешхова Э.А., Боровинских A.A., Балановский О.П., Гинтер Е.К.)
40. Study of DNA diversity in East European populations.// Human Genome Meeting-99 (Brisbain, Australia).P.55.(B соав.: S. Limborska, P. Slominsky, E. Baianovsky et. al.)
41. Историческая геногеография Восточной Европы. Кн. "Восточные славяне. Антропология и этническая история"/ п/р Т.И. Алексеева, М.: Научный мир.,1999,С.109-134 (в соав.: Рычков Ю.Г., Балановская Е.В., Шнейдер Ю.В.)
42.Геногеографический атлас населения России и сопредельных стран ч.1. География генов. М.: Наука, (в печати) (в соав.: п/р Рычкова Ю.Г. Балановская Е.В., Жукова О.В., Сигнеев В.И., Шнейдер Ю.В.)
43 .Наследственные болезни и генетическая структура населения республики Марий Эл. М.: Медицина, 1999 (в печати), (в соав.: п/р Гинтера Е.К., Ельчинова Г.И., Руденская Г.Е. и др.)
44. Пространственная изменчивость генофонда человека: Геногеография и отбор. Материалы научной школы по "Экологической генетикс",С-Петербург,1999, С. 158-177. ( в соав.: Балановская Е.В.)
45.Влияние генетической структуры популяций на размеры груза моногенных наследственных болезней, в российских популяциях // Вестник РАМН (в печати) (в соав.: Зинченко P.A., Ельчинова Г.Е.,Балановская Е.В.,Гинтер Е.К.)
Участок множительной техники ОНЦ РАМН
Подп. к печати 10.12.2000 г. Заказ 080 Тираж 100 экз.
Содержание диссертации, доктора биологических наук, Нурбаев, Серик Долдашевич
Глава 1. ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
1.1. Актуальность проблемы
1.2. Цель и задачи исследования
1.3. Научная новизна и практическая значимость
1.4. Положения выносимые на защиту
1.5. Апробация работы
Глава 2. ОБЗОР МЕТОДОВ ОЦЕНКИ НАДЕЖНОСТИ РЕЗУЛЬТАТОВ ПОПУЛЯЦИОННО-ГЕНЕТИЧЕСКИХ ИССЛЕДОВАНИЙ
2.1. Теория надежности и ее приложения в биологической науке
2.2. Оценивание достоверности результатов популяционно-генетических исследований
2.2.1 Оценивание статистической достоверности выборочных исследований с помощью традиционных методов теории вероятности и математической статистики
2.2.2 Оценивание статистической достоверности выборочных исследований с помощью методов численного ресэмплинга
2.2.3 Оценивание статистической достоверности характеристик низкополиморфных генетических маркеров
2.2.4 Геногеографические исследования и вопросы достоверности геногеографического прогноза
Глава 3. КОМПЬЮТЕРНАЯ ГЕНОГЕОГРАФИЯ, ОСНОВНЫЕ ПРИНЦИПЫ И МЕТОДЫ
3.1. Область применения
3.2. Техника построения карт
3.3. Вопросы адекватности и надежности интерполяционных карт
Глава 4. МАТЕМАТИЧЕСКИЕ МЕТОДЫ ОЦЕНКИ НАДЕЖНОСТИ В ГЕНОГЕОГРАФИЧЕСКИХ ИССЛЕДОВАНИЯХ
4.1. Оценки дисперсии интерполированных признаков (карт) методом теории случайных полей
4.2. Разработка методов и программного обеспечения для оценки основных параметров надежности геногеографических моделей
4.2.1 Вывод основного типа распределения надежности геногеографических(картографических) моделей
4.2.2 Параметр размера выборки из популяции, обуславливающей степень надежности исходной генетической информации
Параметр подразделенности генофонда, приводящей к неравномерной структуре миграций генов
Компьютерная технология комлексной оценки надежности (по совокупности различных параметров надежности)
Моделирование надежности геногеографического прогноза в зависимости от числа, пространственного распределения, частоты признака и неравномерной миграции между генетически изученными популяциями
Влияние географии изученных популяций на оценку надежности геногеографического прогноза
Влияние размера выборки (частоты признака) в изученных популяциях на оценку надежности геногеографического прогноза
Влияние неравномерной миграции между изученными популяциями на оценку надежности геногеографического прогноза
Глава
МЕТОДОЛОГИЯ ПОСТРОЕНИЯ КОМБИНИРОВАННЫХ КАРТ С УЧЕТОМ НАДЕЖНОСТИ ГЕНОГЕОГРАФИЧЕСКОГО ПРОГНОЗА
Разработка основных математических операций с исходными картами с использованием надежности геногеографического прогноза
Разработка методов и программного обеспечения для построения трендовых карт с учетом надежности
Разработка методов и программного обеспечения для построения карт корреляции с учетом надежности
Разработка методов и программного обеспечения для построения карт главных компонент с учетом надежности
Практическое использование разработанных методик в одно и многомерных статистических анализах популяционно-генетических данных
Глава
МЕТОДОЛОГИЯ ОЦЕНКИ НАДЕЖНОСТИ РАЗЛИЧНЫХ ГЕНОГЕОГРАФИЧЕСКИХ МОДЕЛЕЙ
Модели распространения частот генов
Модели распространения квазигенетических маркеров
Модели распространения отягощенности наследственными заболеваниями в популяциях
Глава 7. ИСПОЛЬЗОВАНИЕ РАЗРАБОТАННЫХ МЕТОДИК ДЛЯ ПОСТРОЕНИЯ "СИНТЕТИЧЕСКИХ" КАРТ ГЛАВНЫХ КОМПОНЕНТ ИЗМЕНЧИВОСТИ ГЕНОФОНДА
7.1. Основные источники информации
7.2. Классические и ДНК маркеры
7.3. Квазигенетические маркеры
7.4. Аугосомно-рецессивная моногенная патология
7.5. Популяции в пространстве главных компонент
Глава 8. ГЕНОГЕОГРАФИЧЕСКИИ АНАЛИЗ МЕЖПОПУЛЯ-ЦИОННОГО РАЗНООБРАЗИЯ ГЕНОФОНДА
8.1. Методика картографирование Gst статистики Нея
8.2. Методика шкалирования карт Сэ! статистики Нея
8.3. Примеры использования карт межпопуляционного разнообразия при изучении генетической структуры популяции
Введение Диссертация по биологии, на тему "Разработка методологии оценки надежности результатов геногеографических моделей в популяционно-генетических исследованиях"
Изучение закономерностей генетических процессов, происходящих в популяциях, составляет основную проблему популяционной генетики. При решении этой проблемы основным инструментом является математическое моделирование и генетико-статистический анализ(Беили, 1979, Ратнер, 1977, Свирежев, Пасеков, 1982).
При создании генетико-математических моделей обязательным требованием является адекватность модели (Мойсеев,1979). Оценка адекватности модели возможна в случае учета фактора надежности исходных данных и корректного описания исследуемого процесса(Налимов,1971). При этом обеспечение адекватности модели и обеспечение необходимого уровня надежности выдвигают противоположные требования к модели. С одной стороны, построение адекватной модели требует учета широкого набора факторов, характеризующих исследуемый процесс, и, с другой стороны, высоко надежных экспериментальных данных. В результате поставленную проблему не всегда удается решить корректно и экономично. При построении модели требование надежности предполагает или включение только тех составляющих модели, которые удовлетворяют требованиям надежности, или такое сочетание составляющих (системная связь) модели, которые в совокупности также удовлетворяют требованиям надежности. В целом, при описании генетической структуры природных популяций проблема надежности полученных результатов и/или собранных данных в популяционно-генетических исследованиях становится важным звеном для корректного анализа и понимания генетических процессов, происходящих в генофонде (Тимофеев-Ресовский и др., 1973, Яблоков, 1987).
В последнее десятилетие в связи с развитием вычислительной техники в популяционной генетике широко используются методы математической компьютерной картографии, благодаря чему возникает новая область популяционной генетики - компьютерная геногеография (СаУЕШ^огга а! ,1995; ВагЫуаш,1987, 1994; Балановская и др.,1990; Рычков, Балановская, 1992, Рычков, 1984). Эта область является одной из наиболее сложных в популяционной генетике как в плане общей методологии, так и по сложности используемых моделей. Именно поэтому на примере этого сложного, бурно развивающегося раздела популяционной генетики, мы решили отработать методологию оценки надежности (достоверности) геногеографического моделирования на основе приложения теории надежности.
Основной задачей геногеографии является анализ генетической структуры популяций и изучение пространственных закономерностей генетических процессов, происходящих в природных популяциях. Для выявления этих закономерностей в геногеографии разработаны различные подходы [Мепогг! ^ а!., 1978; Рычков, Балановская, 1992; СауаШ-БКжа а1., 1995; МоигпегаБ а!., 1997].
Помимо картографического анализа, для изучения пространственных закономерностей в генетической изменчивости популяций используется ряд других методов [81а1кт, 1976, 1987; Каг1т, ШсМег-Оуп, 1976; Бока!, Ос1еп, 1978; 8ока1, 1979, 1988, 1991,1999; 8ока1, Мепога, 1982; 8ока1 е! а1. 1989; 1991; ВагЫуат, 1988,1991; ВагЬщ'аш, Бока!, 1990, 1991; ВагЫу'аш et а1. 1989, 1990; Hardihg, 1990]. Из них можно выделить три основных: 1) анализ клинальной изменчивости; 2) пространственный автокорреляционный анализ, позволяющий дифференцировать клинальную изменчивость, изоляцию расстоянием и влияния других факторов определяющих распространение генов; 3) "\УотЫт§", позволяющий выделять на картах генетически значимые границы в распространении генов, связанные с градиентами отбора или факторами изоляции популяций. Каждый из этих методов имеет свои премущества и недостатки. Однако наиболее полным и всесторонним анализом является комплексный, включающий как все эти методы, так и анализ "синтетических" карт генофонда, метод компьютерных интерполяционных карт распространения генов(СауаШ-8й)Г2а а1.,1995; Рычков,Балановская,1992), поскольку они позволяют не только дать единую оценку для всего генофонда («синтетические» карты), но и увидеть (не только клинальную изменчивость), как распределен оцениваемый фактор в пределах ареала генофонда. Кроме того, интерполяционные процедуры позволяют анализировать не только распределение частот генетических маркеров, но такие популяционно-статистические характеристики популяции как случайный инбридинг(Почешхова, 1998), эффективный размер популяции, дрейф генов (Евсюков и др., 1996; Почешхова,1998), плотность популяции(Евсюков и др., 1999), распространенность наследственных заболеваний в популяциях(Петрин и др., 1996, Гинтер и др., 1999), распространенность общих мультифакториальных заболевании в популяциях(Рычков и др., 1996,1998;Фельдман,1977;Завтур и др., 1970) и др. При этом любое значение геногеографической карты, полученное в результате интерполяционной процедуры, является прогнозом. Поэтому принципиально важной для развития геногеографии становится оценка надежности картографического прогноза (вероятности его осуществления).
Чем более точными становятся интерполяционные процедуры построения карт, тем острее становится вопрос: насколько сам характер исходного материала задает ничем не устранимую неточность(ненадежность) таких карт. К характеру исходного материала относятся и размер популяционной выборки (от которого зависит доверительный интервал частоты гена), и число изученных популяций, и их пространственное распределение в картируемом ареале, и природные преграды при продвижении носителей генов (моря, горные хребты, пустыни и т.д.), и социальные барьеры для популяций человека (этнические, конфессиональные, административные границы) и т.д.
Неоднородность исходных данных создает пространственную неоднородность их надежности, которая накладывается на реально существующую пространственную неоднородность в распределении признака. Дальнейшая трансформация геногеографических карт картографо-статистическими методами с учетом надежности геногеографического прогноза позволяет более точно определить генетическую структуру популяции.
В мировой литературе отсутствуют какие-либо попытки количественно оценить надежность геногеографических карт, что чрезвычайно сужает возможности использования геногеографических подходов. Исследователи предлагают качественные или косвенные оценки надежности карт (например, через количество изученных популяций или средний размер выборки), но такие оценки дают лишь некие общие представления о надежности модели и чрезвычайно субъективны (ВагЫцаш а а1.,1994; 8ока1,1979,8ока1 а1.,1999а,б;Яеп(1те е1 а1., 1999).
Создавшаяся противоречивая ситуация - отсутствие методологии количественных оценок надежности при ясно осознаваемой их необходимости - связана с тем, что используемые в популяционной генетике традиционные исторически сложившиеся подходы не позволяют корректно решить эту задачу.
В данной работе предлагается принципиально новая концепция и методология оценки надежности картографического прогноза. При ее создании были использованы подходы математического аппарата теории надежности. Специально разработанные нами для популяционной генетики математические модели, алгоритмы и оригинальное программное обеспечение позволяют оценивать надежность карты в каждой ее точке. Результатом данной работы является новая карта, отражающая пространственную гетерогенность в оценке надежности признака. Карта надежности указывает: если провести популяционно-генетическое исследование биологического объекта в любой точке карты, какова вероятность того, что полученный результат совпадет с картографическим прогнозом в пределах доверительного интервала карты. Полученное значение вероятности и будет соответствовать оценке надежности картографического моделирования в данной точке пространства карты.
В целом оценка надежности результатов генетико-математических моделей является краеугольным камнем как в геногеографии, так и в других областях популяционной генетики. Использование аппарата теории надежности открывает новые перспективы для разработки математических моделей и корректного использования уже накопленного арсенала средств математического моделирования. Решение этой проблемы будет способствовать надежному анализу и интерпретации получаемых результатов в популяционно-генетических исследованиях.
Заключение Диссертация по теме "Генетика", Нурбаев, Серик Долдашевич
выводы
1. На основе теории надежности создан принципиально новый подход для оценки достоверности результатов в популяционно-геногеографических исследованиях. Теория надежности используется наряду с традиционным аппаратом теории вероятности и математической статистики, существенно расширяя их возможности. На основе подхода и понятийного аппарата теории надежности создано новое направление оценки достоверности картографических моделей в популяционной генетике, позволяющее выйти на новый уровень корректной интерпретации и обобщения популяционно-генетических данных.
2. Разработаны математический аппарат и программное обеспечение для оценки надежности картографических моделей в геногеографии с учетом трех основных факторов: а) размера выборки из популяции и частоты признака; б) географического распределения генетически изученных популяций в пределах ареала генофонда; в) гетерогенности генофонда, приводящей к неравномерной структуре миграций генов в ареале генофонда. генетических признаков. Создан их математический аппарат и программное обеспечение.
4. Проведен многомерный статистический анализ главных компонент и пространства главных компонент для различных генофондов на основе количественной оценки надежности их составляющих. Разработанный подход позволяет не только классифицировать данные по степени надежности, но и отбирать для дальнейшего анализа данные с определенным уровнем надежности. Показано, что использование теории надежности позволяет получать наиболее достоверные результаты (коэффициент корреляции главных компонент без интерполяции (по исходным точкам) и с интерполяцией с учетом надежности г=0.9675).
5. Доказана высокая эффективность используемых подходов и применимость математического аппарата учета надежности при картографическом моделировании иерархически различных генофондов (Старого Света, Европы, Восточной Европы, Кавказа, Марий Эл, Мордовии, Адыгеи).
6. Продемонстрирована адекватность созданных подходов и методологии при картографическом моделировании признаков различной природы: генетических маркеров (классических и ДНК), квазигенетических маркеров, инбридинга, генов наследственных болезней, мультифакториальных болезней.
7. Создан математический аппарат и программное обеспечение для построения карт межпопуляционного разнообразия генофонда (Gst статистика Нея) с учетом надежности геногеографического прогноза. Разработанная методика впервые позволила соединить все три способа изучения генетической структуры популяции: а) частоты генов в популяции; б) генное разнообразие; в) селективную структуру с помощью картографического моделирования.
ЗАКЛЮЧЕНИЕ
В заключение остановимся на итогах и перспективах развития методов моделирования в популяционной генетике, которые прежде всего связаны с дальнейшими теоретическими обобщениями, выявлением и характеристиками соотношения формальных и эвристических компонент моделирования генетической структуры популяций на основе целенаправленного системного подхода. Основная тенденция в области моделирования в популяционной генетике это переход от его развития по эмпирическому пути на рельсы теоретического обоснования. Моделирование в геногеографии в настоящее время применяется как в составлении карт отдельных генетических признаков, так и в картоиспользовании, образуя единое ядро в пределах системы «создание - использование карт». Разработанные в этой работе методы оценки надежности карт, как на этапе их создания, так и на этапе их использования позволяют говорить о формировании единого методического аппарата, охватывающего оба крыла геногеографии. Одним из перспективных достоинств геногеографического моделирования можно считать его многовариантность. Возможность заложения в модели генетической структуры популяций разнообразных входных параметров позволяет вычленить существенные факторы популяционной динамики. Для создания геногеографических карт, наилучшим образом отражающих исследуемые стороны генетической структуры популяций, и в ближайшей перспективе, видимо, придется экспериментально подбирать картографо-статистические модели, искать их оптимальные варианты, отрабатывать рациональные пути имитационного моделирования. Разработанная в данном исследовании методика органически соединяет в геногеографическом моделировании все три способа изучения генетической структуры популяции: частоты генов, межпопуляционное разнообразие, селективную структуру генофонда.
Одна из тенденций может быть связана с привлечением информационно-технологических систем глобального доступа к популяционно-генетическим данным по всему Земному шару, с реализацией самой процедуры моделирования и отображением получаемых результатов с помощью геоинформационных технологии. Успех геногеографического моделирования определяется правильной постановкой задачи, обоснованным подбором исходного популяционно-генетического материала и правильного подбора соответствующих генетико-математических моделей.
Таким образом, все сказанное определяет фундаментальное значение данного исследования - неоспоримое премущество геногеографии в исследовании генетической структуры популяции.
Библиография Диссертация по биологии, доктора биологических наук, Нурбаев, Серик Долдашевич, Москва
1. Айала Ф., Кайгер Дж. Современная генетика. Т.З. М.: Мир, 1988. 336 с.
2. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: (Классификация и снижение размерности). М.: Финансы и статистика, 1989. 607 с.
3. Алгоритмы и программы восстановсления зависимостей. П/р В.Н. Вапника, М.: Наука, 1984 815 с.
4. Алтухов Ю.П. Внутривидовое генетическое разнообразие: мониторинг и принципы сохранения//Генетика. 1995. Т.31. № 10. С.1333-1357.
5. Алтухов Ю.П., Бланк М.Л. Компьютерное моделирование генетических процессов в структурированных популяциях // ДАН СССР. 1991. Т.219. № 6. С.1467-1472.
6. Алтухов Ю.П., Рычков Ю.Г. Популяционные системы и их структурные компоненты. Генетическая стабильность и изменчивость // Журн. общей биологии. 1970. Т.31. № 5. С.507-525.
7. Алтухов Ю.П., Салменкова Е.А., Омельченко В.Т. Популяционная генетика лососевых рыб. М.: Наука, 1997. 288 с.
8. Балановская Е.В., Нурбаев С.Д. Селективная структура генофонда. II. Стандартная технология определения через Fst -статистики // Генетика. 1998. Т.34. № 9. С.1307-1321
9. Балановская Е.В., Нурбаев С.Д. Селективная структура генофонда. III. Технология определения через Fst -статистики методом численного ресэмплинга // Генетика. 1998. Т.34. № 10. С.1434-1446
10. Балановская Е.В., Нурбаев С.Д. Селективная структура генофонда. IV. Технология определения через показатель интенсивности отбора Rs // Генетика. 1998. Т.34. № 11 С. 1559-1573
11. Балановская Е.В., Рычков Ю.Г. Этническая генетика: этногеографическое разнообразие генофонда народов мира // Генетика. Т.26. 1990. С.114-121.
12. Балановская Е.В.Новые технологии изучения пространственной структуры генофонда. Автореф. дис. . докт. биол. наук. М., 1998. 40 с.
13. Балановский О.П.,Кравчук О.И.,Нурбаев С.Д., МакаровС.В., Спицын
14. B.А.,Гинтер Е.К. "Синтетические" карты генофонда мари ( по данным об иммуно-биохимическом полиморфизме).//Генетика, 1999, Т.35. № 2.1. C.312-321
15. Батыгин Н.Ф. Устойчивость, гомеостаз и надежность растительных систем. В сб. Надежность биологических систем.Киев: Наук. Думка, 1985, с. 196-203.
16. Беили И . Математика в биологии и медицине. М.: Мир, 1970. 328 с.
17. Берлянт A.M. Картографический метод исследования. М.: Изд-во Моск. ун-та, 1978. 257 с.
18. Берлянт A.M. Образ пространства: карта и информация. М.: Мысль, 1986. 240 с.
19. Берлянт A.M., Жуков В.Т., Тикунов B.C. Математико-картографическое моделирование в системе "создание — использование карт'7/Географические исследования в Московском университете. М.: Изд-во Моск. ун-та, 1976. С. 235-243.
20. Берлянт A.M., Тикунов B.C. Тематические корреляционные карты и их значение для системного анализа//Вести. Моск. ун-та. Сер. Геогр. 1977. № 3. С. 10-16.
21. Бочков Н.П. Генетика человека. М.: Медицина, 1978, 382 с.
22. Бочков Н.П., Захаров В.Ф., Иванов В.И. Медицинская генетика.М.: Медицина, 1982,455 с.
23. Бусленко Н.П., Калашников В.В., Коваленко И.Н. Лекции по теории сложных систем. М.: Сов. радио, 1973. - 274 с.
24. Вавилов Н.И. Центры происхождения культурных растений // Происхождение и география культурных растений. Л.: Наука, 1987. С. 33126.
25. Вандер Вандер Б.Л. Математическая статистика. М.: Изд-во иностр лит. I960 434 с.
26. Вейр Б. Анализ генетических данных: дискретные генетические признаки. М.: Мир, 1995. 400 с.
27. Вентцель А.Д. Курс теории случайных процессов.М.: Наука, 1996. 399с.
28. Воронцов H.H. Теория эволюции: Истоки, постулаты и проблемы. М.: Знание, 1984. 64 с.
29. Гармиз И.В. Качество карт. Современные проблемы и методы. Л.: Изд. Ленинг. Унив., 1990, 212 с.
30. Гинзбург Э.Х., Полищук A.M. О сравнении долей в связи с некоторыми вопросами статистической обработки и планирования цитологических экспериментов//Цитология. 1975. Т. 17, №10 С. 1194—1199.
31. Гинтер Е.К. Популяционная география наследственных болезней // Теоретические проблемы медицинской генетики. М.: Медицина. 1979. С.143-158.
32. Гинтер Е.К. Этнические особенности распространения наследственных болезней//Генетика человека. Т.З. М.: ВИНИТИ, 1978. С.150-174.
33. Гинтер Е.К.,Ельчинова Г.И., Руденская Г.Е. и др. Наследственные болезни и генетическая структура населения республики Марий Эл. М.: Медицина, 1999 (в печати).
34. Глотов Н.В., Животовский Л.А. Хованов Н.В. и др. Биометрия. Л.: Изд-во ЛГУ, 1982.263 с.
35. Гнеденко Г.В. Математические методы в теории надежности. М., Наука, 1965, 524 с.
36. Гродзинский Д.М. Корогодин В.И., Кутлахмедов Ю.А. Принципы анализа надежности биологических систем. В кн.: Надежность клеток и тканей. Киев: Наук, думка, 1980, с. 19-25.
37. Гродзинский Д.М. Системы надежности растений и возможные пути их эволюционного становления. В кн. Проблемы эволюционной физиологии растений. Л.: Наука, 1974, с.22-26.
38. Дерябин В.Е. Биометрия для антропологов. М.:Изд. МГУ, 1987
39. Евсюков А.Н., Жукова О.В., Шереметьева В.А., Шнейдер Ю.В. Рычков Ю.Г. География эффективного размера сельского населения Северной Евразии: 1. Эффективный размер и интенсивность случайного дрейфа генов // Генетика. 1996а. Т.32. № 10. С.1396-1405.
40. Евсюков А.Н., Жукова О.В., Рычков Ю.Г. Оценка плотности популяций и ее значение в геногеографии// Генетика. 1999. Т.35. № 7. С.703-711.
41. Евсюков А.Н., Жукова О.В., Папков В.Е., Сигнеев В.И., Шеретьева В.А., Шнейдер Ю.В., Рычков Ю.Г. География генетических процессов в народонаселении. Генные миграции в Северной Евразии (европейский регион)//Генетика. 1997. Т.33.№ 11. С. 1539-1550.
42. Жестяников В.Д. Репарация ДНК как один из элементов надежности клетки. В сб. Надежность биологических систем.Киев: Наук. Думка, 1985, с.45-54.
43. Животовский Л.А. Интеграция полигенных систем в популяциях (проблемы анализа комплекса признаков). М.: Наука. 1984. 184 с.
44. Зорин A.B. Изучение надежности клеточных систем средствами имитационного моделирования. В сб. Надежность биологических систем.Киев: Наук. Думка, 1985, с.41-42.
45. Ивченко Г.И., Каштанов В.А., Коваленко И.Н. Теория массового обслуживания. М.: Высш.шк., 1962. - 256 с.
46. Измайлова Н.В. Картографическая информация и системы картографических знаков. Одесса: Изд-во Одес. ун-та, 1976. 104 с.
47. Кайданов JI.3. Генетика популяций. М.: Высш. школа, 1996. 320 с.
48. Кендалл М., Стьюарт А. Многомерный статистический анализ и временные ряды. М.: Наука, 1976. 736 с.
49. Коваленко И.Р. Исследования по анализу надежности сложных систем.-Киев: Наук, думка, 1975. 210 с.
50. Козлов А.И. Гиполактазия: распространенность, диагностика, врачебная тактика. М.: ИЛ «АрктАн-С», 1996. 70 с.
51. Кольтовер В.К., Андрианова З.С., Иванова А.Н.Моделирование кривых выживаемости и смертности популяциях человека на основе теории надежности.//Изв. РАН.Сер. биол.,1993,1,с.121-129
52. Корплюк B.C., Турбин А.Ф.Полумарковские процессы и их приложения.-Киев: Наук, думка, 1976. 182 с.
53. Кочубинский А.И. О применении математической теории надежности к анализу биологических систем. В сб. Надежность биологических систем.Киев: Наук. Думка, 1985, с. 17-25.
54. Кравчук О.И. Генофонд и геногеография мари (по данным об иммуно-биохимическом полиморфизме). Автореф. дис. . канд. биол.наук. М., 1997. 23 с.
55. Крамер Г. Математические методы статистики. М.: Мир, 1975. 420 с.
56. Крюков М.В. Эволюция этнического самосознания и проблема этногенеза //Расы и народы. М.: Наука, 1976. Вып.6. С. 42-63.
57. Кутлахмедов Ю.А. Исследований надежности растительного организма радиобиологическими методами. в кн.: Формы пострадиационного восстановления растений. Киев: Наук, думка, 1980, с. 116 -157.
58. Кутлахмедов Ю.А. Методы испытания надежности биологических систем. . В сб. Надежность биологических систем.Киев: Наук. Думка, 1985 с. 26 -33.
59. Кутлахмедов Ю.А. Применение теории надежности в радиобиологии многоклеточных систем. Там же , с.3-17.
60. Лакин Г.Ф. Биометрия. М.:Высш.школа, 1980. 293 с.
61. Левонтин Р. Генетические основы эволюции. М.: Мир, 1978. 352 с.
62. Ли Ч. Введение в популяционную генетику. М.: Мир, 1978. 526 с
63. Майр Э. Популяции, виды и эволюция. М: Мир, 1974. 460 с.
64. Максимов Г.Т. Изучение системы городских поселений БССР методами математической статистики.Минск, Наука и техника, 1972, 125 с.
65. Малютов М.Б., Пасеков В.П. О реконструкции родословных деревьев изолированных популяций. М.: Изд-во МГУ, 1971.52 с.
66. Медико-генетическое описание населения Адыгеи / Ред. Гинтер Е.К. Майкоп. 1997. С.225.
67. Микулич А.И. Геногеография сельского населения Белоруссии. Минск: Наука и техника, 1989. 181 с.
68. Моисеев H.H. Математика ставит эксперимент.М.: Наука, 1979.224 с.
69. Молоканов Г.Ф. Точность и надежность навигации летательных аппаратов. М.: Машиностроение, 1967.215 с.
70. Надежность клеток и тканей. Киев: Наук, думка, 1980. - 265 с.
71. Налимов В.В. Теория эксперимента. М.: Наука,1971,208 с.
72. Народы мира: историко-этнографический справочник /Ред. Ю.В.Бромлей. М.: Советская энциклопедия, 1988. 624 с.
73. Петрин А.Н., Перепелов A.B., Нурбаев С.Д., Балановская Е.В., Ситников В.Ф.,Руденская Г.Е. Наследственные болезни нервной системы в Мордовии.//Генетика, 1997,Т.ЗЗ., №6, С.836-843
74. Перепелов A.B. Эпидемиология и клинико-генетический анализ наследственных болезней нервной системы в популяциях Мордовии.Автреф. дисс. канд. мед. наук. М, 1997, 16 с.
75. Поликарпов Г.Г. Экологическое введение в проблему надежности самоочистной функции водной экосистемы. В сб. Надежность биологических систем.Киев: Наук. Думка, 1985, с. 172-179
76. Полюхов A.M. Парность, асимметрия и надежность функционирования мозга в онтогенезе. В сб. Надежность биологических систем.Киев: Наук. Думка, 1985, с. 169-170.
77. Почешхова Э.А. Генетико-демографический анализ подразделенной популяции адыгов. Автореф. дис.канд. мед. наук. М.,1998. 24 с.
78. Прокоп О., Гелер В. Группы крови человека. М.: Медицина, 1991. 512 с.
79. Пузырев В.П., Эрдыниева Л.С., Кучер А.Н., Назаренко Л.П.Генетико-эпидемиологическое исследование населения Тувы, Томск, СТТД999, 255с.
80. Райх Е.Л. Моделирование в медицинской географии.М.: Наука,1984. 158 с.
81. Райх Е.Л., Максимова Л.В. Медико-географическая территориальная дифференцация (на примере характерных эндемичных болезней).//Изв. АН СССР. Сер. Геогр. 1988. №6. С. 34-43.
82. Ратнер В.А. Математическая популяционная генетика.Новосибирск: Наука, 1977, 126 с.
83. Ревазов A.A., Парадеева Г.М., Русакова Г.И. Пригодность русских фамилий в качестве "квазигенетического" маркера // Генетика. 1986. Т. 22. №4. С. 699-703.
84. Рогинский Я.Я. Проблемы антропогенеза // М.: Высшаяшкола, 1969. 262 с.
85. ЮО.Рычков Ю.Г. Пространство и время в геногеографии // Вестник АМН СССР. 1984. №7. С. 11—15.i
86. Ю1.Рычков Ю.Г., Балановская Е.В. Этническая генетика: Соотношение адаптивной и нейтральной генетической дифференциации этносов // Генетика. 1990. Т. 26. № 3. С.541-549. Ю2.Рычков Ю.Г., Балановская Е.В. Генофонд и геногеография населения
87. Салищев К.А. Картоведение. M.: МГУ, 1990. 400 с.
88. Ю8.Свирежев Ю.М. Пасеков В.П. Основы математической генетики. М.: Наука. 1982.511 с.
89. Ю9.Северцов A.C. Основы теории эволюции. М: МГУ, 1987. 320 с.
90. ПО.Сербенюк С.Н., Кошель С.М, Мусин O.P. Методы моделирования геополей по данным в нерегулярно расположенных точках // Геодезия и картография. 1990. №11. С.31-35.
91. ГСербенюк С.Н., Кошель С.М., Мусин O.P. Программы МАГ для создания цифровых моделей геополей. // Геодезия и картография, 1991. N4. С.44-46.
92. Серебровский A.C. Генофонд и геногеография сельскохозяйственных животных СССР // Научное слово. 1928. № 9. С.3-22.1И.Серебровский A.C. Проблемы и метод геногеографии // Тр. 1 Съезда генет. и селекц. 1930. Т. 2. С. 71-86.
93. Спицын В.А. Биохимический полиморфизм человека (антропологические аспекты). М.: МГУ. 1985. 214 с.графирование//Геодезия, картография и аэрофотосъемка. Вып. 33. Львов: Вища школа, 1981. С. 104-110.
94. Пб.Тикунов B.C. Некоторые дискуссионные вопросы картографии/УГеография и природные ресурсы. 1987. № 2. С. 147-152.
95. Тикунов B.C. Способ оценки достоверности математико-картографического моделирования//Вестн. Моск. ун-та. Сер. Геогр. 1982. № 4. С. 42-48.
96. Тикунов B.C. Моделирование в картографии. М.: Изд. МГУ, 1997. 405 с
97. Тимофеев-Ресовский Н.В. Яблоков A.B. Глотов Н.В. Очерк учения о популяции М.: Наука, 1973. 277 с.
98. Труханов В.М. Надежность в технике.М.: Машиностроение,!999. 597 с.
99. Урбах В.Ю. Статистический анализ в биологических и медицинских исследованиях. М.: Медицина. 1975. 295 с.
100. Феллер В. Введение в теорию вероятностей и ее приложения. 2-е изд. М.: Мир, 1964. 498 с.
101. Фельдман Е.С. Медико-географическое исследование территории Молдавии.Кишинев: Штиинца, 1977. 169 с.
102. Харрис Г. Основы биохимической генетики человека. М: Мир. 1973 294 с
103. Хьюбер П. Рооастность в статистике М : Мир, 1984.304 с.генетических структур. В сб. Надежность биологических систем.Киев: Наук. Думка, 1985, с.65-66. 127.Четвериков С.С. Проблемы общей биологии и генетики. Новосибирск: Наука, 1983.
104. Шереметьева В.А., Рычков Ю.Г. Популяционная генетика народов Северо-Восточной Азии. М.: МГУ, 1978. 151 с.
105. Шмальгаузен И.И. Пути и закономерности эволюционного процесса. Избранные труды. М.: Наука, 1983. 360 с.
106. Яблоков А.В. Популяционная биология. М.: Высш. школа, 1987. 303 с.
107. Barbujani G. Autocorrelation of gene frequencies under isolation by distanse // Genetics. 1987a. V. 117. P.777-782.
108. Barbujani G. Diversity of some gene frequencies in European and Asian populations. III. Spatial conelogiam analysis // Ann. Hum. Genet. 1987b. V.51. P.345-353.
109. Barbujani G. Diversity of some gene frequencies in European and Asian populations. IV. Genetics population structure assessed by variogram // Ann. Hum. Genet. 1988. V.52. P.215-225.
110. Barbujani G. What do languages tell us about human microevolution? // Trends Ecol. Evol. 1991. V.39. P. 151-156.
111. Barbujani G., Oden N.L.,Sokal R.R. Detecting areas of abrupt change in maps of biological variables // Systemat. zool. 1989. V.38. N.4. P. 376-389.
112. Barbujani G., Sokal R.R. Genetic population structure of Italy. II. Physical and cultural barriers to gene flow // Araer. journal of human genetics. 1991. V.48. N.2. 398-411.
113. Barbujani G., Sokal R.R. The zones sharp genetic change in Europe are also language boundaries // Proc. Natur. Acad. Science USA. 1990. V.87. N.5. P.1816-1819.
114. Bayless T.M., Christopher N.L., Boyer S.H. Autosomal recessive inheritance of intestinal lactase deficiency: evidence from ethnic differences // J. Clin. Invest. 1969. V.48. P.6a.
115. Bertranpetit J., Cavalli-Sforza L.L. A genetic reconstruction of the history of the population of the Uberian peninsula // Ann. Hum. Genet. 1991. V.55. P.51-67.
116. Bodmer W.F., Cavalli-Sforza L.L. A migration matrix model for the study of random genetic drift // Genetics. 1968. V.59. P.565-592.
117. Bodmer W.F., Cavalli-Sforza L.L. Genetics, Evolution and Man. San Francisco: W.H.Freeman a C. 1976.
118. Bo\vcock A.M., Kidd J.R., Mountain J.L., Hebert J.M., Carotenuto L., Kidd K.K.,Cavalli-Sforza L.L. Drift, admixture, and selection in human evolution: A study with DNA polymorphisms // Proc. Natl. Acad. Sei. USA. 1991. V. 88. P. 839-843.
119. Bowcock A.M., Kidd J.R., Mountain J.L., Hebert J.M., Carotenuto L., Kidd K.K.,Cavalli-Sforza L.L. Study of an additional 58 DNA markers in five populations from four continents // Gene Geogr. 1992. V. 5. P. 151-173.
120. Brown A.H.D. Feldman M.W., Nero E. Mullilocus structure of natural populations of Hordeum sportaneum // Genetics. 1980. Vol. 96, №2. P. 523-536.
121. Brown A.H.D. Weir B.S., Marshall D.R. Optimum family size for the estimation of heterozygosity in plant populations // Heredity. 1970. Vol. 25, №2. P. 233—239.
122. Cann R.L., Brown W.M., Wilson A.C. Polymorphic sites and the mechanism of evolution in human mitichondrial DNA//Genetics. 1983. V. 106. P.479-499.
123. Casagrande J.T., Pike M.C., Smith P.O. An improved approximate formula for calculating sample size for comparing two binominal distributions // Biometrics. 1978. Vol. 34, №3. P. 483-486.
124. Casanova M., Leroy P., Boucekkine C. et al, A human Y-linked DNA polymorphisms and its potential for estimating genetic and evolutionary distance //Science (Wash., D.C.). 1985. V.230. P. 1403-1406.
125. Cavalli-Sforia L.L. Population structure and human evolution // Proc. Roy. Soc. London B. 1966. Vol. 164. P. 362-379.
126. Cava11i-Sforza L.L., Bodmer W.F. The Genetics of Human Population. San Francisco: W.H.Freeman a C°. 1971. 965 p.
127. Caval.i-Sforza L.L., Edwards A.W.F. Phylogenetics analysis: Models and estimation procedures // Am. J. Human Genet. 1967a. V.19. P.223-257.
128. Cavalli-Sforza L.L., Edwards A.W.F. Phylogenetic analysis models and estimation procedures // Evolution. 1967b. V.21. P.550-570.
129. Cavalli-Sforza L.L., Kidd J.R., Kidd K.K., Bucci C., Bowcock A.M., Hewlett B.S., Friedlaender J.S. DNA markers and genetic variatuion in human species // Cold Spring Harbor Symp. Quant. Biol. 1987. V.51. P.411-417.
130. Cava!li-Sforza L.L., Menozzi P., Piazza A. History and Geography of Human Genes. Princeton: Princeton University Press. 1995. 1066 p.
131. Cavalli-Sforza L.L., Piazza A. Human genomic diversity in Europe: A summary of recent research and prospects for the future // Europe Journal of Human Genetics. 1993. V. 1. P. 3-18.
132. Chacraborty R., Fuerst P.A., Nei M. Statistical studies on protein polymorfhism in natural populations. II. Gene differentiation between populations // Genetics. 1978. V.88. P.367-390.
133. Makiritare to the Yanomama Indians // Am. J. Phys. Anthropol. 1970. V.32. N.3. P.339-349.
134. Chakraborty R. A note on Nei's measure of gene diversity in a substnictured population//Humangenetik. 1974. Vol. 21. P. 85-88.
135. Chakraborty R., Haag M. Ryman'N., Stahl. Hierarchical gene diversity analysis and its application to brown trout population data // Hereditas. 1982. Vol. 97. P. 17-21.
136. Cliakraborty R., Roychoudhury A.K. Is the a pattern of gene differentiation in the Indian populations? Hum. Genet. 1978. V.43. P.321-328.
137. Cliff A.D., Ord J.K. Spatial Processes: Models and Applications. London: Pion, 1981.
138. Comuzzie A:G. Crawford M.H. Biochemical heterozygosity and morphologycal variability: interpopulational versus intrapopulational analyses//Him. Biol. 1990. V.62. N 1. P.101-112.
139. Constandse-Westermann T. Coefficients of biological distance N.Y.: Human, press, 1972. 142p.
140. Crow J.F., Kimura M. An Introduction to Population Genetics Theory. New-Jork: Harper and Row. 1970. 592 p.
141. Crow J.F. Mange A.P. Measerement of inbreeding from frequency of marriges between person of the same surname // Eug. Quart., 1965. V.12, P. 199-203.
142. Devoto M., Romeo J., Seire J.L. et al. Gradient of distribution in Europe of he world CF mutation and its associated haplotypes // Hum. Genet. 1990. V.85. P.43 6-441.
143. Dobzhansky Th. Genetics of the Evolunary Process. N.Y.: Columbia Univ.1. Press. 1970. 505 p.
144. Ed\vards A. Distances between populations on the basis of gene frequencies // Biometrics. 1971. Vol. 27, №4. P. 873-881.
145. Edwards A.W.E., Cavalli-Sforza L.L. Affinity as revealed by differences in gene frequencies // The assessment of population affinities in man/Eds J.S. Werner, J. Huizinga. Oxford: Clarendon Press, 1972. P.37—47.
146. Ed\vards A.W.F., Cavalli-Sforza L.L. Reconstruction of evolutionary trees // Phenetic and Phylogenetic Classification / Heywood V.E., McNeill J. London: The Systematics Association, 1964. P.67-76.
147. Efron B. The Jackknife, Bootstrap, and Other Resampling Plans. Philadelphia: Society for Industrial and Applied Mathematics, 1982.
148. Emigh T.A. A comparison of tests for Hardy—Weinberg equilibrium // Ibid. 1980. Vol. 36, №4. P. 627-642.
149. E\vens W.J., Feldman M.W. The theoretical assesment of selective neutrality // Population Genetics and Ecology / Eds S.Karlin, E.Nevo. N.Y.: Academic Press, 1976. P. 303-337.
150. Excoffier L. Evolution of human mitochondrial DNA: evidence for departures from a pure neutral model of populations at equilibrium // J. Mol. Evol. 1990. V.30. P. 125-139.
151. Farris J.S. Estimating phylogenetic trees from distance matrices // Am. Natur. 1972. V.106. P. 645-668.
152. Felsenstein J. Maximum-likelihood estimation of evolutionary trees from continuous characters // Am. J. Hum. Genet. 1973. V.25. P.471-492.
153. Fisher R.A. The Genetical Theory of Natural Selection. N-Y: Dover. 1930.181 .Fitch W.M. Margoliash M. Construction of evolutionary trees // Science (Wash., D.C.). 1967. V.155. P.279-284.
154. Flatz G. Genetics of lactose digestion in humans // Advances in human genetics /H.Harris, K.Hirschorn. New York, 1987, V.16, P. 1—77.
155. Fuerst P.A., Chacraborty R., Nei M. Statistical studies on protein polymorfhism in natural populations. I. Distribution of single locus heterozygosity // Genetics. 1977. V.86. P.455-483.
156. GI egg M.T., A Hard R.W., Kahler A.L. Is the gene the unit of selection? Evidence from two experimental plant populations // Proc. Nat. Acad. Sci. USA. 1972. Vol. 69. P. 2474-2477.
157. Graham J.B., I stock C.A. Gene exchange and natural selection cause Bacillus subiilis io evolve in soil culture // Science. 1979. Vol. 204. P. 637-639.
158. Gregorius H.R. The probability of losing an allele when diploid genotypes are sampled Ibid. 1980. Vol. 36, № 4. P. 643-652.
159. Hardihg R.H. Modem European cranial variables and blood polymorphisms chow comparable spatial patterns // Human biology .1990. N.6. P733-746.
160. Hastings A. Disequilibrium, selection, and recombination: limits in two-locus, two-all ele models // Genetics. 1981. Vol. 98, № 3. P. 659-668.
161. Hecirick P.W. A new approach to measuring genetic similarity // Evolution. 1971. Vol. 25, .N»2. P. 276-280.
162. Hernandez C.A.: O'Brien-Pallas L.L. Validity and reliability of nursing workload measurement systems: review of validity and reliability theory.//Can-J-Nurs-Adm. 19%, 3. P.32-50
163. Jakubiczka S. Arnemann J., Cooke H.J., Krawczak M., Schmidtke. A search for restriction fragment lenght polimorphism on the human Y chromosome // Hum. Genet. 1989. V. 84. P. 86-88.
164. Johnson G.B. Evidence that enzyme polymorphisms are not selectively neutral //Nature. New Biol. 1972 . V. 237. P.170-171.
165. Johnson M.J.I Wallace D.C., Ferris S.D., Ratazzi M.C., Cavalli-Sforza L.L. Radiation of human mitochondrial DNA types analysed by restriction endonuclease cleavage patterns // J. Mol. Evol. 1983. V. 19. P.255-271.
166. Jorde L.B. Human genetic distance studies: present status and future prospects //Annu. Rex . Anthropol. 1985. V. 14. P. 343-373.
167. Jorde L.B. T he genetic structure of subdivided human populations: a review // Current Development in Anthropological genetics. V. 1. Theory and Methods / Eds J.H.Miekle, M.H.Crawford. N. Y.; L.: Plenum Press. 1981. P. 135-208.
168. Knr!in S. Richter-Dyn N. Some theoretical analyses of migration-selection interaction in a cline: a generalised two range Enviroment // Population Genetics and Ecology / Ed. S.Karlin, E.Nevo. N-Y: Acad. Press, 1976. P. 659-706.
169. Kidd K.K., Cavalli-Sforza L.L. The role of genetic drift in the differentiation of Icelandic and Norwegian cattle // Evolution. 1974. V. 28. 1 3. P. 381-395.
170. Kimura M. "Stepping stone'' model of population // Annu. Rep. Nat. Inst. Genet. Mishima, Japan. 1953. V.3. P.63-65.
171. Kimuia M., Crow J.E. The measurement of effective population number // Evolution. 1963. V. 17. 279-288.
172. Kimura M., Weiss G.H. The stepping-stone model of population structure and the decrease of genetic correlation with distance // Genetics. 1964. V. 49. P.561-576.
173. Koiiigsberg L.W. Analysis of prehistoric biological variation under model of isolation by geographic and temporal distance // Human Biol. 1990. V.62. N.l.1. P. 49-^0.
174. Kosten M., Mitchell R.J. Examining population structure through the use of surname matrices: methodology for visualizingnonrandom mating// Human Biol. 1990. V.62. N.3. P.319-335.
175. Li.li.uiel J.M Topology of population structure // Genetic Structure of populations / Morton N.E. ed. Honolulu: University of Hawaii Press. 1973. P.139-149.
176. Lathrop G.M. Evolutionary trees and admixture: phylogenetic inferences when some populations are hybridized // Ann. Hum. Genet. 1982. V.46. P.245-255.
177. Latter B.D.H. Genetic differences within and between populations of the major human subgroups' 7 Amer. Natur. 1980. V. 116. N. 2. P. 220-239.
178. Le\vontm R.C. The apportionment of human diversity // Evolutionary Biology / Dobzhansky T.H. Hecht M.K., Steere W.C. eds. New Iork: Appleton-Century-Crofls. 1972. V.6. P.381-398.
179. Lcwoniin R.O. Krakauer J. Distibution of gene frequency as a test of the theory of the selective neutrality of polymorphisms // Genetics. 1973. V. 74. P. 175-195.
180. Lc\\onlin R.C. Krakauer.!. Testing the heterogeneity of F values //Genetics. 1975. V. 80. P. 397-398.
181. Li W.-H. Simple method for constructing phylogenelic trees from distance matrices Proc Mat. Acad. Sci. USA. 1981. Vol. 78, № 2. P. 1085-1089.
182. Li W.-H. Nci J\I. Stable linkage diseguilibrium without epistasis in subdivided populations !! Theor. Pop. Biol. 1974. Vol. 6, N 2. P. 173-183.
183. MacCT.ier J.W; Monte Carlo simulation: the effects of migration on some measures of none"ic distance // Genetic Distance /Eds J.R.Crow, C.Denniston. N.v Pitnum 1974. P. 77-95.2S7
184. Maiumder P.P., Chakraborty R. Mean and variance of the samples showing hetem-zygote excess or deficiency // Heredity. 1981. Vol. 47, № 2. P. 259-262.
185. Makela MIL Richardson RJ/. The detection of sympatric sibling species using genetic correctio-i analysis. 1. Two loci, two gametodemes //Genetics. 1977. Vol. 86. JV» 3. P. 665-678.
186. MaIecot G. The Mathematics of Heredity. San Francisco: Freeman, Cooper, 1969.
187. Man!y B.FJ. The statistics of natural selection. L.; N.Y.: Chapman and Hall, 1985. 4S4 p.
188. Menoz/i P. Piazza A., Cavalli-Sforza L.L. Synthetic maps of human gene frequencies in Europe // Science. 1978. V. 201. P. 786-792.
189. Michoiid D. Les problems poses par 1'incompatibility Rh fcetomaternalle.1.on. ! •)••> I.
190. Mi!lcr A.R. revolutionary reliability theory.//Basic-Life-Sci. 1987; 42,P.187-192
191. MncI; E. Estimating reliability of phylogenetic trees: bootstrapping and the lattice representation // Unpubl. 1992.227 .Mill vi J.B. r,;e;ve B. A. The distribution of individual heterozygosity in natural
192. Moitis R.W., Spieth P.T. Sampling strategies for using female gametophytes to astinuUc heterozy gosity in conifers // Theor. and Appl. Genet. 1978. Vol. 51, N 5.1. P. 2 I 7-222.
193. Mor.nl;.in J .I . Lin A. A., Bow cock A.M., Cavalli-Sforza L.L. Evolution of modern humans: evidence from nuclear DNA polymorphism // Phil. Trans. R. Soc. Loud. B. 1992. V.337. P. 159-165.
194. Mom aid. A.E., Kopec A.C., Domaniewska-Sobclak K. The distribution of the human blood groups and other polymorhisms. L.: Oxford Univ. press, 2nd ed., 1976. I 056 p.
195. Muona O.A. Amultilocus study of an experimental barley population // Here m los: Vol. 96. N 2. P. 247-254.
196. Nee! M'. ucl R.H. Genetic structure of a tribal population, the Yanomama Inch VI. .\-.?'"sis by F-statistics. including a comparison with Makiritare and Xa\ante Gereti :s. 1972. V. 72. P. 639-666.
197. Kee! ' v . V. a • i R.H. Village and tribal genetic distances among American Inde :> i.nd the possible implications for human evolution // Proc. Natl. Acad. Sci. !<)"(!. Y.6.\ .323-330.
198. Nei M. Variation and correlation of gene frequencies in subdivided populations //Evolution. I%5. V. 19. P. 256-258.
199. No M. Gerv.-ie distance between populations // Amer. Natur. 1972. Vol. 106, N. 9-19. P. 283-29:.
200. Ne; V. Genet , polimorphism and neomutationism // Lecture notes in biomathematie;: ~d. S. Levvin. V. 53 // Evolutionary dynamics of genetic divei-iiv be!. 0 S. Manav. Berlin. Heidelberg, New York, Tokyo: Springer-Ve-i: e. 1984. ' 1 14-241.
201. Nei M. M( 'eerlar population genetics and evolution// Amsterdam: North-Holland ¡'abU'. ; lK) p.
202. No f\i Foe o: of genetic distance and evolution of human races // Jpn. J. Hum t .e-e:. V.23. P.341-369.
203. Ke CIi; ;via arti A. Drift variances of Fsiand Gst statistics obtained from a fa: i ¡¡ni-r : popu'ations // Theor. Popul. Biol. 1977. V. 11. P. 307- ::
204. Ne; \Roych. .idlury A.K. Genetic relationship and evolution ofhuman races //E\ Biol. ion. V. ¡4. P. i-59.
205. Pan!son H. .Vi approximate normalization of the analysis of variance distnomi mi am. Math Statist. ! 942. Vol. 13. P. 233-235.
206. Pa> ne r.w Kiiiabiht . theory and clinical psychology.//J-Clin-Psychol. 1989, . 2,P.35I-3 52
207. Pc ji : !•". :» :4;.\! M. Stochastic comparison of processes generated by rand'm i-itermpuons of monotone functions and related results. //Lifetime-Data-An.il : .'1-1 12
208. Pic://a A . ' A '■)/'/'. P. Geographic variation in human gene frequencies //
209. Nun :; ! ' Tn.i;. Proceedings of a NATO Advanced Study Institute / J.
210. Felsc isiun a. !$.nin: Springer. 1983. P.444-450.
211. Piazza A., Menozzi P., Cavalli-Sforza L.L. The making and testing of geographic gene frequency maps //Biometrics. 1981b. V. 37. P. 635-659.
212. Piazza A., Rendine S., Zei G., Moroni A., Cavalli-Sforza L.L. Migration rates of human populations from surname distributions //Nature (Lond.). 1987. V.329 1 6141. P.714-716.
213. Poloni E.S., Excoffier L., Mountain J.L., Langaney A., Cavalli-Sforza L.L. Nuclear DNA polymorphisms in Mandenka population from Senegal-Comparison with eiqht other human populatuons //Ann. Human Genet. 1995. V.59. P.43-61.
214. Post R.H., Neel J.V.,Schull W.J. Tabulations of phenotype and gene frequencies for 11 different genetic systems studied in the American Indians // Pan. Fv. Health Organ. Sci. Publ. 1968. V.165. P.141-185.
215. Prentioa K.b. Diserlininatiou among some paraaetiric modi Biometrio, 1975, 62,11 5, P. 607-614.
216. Rendine S., Piazza A., Cavalli-Sforza L.L. Simulation and separation by principal components of multiple demic expansions in Europe // Am. Nat. 1986. V.128. 1 5. P.681-706.
217. Rendine S.,Piazza A.,Menozzi P.,Cavalli-Sforza L.L. A problem with synthetic maps: reply to Sokal et al.//Human Biol.,1999,v.71,№2, P. 15-25
218. Rogers A.R., Jorde L.B. Genetics evidence on modern human population // Human Biology. 1995. V.67. P.l-36.
219. Rogers J.S. Measures of genetic similarity and genetic distance // Stud, in Genet. Univ. Tex. Publ. 1972. Vol. 7213. P. 145-153.
220. Rosenberg M.S.,Sokal R.R.,Oden N.L., DiGiovanni D. Spatial autocorrelation of cancer in Western Europe//Eur. J. Epidemiol., v. 15, №1,1999.,P. 15-22.
221. Roychoudhury A.K. Gene differentiation among caste and linguistic populations of India // Hum. Hered. 1974. V.24. P.317-322.
222. Sahi T. Genetics and epidemiology of adult-type hypolactasia // Scand.J.Gastroenterol. 1994. V.29. P.202.
223. Sahi T., Isokoski J., Jussila J., Launiana K., PyoralaK. Recessive inheritance of adult-type lactose malabsorption // Lancet. 1973. V.2. P.823—826.
224. Sanghvi L.D. Comparison of genetic and morphological methods for a study of biological differences //Amer. J. Phys. Anthrop. 1953. Vol. 11, N. 2. P. 385-404.
225. Sokal R.R. Testing statistical significance of geofraphic variation patterns // Systemat. zool. V.28. 1979b. 227-231.
226. Sokal R.R., Oden N.L., Wilson C. Genetic evidence for the spread of agriculture in Europe by demie diffusion // Nature. 1991. V.351. P. 143-144.
227. Sokal R.R., Harding R.M., Oden N.L. Spatial patterns of human gene frequencies in Europe // Am. J. Phys. Antropol. 1989. V. 80. P.267-294.
228. Sokal R.R., Menozzi P. Spatial autocorrelation of HLA freguencies in Europe support demie diffusion of early farmers //Amer. Natur. 1982. V.l 19. P.l-17.
229. Sokal R.R., Oden N.L. Spatial autocorrelation in biology. I. Methodology // Biol. joum. Linnean Soc. 1978. V.10. P. 199-228.
230. Sokal R.R., Oden N.L.,'Thomson B.A. A problem with synthetic maps.//Human Biology., V.71., №2, 1999a., P.l-15.
231. Sokal R.R., Oden N.L.,Thomson B.A. Problems with synthetic maps remain: reply to Rendine et al.//Human Biology., v.71., №4, 1999b., P.447-453.
232. Sokal R.R., RohlfF.J. Biometry. San Francisco: Freeman, 1981.857 p.
233. SokaI R.R., Wartenburg D.E. A test of spatial autocorrelation analysis using an isolation-by-distance model // Genetics. 1983. V.105. P.219-237.
234. Suzuki D.T., Griffiths AJ.F., Lewontin R.C. Miller J.H. An introduction to genetic analysis. N.Y.: Freeman, 1986. 612 p.
235. Taylor ChE., Milton J£. Multivariale analysis of genetic variation // Genetics. 1974. VoL 76. № 3. P. 575-586.
236. Wallace DC., Garrison K., Knowler W.C. Dramatic founder effects in Amerindian mitochondrial DNAs // Am. J. Phys. Anthropol. 1985. V.68. P. 149155.
237. Ward R.H., Neel J.V. The genetics of a tribal population, the Yanomama indians. XIV. Clines and their interpretation // Genetics. 1976. V. 82. t. 103— 121.
238. Watterson G.A. The homozygosity test after a change in population size // Genetics. 1986. V.112. P. 899-907.
239. Watterson G.A. The homozygosity test of neutrality // Genetics. 1978. V. 88. P. 405-417.
240. Weir B.S., Cockerman C.C. Estimating F-statistics for the analysis of population structure//Evolution. 1984. V.38. P.1358-1370.
241. Whitiam Th.S., Ochman H., Selander R.W. Mullilocus genetic structure in natural populations of Escherichia coli // Proc. Nat. Acad. Sci. USA. 1983. Vol. 80. P. 1751-1755.
242. Witten M. A return to time, cells, systems and aging: II. Relational and reliability theoretic approaches to the study of senescence in living systems.//Mech-Ageing-Dev. 1984, 3, P.323-340
243. Womble W.H. Differential systematics//Science (Wash., D.C.). 1951. V.114. P.315-322.
244. Wood J.W. Population structure and genetic heterogeneity in the Upper Markham Valley of New Guinea I I Am. J. Phys. Anthropol. 1978. V. 48. P. 463470.
245. Workman P.L., Niswander J.D. Population studies on Southwestern Indian tribes. II. Local genetic differentiation in the Papago // Am. J. Hum. Genet. 1970. V. 22. P. 24-49.
246. Wright S. Breeding structure of population in relation to speciation // Amer. Naturalist. 1940. V. 74. P. 232-248.
247. Wright S. Evolution in Mendelian populations // Genetics. 1931. V.16. P.97-159.
248. Wright S. Isolation by distance // Genetics. 1943. V.28. P.l 14-138.
249. Wright S. Size of population and breeding structure in relation to evolution // Science. 1938. V. 87. P. 430-431.
250. Wright S. Statistical genetics in relation to evolution // Exposes de biométrie et de statistique biologique / Ed.: G.Teissier. Paris: Hermann. 1939. P. 1-64.
251. Wright S. The genetical structure of populations // Ann. Eugen. 1951. V. 15. P. 323-354.
252. Wright S. Random drift and the shifting balance theory of evolution // Mathematical Topics of Population Genetics/Ed. K.Kojima. Berlin: SpringerVerlag. 1970. P.8-31.
- Нурбаев, Серик Долдашевич
- доктора биологических наук
- Москва, 1999
- ВАК 03.00.15
- Геногеографическое изучение полиморфных маркеров ДНК в популяциях восточно-европейских народов
- Генетико-демографические процессы в сельских популяциях Казахстана и их генетическая дифференциация по митохондриальной ДНК
- Новые технологии изучения пространственной структуры генофонда
- Изучение структуры генофонда населения Центральной России
- Видообразование и систематика грызунов (Rodentia: Sciuridae, Cricefidae, Muridae) по данным аллозимного анализа