Бесплатный автореферат и диссертация по биологии на тему
Разработка методов картирования генов на основе родословных сложной структуры
ВАК РФ 03.02.07, Генетика

Автореферат диссертации по теме "Разработка методов картирования генов на основе родословных сложной структуры"

На правах рукописи

0034Э4ЬЬи

БЕЛОНОГОВА НАДЕЖДА МИХАЙЛОВНА

РАЗРАБОТКА МЕТОДОВ КАРТИРОВАНИЯ ГЕНОВ НА ОСНОВЕ РОДОСЛОВНЫХ СЛОЖНОЙ СТРУКТУРЫ

03.02.07 - Генетика

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата биологических наук

Новосибирск 2010

2 5 Ж 2010

003494560

Работа выполнена в лаборатории рекомбинационного и сегрегационного анализа Учреждения Российской академии наук Институт цитологии и генетики Сибирского отделения РАН, г. Новосибирск и на кафедре цитологии и генетики Новосибирского государственного университета

Научный руководитель: доктор биологических наук, профессор

Аксенович Т. И.

Институт цитологии и генетики СО РАН. г. Новосибирск

Официальные оппоненты: доктор биологических наук, профессор

Маркель А. Л.

Институт цитологии и генетики СО РАН. г. Новосибирск

доктор биологических наук Бажан С. И.

ГНЦ ВБ «Вектор». Кольцово

Ведущее учреждение: НИИ медицинской генетики

ТНЦ СО РАМН. г. Томск

Зашита диссертации состоится « т/ 2010 г. на утреннем заседании дис-

сертационного совета Д 003.011.01 в Институте цитологии и генетики СО РАН в конференц-зале Института по адресу: 630090, г. Новосибирск, пр. Лаврентьева, д. 10. тел/факс: ("383)3331278. e-mail: dissov@bionet.nsc.ru

С диссертацией можно ознакомиться в библиотеке Института цитологии и генетики СО РАН.

Автореферат разослан » 2010 г.

Ученый секретарь Д /

диссертационного совета, \/ \дд/1

доктор биологических наук "ЛАК \) Хлебодарова Т.М.

I. ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы

Картирование генетических локусов, контролирующих различные признаки человека и животных, является важной и актуальной проблемой современной генетики. За последние годы были успешно секвенированы геномы многих видов, и все же функции большинства генов и фенотипическое проявление их аллельных вариантов во многом остаются неизвестными. Успешное картирование генов позволяет глубже понять механизмы развития многих распространенных заболеваний, разработать эффективные профилактические и терапевтические меры и методы ранней диагностики.

За последние десятилетия генетика значительно продвинулась в этом направлении. С помощью рекомбинационного анализа были картированы многие локусы, в том числе участвующие в контроле таких широко распространенных заболеваний как диабет, болезнь Альцгеймера, некоторые формы рака (Risch, 2000; Gulcher et al., 2001; Botstein and Risch, 2003). Главным образом были картированы гены большого эффекта, оказывающие сильное влияние на фенотип, поскольку такие гены проще всего обнаружить. Однако, основная часть наследуемых признаков формируется при совместном участии большого числа генов, каждый из которых в отдельности оказывает незначительный эффект (Lohmucllcr et al., 2003; Hirschhorn and Daly, 2005; Collins, 2007). Поиск аллелей малого эффекта - важная задача генетической эпидемиологии, поскольку предполагается, что такие аллели играют существенную роль в развитии многих распространенных болезней, в том числе, гипертонии, сахарного диабета, ишемической болезни сердца, нейродегенеративных заболеваний и многих форм рака (Hirschhorn and Daly, 2005; Mayeux, 2005).

Между тем, картирование генов со слабо выраженным эффектом сопряжено с рядом трудностей. Чтобы достичь необходимой мощности статистических тестов, нужны большие выборки, включающие десятки и сотни тысяч людей. В результате формируются большие массивы данных, обработка которых создает вычислительные проблемы. Многие существующие пакеты программ не в состоянии работать с выборками такого размера. В настоящее время не существует статистических методов, достаточно полно учитывающих специфику комплексных болезней и обладающих достаточно высокой мощностью для того, чтобы надежно картировать генетические локусы сложных признаков.

В качестве объекта для исследований такого рода особый интерес представляют изолированные популяции человека. Известно, что в таких популяциях редкие ал-лельные варианты встречаются с относительно высокой частотой, что увеличивает шансы успешно картировать их позицию в геноме (Terwilliger et al., 1998; PcHoncn, 2000; Peltonen et al., 2000; Chapman and Thompson, 2001; Rannala, 2001). В последние годы в нескольких странах Европы были собраны большие родословные и сформированы большие массивы данных по изолированным популяциям человека (см., например, Aulchenko et al., 2004). Однако анализировать данные такого объема практически невозможно с применением существующих методов. Исследователи вынуждены дробить родословные на фрагменты и анализировать их по отдельности, теряя при этом генетическую информацию. Прогресс в данной области существенно зависит от разработки новых эффективных аналитических методов, которые позволили бы извлечь максимум полезной информации из доступного материала.

Цели и задачи исследования

Целью исследования является разработка новых, эффективных методов статистического анализа, позволяющих картировать гены комплексных признаков человека. Для достижения цели были поставлены следующие задачи:

1. Разработать новые методы и алгоритмы анализа, повышающие эффективность картирования локусов комплексных признаков на материале больших родословных, включающие:

a. алгоритм оптимизации подсчета функции правдоподобия на материале большой родословной;

b. метод полногеномного анализа ассоциаций, учитывающий эффект родительского (материнского/отцовского) происхождения аллелей, на больших родословных.

2. С помощью существующих и новых методов картирования провести анализ некоторых комплексных признаков человека: роста и индекса массы тела.

Научная новизна

Разработан ряд новых методов и алгоритмов, позволяющих оптимизировать процесс поиска генов комплексных признаков на родословных сложной структуры:

♦ разработан и реализован в виде компьютерной программы алгоритм оптимизации подсчета функции правдоподобия большой родословной; на ряде примеров показано, что он ускоряет вычислительные процедуры в 1.8-3.2 раза;

♦ описана модель генетического контроля количественного признака, включающая эффект родительского (материнского/отцовского) происхождения аллелей, и на ее базе создан метод картирования генов, позволяющий быстро производить полногеномный анализ с использованием большого числа генетических маркеров; показано, что разработанный метод обладает большей мощностью, чем существующие аналоги.

С использованием существующих и новых методов картирования проведен анализ комплексных признаков человека: р'оста и индекса массы тела. Обнаружены новые районы локализации генов, контролирующих эти признаки. Впервые показана ассоциация анализируемых признаков с рядом локусов, обладающих эффектом родительского происхождения аллелей.

Теоретическая и практическая ценность

В рамках подхода генетического картирования предложены новые алгоритмы и модели, их свойства проверены в модельном эксперименте и на реальных данных.

Впервые полногеномный анализ ассоциаций произведен с учетом эффекта родительского происхождения аллелей. В результате анализа комплексных признаков человека найдены новые генетические варианты, в том числе показана ассоциация индекса массы тела с генами молекул клеточной адгезии ЬОС338667/СООК, N№N1, СЫШАР5 и СА'ТМЗ, влияющими на развитие и функционирование нервной системы. Результаты анализа подтверждают существующие представления о механизмах генетического контроля роста и индекса массы тела человека и роли регуляторных генов в определении разнообразия по данным признакам. В перспективе, полученные результаты будут способствовать прогрессу в области диагностики генетической предрасположенности к ожирению, диабету, раку, когнитивным расстройствам и другим распространенным заболеваниям.

Личный вклад автора

Разработка алгоритмов и методов генетического анализа, реализация их в виде компьютерных программ, а также весь статистический анализ выполнены автором самостоятельно. Материал (родословная, значения признаков и генотипов большого числа маркеров) был собран и любезно предоставлен сотрудниками Медицинского центра Эразмус (Роттердам) в рамках совместного исследования РФФИ-NWO.

Апробация работы

Результаты работы докладывались на Европейской Конференции по Генетике Человека (Ницца, 2007) и на Съезде Вавиловского Общества Генетики и Селекции (Москва, 2009).

Структура и объем работы

Работа состоит из 5 глав, введения, заключения и выводов, содержит 9 рисунков, 14 таблиц и приложение. Объем работы - 122 страницы.

Публикации

По теме диссертации опубликовано 9 работ, в том числе статьи в журналах "Computational Biology and Chemistry", "Human Genetics", "European Journal of Human Genetics", "Annals of Human Genetics".

И. ОСНОВНОЕ СОДЕРЖАНИЕ ИССЛЕДОВАНИЯ

Оптимизация подсчета функции правдоподобия больших родословных

Большая часть методов генетического картирования основана на оценке максимального правдоподобия. Функция правдоподобия для произвольной родословной в общей форме может быть записана следующим образом:

Ш^Р{Х\0)Р{0),

G

где X - матрица наблюдаемых фенотипов для всех членов родословной, G - матрица их ненаблюдаемых генотипов (Elston and Stewart, 1971), а суммирование выполняется по всем возможным генотипическим конфигурациям. Сложность расчета этой формулы определяется числом возможных генотипических комбинаций и может быть записана как

сс=Пы, 1=1

где N— число особей в родословной, a |g,| - число возможных генотипов для i-го члена родословной. Если родословная большая," или число возможных генотипов велико, значение функции правдоподобия невозможно вычислить за реальное время.

Проблему можно решить с использованием так называемой свертки по методу Эльстона—Стюарта (Elston and Stewart, 1971). В основе идеи свертки лежит тот факт, что некоторые части функции правдоподобия условно независимы, и правдоподобие этих частей можно оценивать последовательно. Объем вычислительных ресурсов, который требуется для подсчета значения функции правдоподобия этим путем, в большой степени зависит от выбора условно независимых частей функции и от порядка их свертки. Было предложено несколько алгоритмов выбора оптимальной последовательности свертки (Thomas, 1986; Harbron, 1995; Fernandez and Fernando, 2002), но все они были разработаны для родословных, содержащих петли. До сих

пор считалось, что только при анализе родословных с петлями последовательность свертки имеет решающее значение. Для родословных без петель единицей свертки является ядерная родословная (ЯР), и сложность расчета функции правдоподобия пропорционально числу ЯР. Считалось, что порядок свертки для таких родословных может быть любым. Но даже для родословной без петель порядок свертки может играть существенную роль. Использование оптимальной последовательности свертки позволяет значительно сократить время вычисления функции правдоподобия. Для этой цели мы разработали новый алгоритм, позволяющий определить оптимальную последовательность свертки родословной без петель.

Процедура свертки

Любая родословная может быть представлена набором ЯР, где одна ЯР связана с другой через одну единственную особь, входящую в состав обеих ЯР (рис. 1А,В). Таких особей называют коннекторами. ЯР с единственным коннектором называется конечной ЯР. В родословной без петель каждая операция свертки переносит информацию о конечной ядерной ЯР на генотипы соответствующего коннектора. В результате число ЯР в родословной сокращается на единицу. Если при этом число коннекторов у следующей ЯР сокращается до одного, то эта ЯР становится конечной. Чтобы вычислить значение функции правдоподобия всей родословной, нужно последовательно свернуть все ЯР. Если родословная не содержит петель, то все ЯР можно свернуть, используя всего два типа свертки: свертка на родителя и свертка на потомка. При этом свертка на родителя всегда предпочтительнее, поскольку осуществляется с минимальным объемом вычислений. Тип свертки, используемый для конкретной ЯР, может зависеть от последовательности предыдущих сверток. Таким образом, общий порядок свертки может сильно влиять на длительность расчета значения функции правдоподобия.

В двух случаях свертка ЯР всегда может быть осуществлена оптимальным способом: 1) конечная ЯР всегда может быть свернута на родителя, если ее коннектор -один из родителей; 2) последняя ЯР может быть свернута на родителя при любой последовательности свертки всей родословной. Функция правдоподобия для всей родословной может быть посчитана без использования свертки на потомка, если в родословной нет ни одной ЯР, такой что оба ее родителя имеют своих предков в родословной. Если в родословной есть хотя бы одна такая ЯР, родословную не удастся свернуть, используя только свертку на родителя. В этом случае время вычисления функции правдоподобия будет зависеть от того, какие именно ЯР будут свернуты на потомка.

Алгоритм оптимального порядка свертки

Представим родословную в виде ориентированного графа Н, где ЯР являются вершинами, а направленным ребрам присвоены веса (рис. 1С). Например, соседние ядерные родословные ЯР1 и ЯР2, имеющие общего коннектора К\.2, будут представлены вершинами У\ и У2, соединенными двумя противоположно направленными ребрами, С\-г и С2-1. Веса ребер С\.г и С2-1 определяются временем вычисления свертки ЯР1 или ЯР2 на коннектораК\.2..

Выберем одну из вершин графа, ¡я, и создадим простой взвешенный граф Г, где ЯР - вершины, и две соседние ЯР соединены ребром тогда и только тогда, если между ними есть ребро в графе Н. Вес ребра между V, и ^ в графе Т равен весу того из

А

В

же родословная, представленная набором ядерных родословных; С) Взвешенный граф родословной, жирные стрелки указывают предпочтительное направление свертки - на родителя, потенциальные конечные вершины показаны серым цветом; I)) Взвешенное корневое дерево с корнем в вершине I ).

двух соответствующих ребер графа Н, которое направлено в сторону V К. Граф Т -взвешенное корневое дерево, корень которого - вершина VК (рис. Ш).Любая вершина графа Я может служить корнем для построения взвешенного корневого дерева. Операция свертки равносильна обрезанию листа графа Г, то есть вершины, связанной только с одной другой вершиной. Свертка начинается с листьев и завершается у корня. Известно, что существует единственный путь между любой вершиной и корнем дерева Т. Поэтому порядок обрезания листьев полностью определяется выбором корневой вершины. Таким образом, время вычисления, С, для свертки родословной можно рассчитать как сумму весов всех ребер Т плюс время свертки корневой ЯР. Корневое дерево с минимальным значением С соответствует оптимальному порядку свертки.

В общем случае, любую вершину графа Н можно рассматривать как потенциальный корень, и значения С нужно было бы посчитать для всех возможных корневых деревьев Т. Но учитывая тот факт, что граф Н был построен на основе родословной, некоторые вершины можно исключить из списка возможных решений. Оптималь-

ным может быть только такой порядок свертки, при котором оба родителя корневой ЯР являются основателями в исходной родословной. Действительно, если один из родителей выбранной ЯР имеет предков в родословной, то эта ЯР может быть свернута на родителя, и выбор соседней ЯР в качестве корня может оказаться более эффективным. Решение гарантированно окажется среди ЯР, в которых родители не имеют предков в родословной. Поэтому достаточно сравнить значения С только для тех деревьев Т, корни которых соответствуют таким ЯР.

Таким образом, предлагаемый алгоритм поиска оптимального порядка свертки родословной включает следующие этапы.

1. Родословная представляется в виде графа Я, где ЯР служат вершинами.

2. Вес каждого ребра графа Н определяется как время вычисления свертки ядерной родословной / на коннектора у.

3. Определяется набор потенциальных решений - набор ЯР, в которых родители не имеют предков в исходной родословной.

4. Для каждой ЯР из этого набора создается взвешенное корневое дерево Т, общий вес С рассчитывается как сумма весов всех ребер С^ графа Т плюс время вычисления свертки корневой ЯР на родителя.

5. Оптимальный порядок свертки соответствует дереву с минимальным общим весом.

Мы протестировали алгоритм на трех больших родословных разного размера и с разным числом генотипированных особей (табл. 1). Родословные содержали множественные петли, которые были разрезаны.

Таблица 1 показывает, что среднее время вычисления при случайном выборе порядка свертки в 1.8-3.2 раз больше минимального. При произвольном выборе порядка свертки всех трех родословных очень низка вероятность того, что время вычисления функции будет минимальным или близким к минимальному (табл. 1). Следовательно, предлагаемый алгоритм может существенно сократить время вычисления значения функции правдоподобия.

Табл. 1. Структура родословной и вычислительная сложность расчета функции правдоподобия.__

Число Вычислительная сложность (СС)

Родословная Особей Генотипированных особей ЯР Максимум Средняя, ±s.e. Минимум (Оптимальная свертка) Средняя/ минимум

Человек3 114 112 39 6.760 104 6.557±0.093 104 3.054-104 2.15

Лисаь 1845 1056 788 1.335 107 1.31Ш.001107 4.126-106 3.18

Песецс 952 617 359 2.664-107 8.279±0.229 106 4.604-106 1.80

а фрагмент родословной из голландской изолированной популяции человека (Pardo et al, 2009)

ь фрагмент родословной чернобурой лисы, составленной по записям скрещиваний Экспериментальной Фермы Института цитологии и генетики СО РАН с фрагмент родословной песца, составленной по записям скрещиваний Пушкинской пушной фермы, Московский р-н (Axenovich et al, 2007)

Разработанный алгоритм и компьютерная программа PedPeel являются частью пакетов программ, предназначенных для комплексного сегрегационного и параметрического рскомбинационного анализа признаков в больших родословных MQscore_SNP и MANHPG. Эти пакеты доступны по интернет-адресу http://mga.bionet.nsc.ru/soft/index.html. Программа PedPeel внесена в библиотеку программ для генетического анализа, созданную в Рокфеллеровском университете (http://linkage.rockefeller.edu/soft/).

Анализ ассоциаций с учетом эффекта родительского происхождения аллелей

Основной причиной эффекта родительского происхождения аллелей является геномный импринтинг. Суть его состоит в том, что материнский и отцовский аллели одного и того же гена в разной степени участвуют в формировании организма потомка (Назаренко, 2004; Лебедев, 2008; Ubeda, 2008). Импринтинг обусловливает частичное или полное замолкание аллеля, унаследованного от родителя определенного пола. Существенная роль импринтинга в индивидуальном развитии млекопитающих была широко признана наукой в последние годы. Считается, что > 1% генов млекопитающих проявляют эффект родительского происхождения аллелей при экспрессии, однако большая часть этих генов до сих пор не идентифицирована.

На уровне признака импринтинг проявляется следующим образом. Для имприн-тированного гена с аллелями А на можно выделить два типа гетерозигот. Обозначим гетерозиготный генотип Аа, если аллель А достался потомку от матери, и аЛ, если аллель А был унаследован от отца. Если ген контролирует качественный признак, то будет отличаться пенетрантность и/или экспрессивность генотипов Аа и аА. Если признак количественный, то эти два типа гетерозигот будут отличаться по среднему значению этого признака: (Е (у,) | Аа) Ф (Е (у,) | аА). Зависимость проявления аллеля в признаке потомка от пола родителя, передавшего ему этот аллель, получила название эффекта родителя.

Существуют указания на то, что импринтированные гены могут участвовать в контроле многих широко распространенных заболеваний человека, в том числе рака, диабета, ожирения, кожных заболеваний, когнитивных и поведенческих расстройств, играть роль в развитии астмы, алкоголизма, аутизма, болезни Альцгейме-ра, шизофрении и других психических заболеваний (Назаренко, 2004; Лебедев, 2008; Millington, 2006; Crespi, 2008; Rampersaud, 2008; Stöger, 2008). Поиск генов, участвующих в развитии заболеваний со сложным генетическим контролем, можно сделать более эффективным, если учесть эффект импринтинга в модели полногеномного анализа ассоциаций.

При анализе ассоциаций на семейных данных наибольшую статистическую мощность показывает метод измеренных генотипов - MG (Measured Genotype) (Hopper and Mathews, 1982; Boerwinkle et al., 1986; Lange et al., 2005; Aulchenko et al., 2007). Однако в рамках этого подхода до сих пор не была реализована аналитическая модель, учитывающая родительское происхождение аллелей.

Метод измеренных генотипов обычно реализуется с помощью критерия отношения правдоподобия. Возьмем диаллельный маркерный локус с аллелями А и а. Зададим вектор генотипов g с элементами 0 для генотипа АА, 1 для генотипа Аа и 2 для генотипа аа. Вектор g можно ввести в смешанную аналитическую модель, которая описывает как эффект анализируемого маркера, так и полигенную дисперсию: .

где у, - значение количественного признака ¿-ой особи, fi - среднее значение этого признака, kg — величина аллельного эффекта, Д — эффект j-той ковариаты, с,j - значение вектора /-той ковариаты для /-той особи, Сие- вектора полигенных эффектов и средовых остатков. При необходимости в данную модель можно включить еще один параметр, описывающий эффект доминирования.

Поскольку современные вычислительные возможности не позволяют производить этим методом полногеномный анализ на родословных большого размера, недавно были предложены подходы к быстрой аппроксимация данного метода (Aulchenko et al., 2007; Chen and Abecasis, 2007). Стратегия, предложенная в работе (Aulchenko et al., 2007), носит название GRAMMAR (Genomewide Rapid Association using Mixed Model And Regression) и включает три этапа. На первом этапе используется модель

у, = /г + ^ Pf„ + G, + е,

i

и вычисляются средовые остатки признака, свободные от полигенной компоненты дисперсии

У'у, -(¿1 + YjPjca + Ф,

1

где е,, fi, Рs и G, - оценки е„ р, Д and G,. На втором этапе маркеры тестируются

на ассоциацию с полученными средовыми остатками путем простой линейной регрессии:

у'=И + к& +а.

По результатам регрессионного анализа отбираются маркеры с наиболее высокими значениями статистики. Для этих маркеров проводится третий этап анализа -тестирование методом измеренных генотипов согласно модели (1).

Нашей целью была разработка метода, позволяющего тестировать эффект родительского происхождения аллелей в рамках метода измеренных генотипов (MG), в том числе производить поиск этого эффекта по всему геному и на больших родословных с использованием поэтапной стратегии анализа (GRAMMAR).

Описание метода

. Чтббы ввести в модель эффект родителя, необходимо провести различие между двумя типами гетерозигот. Обозначим гетерозиготный генотип А а, если аллель А был унаследован от матери, и аА, если аллель А был унаследован от отца. Зададим вектор родительского происхождения аллелей р как [(число аллелей А материнского происхождения) - (число аллелей А отцовского происхождения)]. Вектор будет содержать значения 0, 1, -1 и 0 для генотипов АА, Аа, аА и аа, соответственно. Чтобы учесть информацию об эффекте родителя при картировании методом измеренных генотипов, мы предлагаем ввести этот вектор родительского происхождения аллелей в качестве ковариаты в смешанную линейную модель:

У,=М + Kg, +К р, + £ Р,сч + G, + е, (2)

i

где кр - величина эффекта родительского происхождения аллелей, а остальные обозначения те же, что в формуле (1). Если анализ проводится методом GRAMMAR, то

вектор родительского происхождения аллелей можно ввести в регрессионную модель на втором этапе анализа:

у'=Ц + kgg, + kjp, + е,.

По результатам анализа этой регрессионной модели можно отобрать маркеры с наиболее высокими значениями статистики и провести для них анализ методом измеренных генотипов согласно модели (2).

Родительское происхождение аллелей потомка можно определить, если известны генотипы родителей. При определенных сочетаниях генотипов отца и матери это можно сделать на основе генотипов единственного диаллелыюго маркера. Но если потомок и оба родителя гетерозиготны по этому маркеру, то такой информации недостаточно для того, чтобы восстановить родительское происхождение аллелей. Проблему можно решить, если доступны генотипы сразу по многим локусам. В этом случае можно восстановить гаплотипы, унаследованные потомком от отца и от матери. Мы предлагаем использовать информацию о фланкирующих локусах посредством гаплотипирования для того, чтобы восстановить родительское происхождение аллелей.

Таким образом, предлагаемый метод состоит из двух этапов:

(1)определение родительского происхождения аллелей в родословной произвольной сложности. Для диаллельных маркеров это можно сделать с помощью многоточечной реконструкции гаплотипов согласно наиболее вероятному паттерну наследования;

(2)использование вероятностей родительского происхождения аллелей в анализе методом измеренных генотипов в качестве ковариаты в линейной смешанной модели или в регрессионной модели на втором этапе анализа методом GRAMMAR.

Эффективность метода

Мы сравнили нашу процедуру на основе GRAMMAR с существующим аналогичным подходом на основе TDT (Transmission/Disequilibrium Test - тест передачи/неравновесия, Spielman et al., 1993), доступным в пакете QTDT (Abecasis et al., 2000). Мы смоделировали количественный признак на трех типах родословных: ядерные родословные (ЯР), идеализированная популяция свиней (ИПС) и большая реальная родословная изолированной популяции человека (ERF, Erasmus Rucphen Family). В каждой выборке было по 1010 фено- и генотипированных особей. Наследуемость количественного признака была установлена на уровне 0.3, 0.5 или 0.8. Мощность оценивалась для значений главного аллельного эффекта 1, 2 и 3% от общей дисперсии признака. При этом эффект родителя объяснял 0.5, 1 и 1.5% от общей дисперсии, соответственно.

Мы оценивали родительское происхождение аллелей, сравнивая гаплотипы родителей и потомков. Эффективность определения родительского происхождения аллелей с помощью такой реконструкции гаплотипов показана в таблице 2. Для всех типов родословных гаплотипирование оказалось значительно более эффективным инструментом по сравнению с методом, использующим генотипы единственного локу-са. Реконструкция гаплотипов позволила определить родительское происхождение аллелей почти для всех гетерозиготных потомков, для которых это было теоретически возможно (табл. 2). Вероятность ошибочного установления родительского происхождения аллелей при гаплотипировании была очень низка (< 0.003%). Преиму-

Табл. 2. Доля особей, для которых было определено родительское происхождение аллелей.

Родословная Среднее число информативных3 особей Метод

По генотипам единственного локуса, % По гаплотипамь, %

ИПС 157.4 87.5 99.9

ЯР 106.4 89.4 97.3

ЕЯР 55.1 66.0 97.5

" только особи, гетерозиготные по анализируемому локусу и имеющие хотя бы одного генотипированного родителя, считались информативными ь для каждой особи рассматривался только наиболее вероятный гаплотип

Ьг = 0.3

Ьг = 0.5

Ьг = 0.8

Рис. 2. Статистическая мощность предлагаемого теста, учитывающего эффект родительского происхождения аллелей наряду с основным аллельным эффектом, (черные линии и кружки) и существующего аналогичного теста на основе ТБТ (серые кривые и кружки). Кривые - аппроксимации мощности, рассчитанные исходя из линейной зависимости между параметром нецентральности и размером эффекта локу-са. Кружки указывают эмпирическую оценку мощности при а = 0.01. Ось У каждой панели указывает мощность, ось X — долю общей дисперсии признака, которая объясняется аллельным эффектом анализируемого локуса. Размер эффекта родителя равен половине размера соответствующего аллельного эффекта.

ИПС ЯР ЕЯГ

щества данного подхода особенно заметны для родословной человека, где доля особей с восстановленным родительским происхождением аллелей увеличилась с 66% до 98% от теоретически возможного (табл. 2).

Ошибки I рода для тестов на основе TDT находились в хорошем соответствии с номинальным 5%-ным уровнем, тогда как для тестов на основе GRAMMAR эти значения были ниже. Наблюдалась слабая тенденция к снижению ошибки первого рода с увеличением наследуемости. Рисунок 2 показывает мощность разных методов при детекции импринтированного локуса. Тест на основе GRAMMAR всегда показывал самую высокую мощность, особенно на родословных ЯР и ERF. Хотя мощность обоих тестов была одинакова для родословной ИПС и наследуемости 50% и 80%, мощность GRAMMAR здесь недооценена по причине консервативности теста (более низких ошибок I рода). На родословной человека (ERF) мощность теста на основе TDT сильно упала. В действительности мощность была еще ниже, чем показано на рисунке 2, поскольку 16-29% тестов не было выполнено из-за недостаточной информативности данных для проведения теста. По умолчанию пакет QTDT не анализирует выборки с < 30 информативных особей. Среднее число информативных мейо-зов было 26.3 среди неуспешных реализаций TDT и 40.3 среди успешных.

Таким образом, мы показали, что наша процедура детекции эффекта родительского происхождения аллелей является более мощной по сравнению с традиционным подходом на основе TDT и позволяет анализировать данные, не информативные для метода TDT. Мы также проверили свойства предлагаемого теста при анализе локуса, не проявляющего эффекта родителя. Статистика теста не была завышена, т.е. тест не давал ложноположительных результатов. Высокая скорость анализа позволяет применять предлагаемый метод для полногеномного сканирования.

Картирование генов, контролирующих рост взрослого человека

Рост взрослого человека детерминируется как средовыми, так и генетическими факторами. Доля последних велика, она составляет 85-95% (Phillips and Matheny, 1990; Carmichael and McGue, 1995; Silventoinen et al., 2003; Visscher et al., 2007; Axenovich et al., 2009). Первые генетические исследования роста были выполнены более 120 лет назад Ф- Гальтоном (Galton, 1886). Вскоре рост стал рассматриваться как модельный признак - пример классического полигенного наследования, обеспечиваемого малыми аддитивными эффектами большого числа генов (Fisher, 1918).

В течение почти ста лет предпринимались многочисленные попытки поиска генетических вариантов, контролирующих рост. Эти попытки долгое время были безуспешны, поскольку для картирования генов малого эффекта нужны огромные выборки. Только недавно, в 2008 году, при анализе выборки из -63 000 человек были обнаружены 54 локуса, надежно ассоциированные с нормальным ростом человека (Gudbjartsson et al., 2008; Lettre et al., 2008; Weedon et al., 2008). Каждый из этих ло-кусов объяснял 0.1-0.5% дисперсии роста, но взятые в совокупности, они могли предсказать не более 7% разнообразия признака в выборке. Учитывая, что генетическая компонента составляет 85-95% дисперсии признака, становится ясно, что известные сейчас 54 локуса - это лишь малая часть генов, детерминирующих рост, и предстоит еще огромная работа по картированию остальных генов. Успешная идентификация этих генов позволит глубже понять механизмы роста и развития, а также прояснить генетическую архитектуру комплексных признаков и выявить наиболее эффективные способы их генетического анализа. Картирование локусов, контролирующих рост, желательно еще и потому, что были найдены ассоциации между рос-

том и некоторыми заболеваниями человека, включая рак (Gunnell et al., 2001). Для идентификации новых генов, контролирующих рост, необходимо либо повышать информативность выборок, либо увеличивать статистическую мощность методов анализа.

Целью исследования, представленного в этой главе, является поиск новых генов, контролирующих рост. Для анализа мы использовали материал огромной родословной из голландской изолированной популяции, поскольку выборки из изолированных популяций являются наиболее информативными для генетического картирования (Peltonen et al., 2000). Еще один эффективный способ увеличения мощности методов картирования заключается в уточнении модели наследования признака. Известно, что наследование роста сопряжено с эффектом родительского происхождения аллелей (Fradin et al., 2006). Таким образом, в данном исследовании мы провели полногеномный анализ ассоциаций с применением не только классической аддитивной модели аллельного эффекта, но и разработанной нами модели, учитывающей родительское происхождение аллелей.

Материал для анализа (родословная, значения признаков и генотипов большого числа маркеров) был собран и любезно предоставлен сотрудниками Медицинского центра Эразмус (Роттердам, Нидерланды) в рамках совместного исследовательского проекта. Родословная ERF включала 23 612 человек, потомков 22 пар основателей, живших в районе Рюкфен в 19-м веке. Д ля части ныне живущих членов родословной были известны фенотипы и генотипы по SNP маркерам панели Illumina 312К. После контроля качества данных итоговая выборка составила 989 человек для анализа аллельного эффекта и 452 человека - для анализа эффекта родительского происхождения аллелей. Анализ аллельного эффекта был проведен для 261 807 SNP маркеров, анализ эффекта родителя - для 254 482 SNP маркеров (только аутосомы).

Наиболее сильные свидетельства в пользу ассоциации были получены для локу-сов ANXA5 (рис. 3, слева), SFRP5, LOC392288/ACER2 (рис. 3, справа), ZNF775/REP1N1/RARRES2, TSPAN9. Кроме того, значения р < 5 х 105 получены еще для 24 локусов. Большинство найденных локусов содержит гены, информация о функции которых или исследования нокаутных мышей позволяют предположить их влияние на рост человека. В основном это гены, вовлеченные в процессы передачи сигналов и регуляцию транскрипции (среди них ANXA5 и SFRP5), участвующие в построении цитоскелета и кодирующие мембранные белки. С помощью аналитической модели, учитывающей эффект родительского происхождения аллелей были идентифицированы гены факторов транскрипции, участников сигнальных путей Rho/Rac- и G-белков, а также гены с пока неизвестной функцией. Значительную долю представляют регуляторные гены, играющие важную роль в эмбриогенезе (в том числе гены локуса ZNF775/REP1N1/RARRES2).

Картирование генов, контролирующих индекс массы тела человека

Индекс массы тела (ИМТ) определяется как отношение массы тела в килограммах к квадрату роста в метрах, измеряется в кг/м2 и показывает, таким образом, соотношение веса и роста человека (см., например, Mascie-Taylor and Goto, 2007; Eknoyan, 2008). С середины прошлого века ИМТ активно используется в медицинской практике для диагностики ожирения. Хотя ИМТ не измеряет напрямую долю жировой

a LOC729112 SS ANXA5 Я ТМЕМ155

EX0SC9 ------А2

^ BBS7 TRPC3

Chromosome 4 «6823721

« LOC253482 Ш DENND4C Я RPS6 ^ ACER2

■ LOG332265 SLC24A2

Chromosome 9 rs7865226

° ° « Л Be „ °°

оРлО o g,«

II ■

1

II I

i

121793

JL-j-L- x nJl .wlJLI^ILLZ

122793

123793

18461

19431

a

z <r>

1

20461 Kb

Рис. 3. Локусы с самым высоким значением статистики при анализе аллельного эффекта (ANXA5 на хромосоме 4, слева) и эффекта родительского происхождения аллелей (LOC392288/ACER2 на хромосоме 9, справа) нарост. Позиции маркеров rs6823721 и rs7865226, показавших самое высокое значение статистики, занимают центральное положение по оси X. Верхняя часть графиков показывает значения р в отрицательной логарифмической шкале для каждого маркера в интервале ±1МЬ от позиции центрального маркера. Гены, лежащие в данном интервале, изображены разными цветами. Черная линия на нижней части графика показывает частоту рекомбинации, сМ/МЬ, пунктирная линия - генетическое расстояние от центрального маркера, сМ. Позиции маркеров, генов и рекомбинационная карта (выборка CEU, НарМар) соответствуют сборке 36.3 NCBI reference.

ткани, он позволяет до некоторой степени оценить, является ли масса тела недостаточной, нормальной, или избыточной.

Наследуемость ИМТ оценивается по разным данным от 20 до 90% (Maes et al., 1997; Magnusson and Rasmussen, 2002; Hebebrand and Hinney, 2009; Lee, 2009). Как и в случае с ростом, несмотря на значительные усилия, полиморфные генетические варианты, влияющие на разнообразие по ИМТ в популяции, долгое время не были обнаружены. Моногенными формами ожирения удалось объяснить 7% случаев тяжелого ожирения с ранним проявлением у детей (Farooqi and O'Rahilly, 2006). Тем не менее, за последний год наметился прогресс в картировании генетических факторов немоногенного, несиндроматического ожирения на основе анализа ИМТ. Как и в случае с ростом, был произведен мета-анализ результатов полногеномного анализа ассоциаций с привлечением огромных выборок. В январе 2009 года Nature Genetics опубликовал результаты двух больших исследований с двухэтапной стратегией поиска (Thorleifsson et al., 2009а; Willer et al., 2009). Исследователи сообщили об ассоциации 11 генетических локусов с ИМТ, 4 из которых находятся в пределах или вблизи генов FTO, MC4R, BDNF и SH2B1, связь которых с ИМТ уже была обнаружена ранее.

Мы провели полногеномный анализ ассоциаций для признака ИМТ. Материал и методы картирования были такими же, как при анализе роста. Исследованная выборка включала 814 человек для анализа аллелыюго эффекта и 451 человек для анализа эффекта родительского происхождения аллелей.

Наиболее сильные свидетельства в пользу ассоциации были получены для локусов SASH1, ClOorfl 1, LOC338667/CDON, NLGN1 и CNTNAP5. Значения р< 5* 10"5 получены еще для 19 локусов.

При анализе аллельного эффекта были идентифицированы гены факторов транскрипции и модуляторов сигнальных путей, участвующих в развитии и функционировании нервной системы, в процессе гемопоэза, организаторы цитоскелета и гены с неизвестной функцией (среди них ClOorfl 1 и SASH1).

При анализе эффекта родительского происхождения аллелей три самых сильных сигнала картирования (LOC338667/CDON, NLGN1 и CNTNAP5) независимо указывают на молекулы клеточной адгезии, предположительно функционирующие в нервной ткани и необходимые для развития нервной системы, поддержания синап-тической пластичности и, возможно, влияющие на формирование поведения, функцию памяти. Их влияние дополняется эффектом генов регуляторов энергетического обмена.

В целом, функциональные категории генов, найденных при полногеномном анализе роста и ИМТ в нашем исследовании, соответствуют функциональным категориям, отмеченным в других полногеномных сканах (Liu et al., 2006; Dong et al., 2007; Johnson and O'Donnell, 2009). Многие локусы совпадают с идентифицированными ранее при попытках картирования генов роста и ИМТ/веса тела человека. Среди генов, локализованных с помощью модели родительского происхождения аллелей, многие участвуют в процессах раннего развития, что согласуется с существующими представлениями о генетическом импринтинге. Обнаруженные нами гены, таким образом, могут рассматриваться в качестве кандидатных локусов в отношении признаков роста, ИМТ и, возможно, ожирения.

При анализе эффекта родительского происхождения аллелей на признаке ИМТ четыре из пяти локусов с самыми высокими значениями статистики указывают на гены молекул клеточной адгезии, по крайней мере некоторые из которых являются специфичными для нервной ткани. По оценкам, на гены молекул клеточной адгезии приходится всего около 2% SNP маркеров панелей генотипирования (Dong et al., 2007). Вероятность того, что четыре раза из пяти гены этой функциональной категории были идентифицированы в силу случайных событий, равна 6 х 10"7, причем эта оценка даже не учитывает тканевую специфичность продуктов найденных генов, на которую указывает структурная гомология с поверхностными белками нейронов. Все это иллюстрирует высокую степень неслучайности установленных ассоциаций, а также подтверждает роль нервной системы и молекул адгезии нейронов в генетической регуляции массы тела.

ВЫВОДЫ

1. Разработан новый, эффективный алгоритм поиска оптимальной последовательности вычислительных операций при подсчете функции правдоподобия методом Эльстона—Стюарта. Показано, что данный алгоритм позволяет сократить время вычислений в 1.8-3.2 раза. Алгоритм реализован в программе Рес1Рее1, доступной по интернет-адресу http://mga.bionet.nsc.ru/soft/index.html и является частью пакетов МС^соге^Р и МАТЧ_П_РО.

2. Разработан новый метод анализа аллельных ассоциаций с учетом родительского происхождения аллелей. Предложен новый подход к определению родительского происхождения аллелей путем восстановления гаплотипов. Показано, что мощность разработанного метода значительно выше, чем у существующих аналогов.

3. Произведен полногеномный анализ ассоциаций на материале большой родословной из изолированной популяции человека. Установлена ассоциация локусов генов-регуляторов апоптоза ANXA5 и 57гЛ/>5 с ростом и генов БЛБ1П и С10ог/11 с индексом массы тела.

4. Полногеномный анализ ассоциаций был впервые выполнен с учетом эффекта родительского происхождения аллелей. Установлена ассоциация локусов ЮС392288/Л СЕЯ2, ХМЕ775/КЕР№ШЫККЕЯ2, Т8РАМ с ростом человека. Получены новые свидетельства в пользу ассоциации генов клеточной адгезии (.ЮС338667/СйОМ, ЫЮЫ1, СЫТЫАР5 и СЫТЫЗ) с индексом массы тела. Результаты анализа указывают на возможность имнринтинга по веем этим локусам.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Аксенович, Т.П. и Белоногова. Н.М. Картирование генов с помощью неравновесия по сцеплению или аллельных ассоциаций: Учеб. пособие / Новосибирский гос. ун-т, 2008.-98 с.

2. Белоногова, Н.М.. Аксенович, Т.П. и Аульченко, Ю.С. Эффект родительского происхождения аллелей в полногеномном анализе аллельных ассоциаций // ВО-ГиС, 2009. - часть 1, с. 390.

3. Aulchenko, Y.S., Amin, N., Bclonogova. N.M.. de Koning, D., Haley, C. and van Duijn, С. M. Powerful methods for whole-genome association analysis of quantitative traits in samples of related individuals //Eur. J. Hum. Genet., 2007. -V. 15, P. 25.

4. Aulchenko, Y.S., Struchalin, M.V., Belonogova, N.M.. Axenovich, T.I., Weedon, M.N., Hofman, A., Uitterlinden, A.G., et al. Predicting human height by Victorian and genomic methods // Eur J Hum Genet., 2009. -V. 17, P. 1070-5.

5. Axenovich, T.I., Zorkoltseva, I.V., Belonogova, N.M., Struchalin, M.V., Kirichenko, A.V., Kayser, M., Oostra, B.A., et al. Linkage analysis of adult height in a large pedigree from a Dutch genetically isolated population // Hum Genet., 2009. - V. 126, P. 457-71.

6. Belonogova. N.M. and Aulchenko, Y.S. A powerful approach to detect parent-of-origin effects in whole-genome association scans of quantitative traits // Eur. J. Hum. Genet., 2007. -V. 15, P. 26.

7. Belonogova, N.M. and Axenovich, T.I. Optimal peeling order for pedigrees with incomplete genotypic information // Comput Biol Chem., 2007. - V. 31, P. 173-7.

8. Belonogova. N.M., Axenovich, T.I. and Aulchenko, Y.S. A powerful genome-wide feasible approach to detect parent-of-origin effects in studies of quantitative traits // Eur J Hum Genet, 2009, doi:10.1038/ejhg.2009.167.

9. Kirichenko, A.V., Belonogova. N.M.. Aulchenko, Y.S. and Axenovich, T.I. PedStr software for cutting large pedigrees for haplotyping, IBD computation and multipoint linkage analysis //Ann Hum Genet., 2009. -V. 73, P. 527-31

Подписано к печати 18.02.2010

Формат бумаги 60 х 90 1/16. Печ. л. 1. Уч. изд. л. 0,7

Тираж 100 экз. Заказ 8_

Ротапринт Института цитологии и генетики СО РАН 630090, Новосибирск, пр. ак. Лаврентьева, 10.

Содержание диссертации, кандидата биологических наук, Белоногова, Надежда Михайловна

Список сокращений.

Введение.

Глава 1 Общие принципы картирования локусов комплексных признаков.

1.1 Анализ сцепления.

1.2 Анализ ассоциаций.

Глава 2 Оптимизация подсчета функции правдоподобия больших родословных.

2.1. Введение в проблему и постановка задачи.

2.2. Процедура свертки.

2.3. Алгоритм оптимального порядка свертки.

2.4 Число возможных генотипов.

2.5 Проверка эффективности алгоритма.

Глава 3 Анализ ассоциаций с учетом эффекта родительского происхождения аллелей.

3.1 Обзор литературы и постановка задачи.

3.1.1 Эффект родительского происхождения аллелей.

3.1.2 Существующие методы анализа ассоциаций с учетом родительского эффекта.

3.1.3 Метод измеренных генотипов как основа для более мощного теста на эффект родителя.

3.2 Описание метода.

3.3 Эффективность метода.

3.3.1 Эффективность реконструкции гаплотипов.

3.3.2 Ошибки первого рода и мощность для тестов на основе GRAMMAR и

TDT при анализе эффекта родителя.

3.3.3 Поиск эффекта родителя методом GRAMMAR при разных моделях наследования признака.

3.4 Обсуждение.

Глава 4 Картирование генов, контролирующих рост взрослого человека.

4.1. Обзор литературы и постановка задачи.

4.2. Материалы и методы.

4.2.1. Родословная.

4.2.2. Генотипирование.52 \

4.2.3. Методы анализа.

4.2.4. Анализируемый признак.

4.3. Результаты и обсуждение.

4.3.1. Аллельный эффект.

4.3.2. Эффект родительского происхождения аллелей.

Глава 5 Картирование генов, контролирующих индекс массы тела взрослого человека.

5.1. Обзор литературы и постановка задачи.

5.2. Материалы и методы.

5.3. Результаты и обсуждение.

5.3.1. Аллельный эффект.

5.3.2 Эффект родительского происхождения аллелей.

Введение Диссертация по биологии, на тему "Разработка методов картирования генов на основе родословных сложной структуры"

Актуальность исследования

Картирование генетических локусов, контролирующих различные признаки животных и человека, является важной и актуальной проблемой современной генетики. За последние годы были успешно секвенированы геномы многих видов, и все же функции большинства генов и фенотипическое проявление их аллельных вариантов во многом остаются неизвестными. Картирование генов, контролирующих проявление признака - необходимый этап генетического анализа, позволяющий соотнести фенотипическую черту с конкретной последовательностью нуклеотидов ДНК. Успешное картирование генетических вариантов позволяет глубже понять механизмы развития многих распространенных заболеваний, своевременно разработать и применить эффективные терапевтические или профилактические меры и методы ранней диагностики.

За последние десятилетия генетика значительно продвинулась в этом направлении. С помощью рекомбинационного анализа были картированы многие локусы, в том числе участвующие в контроле таких широко распространенных заболеваний как диабет, болезнь Альцгеймера, некоторые формы рака (Risch, 2000; Gulcher et al., 2001; Botstein and Risch, 2003). Главным образом были картированы гены большого эффекта, оказывающие сильное влияние на фенотип. Однако, основная часть наследуемых признаков относится к категории комплексных, то есть формируется при совместном участии большого числа генов, каждый из которых в отдельности оказывает незначительный эффект (Lohmueller et al., 2003; Hirschhorn and Daly, 2005; Collins, 2007). Поиск аллелей малого эффекта - важная задача генетической эпидемиологии, поскольку предполагается, что такие аллели играют существенную роль в развитии многих распространенных болезней, в том числе, гипертонии, сахарного диабета, ишемической болезни сердца, нейродегенеративных заболеваний и многих форм рака (Hirschhorn and Daly, 2005; Mayeux, 2005).

Между тем, картирование генетических вариантов со слабо выраженным эффектом сопряжено с рядом трудностей. Чтобы достичь необходимой мощности статистических тестов, нужны большие выборки, включающие десятки и сотни тысяч людей. В результате формируются большие массивы данных, обработка которых создает вычислительные проблемы. Многие существующие пакеты программ не в состоянии работать с выборками такого размера. Кроме того, не всегда удается определить модель наследования сложного признака или хотя бы примерное число генов, участвующих в его формировании. В настоящее время не существует статистических методов, достаточно полно учитывающих специфику комплексных болезней и обладающих высокой мощностью, чтобы надежно картировать генетические локусы, контролирующие сложные признаки.

В качестве объекта для исследований такого рода особый интерес представляют изолированные популяции человека. Известно, что в таких популяциях редкие аллельные варианты встречаются с относительно высокой частотой, что увеличивает шансы успешно картировать их позицию в геноме (Terwilliger et al., 1998; Peltonen, 2000; Peltonen et al., 2000; Chapman and Thompson, 2001; Rannala, 2001). В последние годы в нескольких странах Европы были сформированы большие массивы данных по изолированным популяциям человека (см., например, Aulchenko et al., 2004). Однако анализировать данные такого объема практически невозможно с применением существующих методов. Исследователи вынуждены дробить родословную на фрагменты и анализировать их как независимые родословные, теряя при этом генетическую информацию. Таким образом, прогресс в данной области существенно зависит от разработки новых эффективных аналитических методов, которые позволили бы извлечь максимум полезной информации из доступного материала.

Цели и задачи исследования

Целью исследования является разработка новых, эффективных методов статистического анализа, позволяющих картировать гены комплексных признаков человека.

Для достижения цели были поставлены следующие задачи:

1. Разработать новые методы и алгоритмы анализа, повышающие эффективность картирования локусов комплексных признаков на материале больших родословных, включающие: а. алгоритм оптимизации подсчета функции правдоподобия на материале большой родословной; b. метод поиска эффекта родительского (материнского/отцовского) происхождения аллелей на больших родословных.

2. С помощью существующих и новых методов картирования провести анализ некоторых комплексных признаков человека: роста и индекса массы тела.

Научная новизна

Разработан ряд новых методов и алгоритмов, позволяющих оптимизировать процесс поиска генов комплексных признаков на родословных сложной структуры: разработан и реализован в виде компьютерной программы алгоритм оптимизации подсчета функции правдоподобия большой родословной, на ряде примеров показано, что он ускоряет вычислительные процедуры в 1.83.2 раза; описана модель генетического контроля количественного признака, включающая эффект родительского (материнского/отцовского) происхождения аллелей, и на ее базе создан метод картирования генов, позволяющий быстро производить полногеномный анализ с использованием большого числа генетических маркеров; показано, что разработанный метод обладает большей мощностью, чем существующие аналоги.

С использованием существующих и новых методов картирования проведен анализ комплексных признаков человека: роста и индекса массы тела. Обнаружены новые сайты локализации генов, контролирующих эти признаки. Впервые показана ассоциация анализируемых признаков с рядом локусов, обладающих эффектом родительского происхождения аллелей.

Теоретическая и практическая ценность

В рамках подхода генетического картирования предложены новые алгоритмы и модели, их свойства проверены в модельном эксперименте и на реальных данных.

Впервые полногеномный анализ ассоциаций произведен с учетом эффекта родительского происхождения аллелей. В результате анализа комплексных признаков человека найдены новые генетические варианты, в том числе показана ассоциация индекса массы тела с генами молекул клеточной адгезии LOC338667/CDON, NLGN1, CNTNAP5 и CNTN3, влияющими на развитие и функционирование нервной системы. Результаты анализа подтверждают существующие представления о механизмах генетического контроля роста и индекса массы тела человека и роли регуляторных генов в определении разнообразия по данным признакам. В перспективе, полученные результаты будут способствовать прогрессу в области диагностики генетической предрасположенности к ожирению, диабету, раку, когнитивным расстройствам и другим распространенным заболеваниям.

Личный вклад автора

Разработка алгоритмов и методов генетического анализа, реализация их в виде компьютерных программ, а также весь статистический анализ выполнены автором самостоятельно. Материал (родословная, значения признаков и генотипов большого числа маркеров) был собран и любезно предоставлен сотрудниками Медицинского центра Эразмус (Роттердам) в рамках совместного исследования РФФИ-NWO.

Апробация работы

Результаты работы докладывались на Европейской Конференции по Генетике Человека (Ницца, 2007) и на Съезде Вавиловского Общества Генетики и Селекции (Москва, 2009).

Структура и объем работы

Работа состоит из 5 глав, введения, заключения и выводов, содержит 12 рисунков, 15 таблиц и приложение. Объем работы - 122 страницы.

Публикации

По теме диссертации опубликовано 9 работ, в том числе статьи в журналах "Computational Biology and Chemistry", "Human Genetics", "European Journal of Human Genetics", "Annals of Human Genetics".

Заключение Диссертация по теме "Генетика", Белоногова, Надежда Михайловна

Выводы

1. Разработан новый, эффективный алгоритм поиска оптимальной последовательности вычислительных операций при подсчете функции правдоподобия методом Эльстона—Стюарта. Показано, что данный алгоритм позволяет сократить время вычислений в 1.8—3.2 раза. Алгоритм реализован в программе PedPeel, доступной по интернет-адресу http://mga.bionet.nsc.ru/soMndex.html и является частью пакетов MQscoreSNP и MANHPG.

2. Разработан новый метод анализа аллельных ассоциаций с учетом родительского происхождения аллелей. Предложен новый подход к определению родительского происхождения аллелей путем восстановления гаплотипов. Показано, что мощность разработанного метода значительно выше, чем у существующих аналогов.

3. Произведен полногеномный анализ ассоциаций на материале большой родословной из изолированной популяции человека. Установлена ассоциация локусов генов-регуляторов апоптоза ANXA5 и SFRP5 с ростом и генов SASH1 и ClOorfll с индексом массы тела.

4. Полногеномный анализ ассоциаций был впервые выполнен с учетом эффекта родительского происхождения аллелей. Установлена ассоциация локусов LOC392288/ACER2, ZNF775/REPIN1/RA RRES2, TSPAN9 с ростом человека. Получены новые свидетельства в пользу ассоциации генов клеточной адгезии (LOC338667/CDON, NLGN1, CNTNAP5 и CNTN3) с индексом массы тела. Результаты анализа указывают на возможность импринтинга по всем этим локусам.

Заключение

В настоящем исследовании был разработан и протестирован ряд моделей и методов, позволяющих значительно оптимизировать некоторые аспекты генетического картирования.

Чтобы сократить время расчета функции правдоподобия при параметрическом анализе сцепления на больших родословных, мы разработали алгоритм поиска оптимальной последовательности для сверток отдельных частей родословной, используемый при подсчете функции правдоподобия по методу Эльстона—-Стюарта. На примере трех реальных родословных (песца, черно-бурой лисы и человека) мы показали, что разработанный нами алгоритм позволяет сократить время анализа в 1.8-3.2 раза. Мы математически доказали, что предложенный алгоритм гарантирует оптимальность найденной последовательности сверток и обеспечивает минимальное время расчета функции правдоподобия. Алгоритм был реализован в программе PedPeel, доступной по интернет-адресу http://mga.bionet.nsc.ru/soft/index.html. Программа PedPeel является частью пакетов программ MQscoreSNP и MANHPG, предназначенных для комплексного сегрегационного и параметрического рекомбинационного анализа признаков в больших родословных, таюке доступных по интернет-адресу http://mga.bionet.nsc.ru/soft/index.html. Программа PedPeel внесена в библиотеку программ для генетического аиализа, созданную в Рокфеллеровском университете (http://linkage.rockefeller.edu/soft/).

Метод анализа аллельных ассоциаций с учетом родительского происхождения аллелей был реализован нами в рамках мощного аналитического подхода - метода измеренных генотипов, использующего как внутрисемейную, так и межсемейную дисперсию признака в целях картирования. Впервые родительское происхождение аллелей определялось путем гаплотипирования особей по генотипам большого числа маркеров. Мы показали, что гаплотипирование позволяет восстановить родительское происхождение аллелей чаще чем в 97% случаев и на 8-32% больше, чем без гаплотипирования. Разработанный метод, таким образом, использует всю доступную информацию для поиска ассоциации между признаком и генетическим маркером.

Благодаря этому его статистическая мощность значительно выше, чем у аналогичных существующих методов.

Другой частью нашей работы была проверка разработанного метода тестирования эффекта родительского происхождения аллелей на большом массиве реальных данных. В анализе был использован ценный генетический материал -огромная родословная из изолированной популяции человека, анализ которой стал возможным благодаря разработанным подходам. Применение метода на практике позволило найти свидетельства в пользу ассоциации ряда новых локусов с ростом и индексом массы тела человека. Наиболее сильные свидетельства в пользу ассоциации были получены для локусов ANXA5, SFRP5, LOC392288/ACER2, ZNF775/REPIN1/RARRES2, TSPAN9 при анализе роста и локусов SASH1, ClOorfll, LOC338667/CDON, NLGN1, CNTNAP5 при анализе ИМТ (рис. 4.1-5.2). Кроме того, значения р < 5 х 10"5 получены еще для 24 локусов при анализе роста и 19 локусов при анализе ИМТ (табл. 4.4, 4.5, 5.3 и 5.4).

Особо стоит остановиться на проблеме статистической значимости и интерпретации результатов анализа реальных данных. В настоящее время этот вопрос широко обсуждается в научной литературе, особенно применительно к генетическому картированию (Lander and Kruglyak, 1995; Wacholder et al., 2004; Ioannidis, 2005; WTCCC, 2007; Wakefield, 2008). Известно, что для реальных данных трудно определить, с какой вероятностью результат теста является ложно-положительным, основываясь только на величине р. Для этого потребовалось бы знать локальную мощность теста, априорную вероятность справедливости нулевой гипотезы, характер распределения статистики при справедливости нулевой и альтернативной гипотез (Wacholder et al., 2004; Ioannidis, 2005; Wakefield, 2008). Использование поправки Бонферрони при многоточечном картировании многие считают неоправданным, поскольку тестируемые гипотезы в данном случае не образуют семейства (Rothman, 1990; Veazie, 2006; WTCCC, 2007). Метод оценки доли ложно-положительных результатов FDR (False Discovery Rate) обладает низкой мощностью в ситуации, когда вероятность справедливости альтернативной гипотезы низка (Benjamini and Hochberg, 1995). В частности, интерпретация FDR сомнительна в случае, когда вероятность, что будет отвергнута хотя бы одна нулевая гипотеза, значительно меньше единицы (Zaykin et al., 2000). Помимо всего этого, известно, что при анализе ассоциации нередко не удается воспроизвести результат для локусов, показавших самые высокие значения статистики в отдельном полногеномном скане, а локусы, действительно влияющие на разнообразие по признаку, оказываются довольно низко в общем списке результатов картирования (Zaykin and Zhivotovsky, 2005; Zeggini et al., 2008).

В виду всех этих трудностей, уровень значимости генетического картирования нередко выбирается произвольно (например. WTCCC, 2007; например, Polasek et al., 2009). При этом подчеркивается его условность и необходимость подтверждения результатов на независимых выборках в других исследованиях. В базу данных, куда заносятся результаты полногеномных анализов ассоциаций, вносятся все маркеры со значениями р<10~3, а весомым свидетельством в пользу ассоциации считается значение р < 10~5 (http://www.genome.gov/gwastudies/, Hindorff et al., 2009; Johnson and O'Donnell, 2009). Ha 1 сентября 2009 года в эту базу данных было занесено 378 публикаций и 1700 SNP маркеров со значением р < 10"5. В доказательство эффективности полногеномных сканов приводится тот факт, что 65.7% из 56 411 о маркеров со значением р < 10" находятся либо в пределах генов, либо на расстоянии менее 60 Кб от позиции гена (Johnson and O'Donnell, 2009). Это значительно больше, чем можно было бы ожидать в силу случайных событий. На протяженных участках некодирующей ДНК, напротив, сигналы картирования выявляются относительно редко (Hindorff et al., 2009; Johnson and O'Donnell, 2009). Хотя известно, что SNP маркеры панели Illumina отбираются с учетом позиций маркеров, в исследовании (Johnson and O'Donnell, 2009) не было найдено больших различий в расположении ассоциированных маркеров относительно генов для панелей Illumina по сравнению с панелями Affymetrix, SNP маркеры которых не проходят такого отбора. Практически все локусы, приводимые в нашей работе (р <5 х 10 5), указывают на богатые генами районы хромосом (рис. 4.1-5.2, табл A-D приложения), причем 43 из 53 локусов (81.1%) находятся в пределах или на расстоянии <60 Кб от позиции ближайшего гена. Тем же условиям удовлетворяет та же доля локусов со значением р < 10"4 (86 из 106). Эти показатели не только иллюстрируют надежность полученных нами результатов, но и свидетельствуют в пользу того, что локусы с еще более низкими значениями р, вероятно, также несут информация о генах, контролирующих соответствующие признаки. Это не удивительно, если учесть, что 54 локуса, обнаруженные при полногеномном анализе роста в работах (Gudbjartsson et al., 2008; Lettre et al., 2008; Weedon et al., 2008) на огромной выборке людей, объясняют всего около 7% дисперсии роста в этой выборке. Аналогичная картина наблюдается и при анализе ИМТ (Thorleifsson et al., 2009а; Wilier et al., 2009). Чтобы объяснить всю генетическую дисперсию роста (~85-95%) и ИМТ (-30-60%), потребуется идентифицировать сотни локусов (см. также Aulehenko et al., 2009).

В работе (Johnson and O'Donnell, 2009) также приводится анализ функциональных категорий генов, обнаруженных по итогам полногеномного сканирования различных фенотипов человека. Среди продуктов найденных генов преобладают молекулы клеточной адгезии, участники сигнальных путей, транспортные белки и ферменты фосфорилирования белков (Johnson and O'Donnell, 2009). Среди генов, обсуждаемых в нашей работе, тоже преобладают гены данных функциональных категорий, а также факторы транскрипции, участники процессов развития, и в меньшей степени - участники иммунных процессов (ИМТ, аллельный эффект). Преимущественное выявление генов с этими функциями нельзя объяснить их высокой частотой в геноме или избыточным покрытием SNP маркерами панели генотипирования. Так, в работе (Dong et al., 2007) исследователи соотнесли SNP маркеры основных панелей генотипирования человека с функциональными категориями соответствующих генов. На рисунке 6.1 видно, что SNP маркеры, соотнесенные с генами транскрипционных факторов (transcription regulator activity), транспортных белков (transporter activity), а также участников иммунных процессов (immune system process), составляют лишь небольшую долю всех SNP маркеров панелей генотипирования. Немногим больше и число маркеров, соотнесенных с генами участников сигнальных путей (molecular transducer activity) и с генами развития (developmental process). Напротив, гены-участникн процессов обмена веществ (metabolic process) представлены в панелях значительно шире, тогда как в обнаруженных нами локусах таких генов сравнительно мало. Что касается генов молекул клеточной адгезии, то было показано, что доля этих генов выше всего среди результатов полногеномного анализа признаков, связанных с весом и ИМТ (р < 7.1 х Ю'20) (Liu et al., 2006; Johnson and O'Donnell, 2009). Также указывается, что при анализе веса/ИМТ с высокой частотой выявляются гены, участвующие в развитии нервной системы (Johnson and O'Donnell, 2009). В нашей работе при анализе эффекта родительского происхождения аллелей на признаке ИМТ четыре из пяти локусов с самыми высокими значениями статистики указывают на гены молекул клеточной адгезии, по крайней мере часть из которых являются специфичными для нервной ткани. По оценкам (Dong et al., 2007) на гены молекул клеточной адгезии приходится всего около 2% SNP маркеров панелей генотипирования (рис. 6.1, biological adhesion). Вероятность того, что четыре раза из пяти гены этой функциональной категории будут идентифицированы в силу случайных событий, равна 6 х 10"7. Данный вывод был получен для результатов выполненного нами полногеномного скана, характеризующегося самыми низкими значениями статистики и произведенного на самой маленькой выборке. В трех остальных сканах число маркеров с р< 5 х 10"5 было больше, а значения статистики для самых лучших локусов - выше. Можно полагать, что мощность анализа и надежность результатов этих сканов должна быть не меньше, чем при анализе эффекта родительского происхождения аллелей на признаке ИМТ. part extracellula rmatrix extracellular region extracellular region part macromolecular complex membrane-enclosed lumen organellepart biological adhesion biological regulation transporter activity transcription regulator activity structural molecule activity molecular transducer activity enzyme regulator activity catalytic binding response to stimulus multicellular organismal process-metabolic process localization cellular process developmental process of localization immune system process

Рис. 6.1. Представленность SNP маркеров, соотнесенных с различными категориями базы Gene Ontology. (Приводится по Dong et al., 2007). Секции представлены в трех основных группах - клеточная локализация, молекулярная функция и биологический процесс. Концентрические круги соответствуют трем панелям генотипирования.

Таким образом, проведенный нами анализ с высокой специфичностью выявил гены тех функциональных категорий, об участии которых в контроле сложных признаков человека свидетельствуют результаты других полногеномных исследований. Картирование было успешным даже на самой маленькой выборке (всего 451 человек), что подтверждает высокую мощность разработанного подхода к анализу эффекта родительского происхождения аллелей.

Несомненно, для подтверждения найденных в настоящей работе ассоциаций между признаками и генетическими локусами необходимо независимое воспроизведение этих результатов в других исследованиях и на других популяциях человека. Независимое воспроизведение позволило бы, прежде всего, доказать универсальность участия данных генетических вариантов в контроле соответствующих признаков, поскольку не исключено, что их влияние на признак проявляется лишь в исследованной популяции. Популяциопная специфичность генетических вариантов, контролирующих комплексные признаки - одна из причин того, что результаты разных полногеномных сканирований лишь незначительно перекрываются между собой (Visscher, 2008). Так, на независимой выборке генетический профиль 54 локусов, ассоциированных с ростом человека, объяснил всего 3.8% дисперсии роста (Aulchenko et al., 2009) - почти вдвое меньше, чем на исходной выборке. Однако популяционная специфичность может быть во многом обусловлена различиями в структуре неравновесия по сцеплению. В этом случае идентификация полиморфизмов, непосредственно влияющих на фенотип, значительно повысит воспроизводимость результатов при анализе разных популяций.

Даже в том случае, когда маркер с высоким значением статистики находится в интроне/экзоне гена, велика вероятность, что непосредственное влияние на признак оказывает другой полиморфизм, находящийся в тесном неравновесии по сцеплению с этим маркером. Более того, лишь небольшая часть из найденных нами локусов указывает на единственный ген-кандидат, тогда как в большинстве случаев существует два и более кандидатных гена вблизи позиции маркера. Иногда эти гены образуют семейства со сходной структурой и/или функцией, например, кластер генов ZNF (локус 13, табл. А приложения), гены PNPLA3, PNPLA5, SULT4A1, вовлеченные в метаболизм липидов (локус 16, табл. А приложения), гастрокины GKN2, GKN1 и белок-кодирующий локус LOC100132413 со сходной последовательностью ДНК локус 6, табл. D приложения). Кластеризация генов со сходной структурой может объясняться эволюцией этих генов путем дупликации с последующей дивергенцией последовательностей. Более того, последние исследования (и не в последнюю очередь - результаты сканирования генома методом анализа ассоциаций) свидетельствуют в пользу того, что мультигенные домены хроматина являются распространенными (а возможно и преобладающими) единицами регуляции в геноме млекопитающих (Michalak, 2008; de Wit and van Steensel, 2009). Гены в пределах такого функционального домена могут попадать под действие общих элементов контроля, иметь одинаковый паттерн эпигенетических модификаций, их экспрессия скоординирована и может служить одной и той же цели - даже в том случае, если их происхождение, структура и непосредственные функции различны. Таким образом, при анализе ассоциаций сигнал может быть обусловлен не только полиморфизмом одного гена, но всей совокупностью генетических вариантов в пределах функционального домена, если они формируют единую группу сцепления. О сцеплении в районе сигнала картирования можно до некоторой степени судить по локальным частотам рекомбинации и генетическим расстояниям между соседними генами (рис. 4.1-5.2). Данные характеристики являются частью базы данных НарМар по выборке CEU (жители штата Юта происхождением из Северной и Восточной Европы, см., например, (Не et al., 2009)). Было показано, что корреляция значений неравновесия по сцеплению между CEU и выборкой из голландской популяции составляет 93% (Pardo et al., 2009). Поскольку выборка ERF собрана в изолированной популяции, показатели неравновесия по сцеплению в среднем должны быть больше, чем в аутбредных популяциях. Тем более вероятно, что сигнал картирования может быть обусловлен не единственным генетическим полиморфизмом, а целым гаплотипом, объединяющим аллели нескольких генов со схожей функцией. Кроме того, сигнал картирования может указывать на общую регуляторную область функционального домена, мутации в которой могут отражаться на активности сразу нескольких близлежащих генов.

Таким образом, дальнейшие исследования необходимы как для воспроизведения результатов анализа ассоциаций на других популяциях, так и для поиска функциональных генетических вариантов, непосредственно влияющих на значение признака. Кроме того, для подтверждения импринтированного статуса локусов, идентифицированных путем моделирования эффекта родительского происхождения аллелей, потребуется тестирование с помощью специальных аналитических моделей с последующим анализом паттернов экспрессии близлежащих генов.

До сих пор надежно идентифицирована лишь малая доля из множества локусов, в совокупности определяющих значительную часть популяционного разнообразия по комплексным признакам. Неуклонный прогресс по веем направлениям в области картирования генов комплексных признаков человека в конце концов значительно повысит предсказательную силу генетического анализа и позволит создать эффективные тест-системы для выявления генетической предрасположенности к ряду распространенных заболеваний и патологических состояний человека.

Библиография Диссертация по биологии, кандидата биологических наук, Белоногова, Надежда Михайловна, Новосибирск

1. Лебедев, И. Н. и Саженова, Е. А. Эпимутации импринтированных генов в геноме человека: классификация, причины возникновения, связь с наследственной патологией // Генетика, 2008. №44, с. 1356-1373.

2. Назаренко, С. А. Геномный импринтинг и его роль в этиологии наследственных болезней человека // Бюллетень сибирской медицины, 2004. №3, с. 8-18.

3. Abecasis, G. R., Cardon, L. R. and Cookson, W. O. A general test of association for quantitative traits in nuclear families // Am J Hum Genet, 2000a. V. 66, P. 279-92.

4. Abecasis, G. R., Cherny, S. S., Cookson, W. O. and Cardon, L. R. Merlin—rapid analysis of dense genetic maps using sparse gene flow trees // Nat Genet, 2002. V. 30, P. 97-101.

5. Abecasis, G. R., Cookson, W. O. and Cardon, L. R. Pedigree tests of transmission disequilibrium // Eur J Hum Genet, 2000b. V. 8, P. 545-51.

6. Agusti, A., Morla, M., Sauleda, J., Saus, C. and Busquets, X. NF-kappaB activation and iNOS uprcgulation in skeletal muscle of patients with COPD and low body weight // Thorax., 2004. -V. 59, P. 483-7.

7. Allen, B. L., Tenzen, T. and McMahon, A. P. The Hedgehog-binding proteins Gasl and Cdo cooperate to positively regulate Shh signaling during mouse development // Genes Dev., 2007.-V. 21, P. 1244-57.

8. Amin, N., van Duijn, С. M. and Aulchenko, Y. S. A genomic background based method for association analysis in related individuals // PLoS One., 2007. V. 2, P. el274.

9. Aulchenko, Y. S., de Koning, D. J. and Haley, C. Genomewide rapid association using mixed model and regression: a fast and simple method for genomewide pedigree-based quantitative trait loci association analysis // Genetics, 2007a. V. 177, P. 577-85.

10. Aulchenko, Y. S., Heutink, P., Mackay, I., Bertoli-Avella, A. M., Pullen, J., Vaessen, N., Rademaker, T. A., et al. Linkage disequilibrium in young genetically isolated Dutch population // Eur J Hum Genet., 2004. V. 12, P. 527-34.

11. Aulchenko, Y. S., Ripke, S., Isaacs, A. and van Duijn, С. M. GenABEL: an R library for genomewide association analysis // Bioinformatics., 2007b. V. 23, P. 1294-6. Epub 2007 Mar 23.

12. Aulchenko, Y. S., Struchalin, M. V., Belonogova, N. M., Axenovich, Т. I., Weedon, M. N., Hofman, A., Uitterlinden, A. G., et al. Predicting human height by Victorian and genomic methods // Eur J Hum Genet., 2009. V. 17, P. 1070-5.

13. Barness, L. A., Opitz, J. M, and Gilbert-Barness, E. Obesity: genetic, molecular, and environmental aspects // Am J Med Genet A., 2007. V. 143 A, P. 3016-34.

14. Bastarrachea, R. A., Lopez-Alvarenga, J. C., Bolado-Garcia, V. E., Tellez-Mendoza, J., Laviada-Molina, H. and Comuzzie, A. G. Macrophages, inflammation, adipose tissue, obesity and insulin resistance. // Gac Med Мех., 2007. V. 143, P. 505-12.

15. Benjamini, Y. and Hochberg, Y. Controlling the False Discovery Rate: A Practical and Powerful Approach to Multiple Testing // Journal of the American Statistical Association, 1995. V. 57, P. 289-300.

16. Benyamin, В., Visscher, P. M. and McRae, A. F. Family-based genome-wide association studies // Pharmacogenomics, 2009. V. 10, P. 181-90.

17. Berger, P., Young, P. and Suter, U. Molecular cell biology of Charcot-Marie-Tooth disease // Neurogenetics., 2002. V. 4, P. 1-15.

18. Boervvinkle, E., Chakraborty, R. and Sing, C. F. The use of measured genotype information in the analysis of quantitative phenotypes in man. I. Models and analytical methods // Ann Hum Genet., 1986. V. 50, P. 181-94.

19. Boichard, D. PEDIG, a FORTRAN package for pedigree analysis studied for large populations. Proceeding of the 7th World Congress, Montpellier, France // Genet Appl Livest, 2002. V. P. 28-13.

20. Botstein, D. and Risch, N. Discovering genotypes underlying human phenotypes: past successes for mendelian disease, future approaches for complex disease // Nat Genet., 2003. V. 33 Suppl, P. 228-37.

21. Bouchard, C. Current understanding of the etiology of obesity: genetic and nongenetic factors // Am J Clin Nutr., 1991.-V. 53, P. 1561S-1565S.

22. Bovolenta, P., Esteve, P., Ruiz, J. M., Cisneros, E. and Lopez-Rios, J. Beyond Wnt inhibition: new functions of secreted Frizzled-related proteins in development and disease // J Cell Sci., 2008. -V. 121, P. 737-46.

23. Brillante, D. G., O'SuIlivan, A. J. and Howes, L. G. Arterial stiffness in insulin resistance: the role of nitric oxide and angiotensin II receptors // Vase Health Risk Manag, 2009. V. 5, P. 73-8.

24. Burdan, F., Szumilo, J., Korobowicz, A., Farooquee, R., Patel, S., Patel, A., Dave, A., et al. Morphology and physiology of the epiphyseal growth plate // Folia Histochem Cytobiol, 2009.-V. 47, P. 5-16.

25. Buscarlet, M., Perm, A., Laing, A., Brickman, J. M. and Stifani, S. Inhibition of cortical neuron differentiation by Groucho/TLEl requires interaction with WRPW, but not Ehl, repressor peptides // J Biol Chem., 2008. V. 283, P. 24881-8.

26. Cameron, N. E. and Cotter, M. A. Pro-inflammatory mechanisms in diabetic neuropathy: focus on the nuclear factor kappa В pathway // Curr Drug Targets., 2008. V. 9, P. 60-7.

27. Campbell, C. D., Ogbum, E. L., Lunetta, K. L., Lyon, H. N., Freedman, M. L., Groop, L. C., Altshuler, D., et al. Demonstrating stratification in a European American population // Nat Genet, 2005. V. 37, P. 868-72.

28. Carmichael, С. M. and McGue, M. A cross-sectional examination of height, weight, and body mass index in adult twins // J Gerontol A Biol Sci Med Sci., 1995. V. 50, P. B237-44.

29. Chandra, D., Choy, G., Daniel, P. T. and Tang, D. G. Bax-dependent regulation of Bak by voltage-dependent anion channel 2 // J Biol Chem., 2005. V. 280, P. 19051-61.

30. Chang, J. Т., Esumi, N., Moore, K., Li, Y., Zhang, S., Chew, C., Goodman, В., et al. Cloning and characterization of a secreted frizzled-related protein that is expressed by the retinal pigment epithelium // Hum Mol Genet., 1999. V. 8, P. 575-83.

31. Chapman, N. H. and Thompson, E. A. Linkage disequilibrium mapping: the role of population history, size, and structure // Adv Genet, 2001. V. 42, P. 413-37.

32. Chen, H. H., Luche, R., Wei, В. and Tonks, N. K. Characterization of two distinct dual specificity phosphatases encoded in alternative open reading frames of a single gene located on human chromosome 10q22.2 // J Biol Chem., 2004. -V. 279, P. 41404-13.

33. Chen, W. M. and Abecasis, G. R. Family-based association tests for genomewide association scans // Am J Hum Genet, 2007. V. 81, P. 913-26.

34. Cheng, E. H., Sheiko, Т. V., Fisher, J. K., Craigen, W. J. and Korsmeyer, S. J. VDAC2 inhibits ВАК activation and mitochondrial apoptosis // Science., 2003. V. 301, P. 513-7.

35. Cole, F. and Krauss, R. S. Microform holoprosencephaly in mice that lack the Ig superfamily member Cdon // Curr Biol., 2003. V. 13, P. 411-5.

36. Collins, A. R. Linkage disequilibrium and association mapping: an introduction // Methods Mol Biol, 2007.-V. 376, P. 1-15.

37. Cordell, H. J. and Clayton, D. G. Genetic association studies // Lancet., 2005. V. 366, P. 1121-31.

38. Crespi, B. Genomic imprinting in the development and evolution of psychotic spectrum conditions // Biol Rev Camb Philos Soc, 2008a. V. 83, P. 441-93.

39. Crespi, B. Genomic imprinting in the development and evolution of psychotic spectrum conditions // Biol Rev Camb Philos Soc., 2008b. -V. 83, P. 441-93.

40. Crotti, L., Celano, G., Dagradi, F. and Schwartz, P. J. Congenital long QT syndrome // Orphanet J Rare Dis., 2008.-V. 3, P. 18.

41. Desjobert, C., Noy, P., Swingler, Т., Williams, H., Gaston, K. and Jayaraman, P. S. The PRH/Hex repressor protein causes nuclear retention of Groucho/TLE co-repressors // Biochem J., 2009. -V. 417, P. 121-32.

42. Devlin, B. and Roeder, K. Genomic control for association studies // Biometrics, 1999. V. 55, P. 997-1004.

43. Dityatev, A., Bukalo, O. and Schachner, M. Modulation of synaptic transmission and plasticity by cell adhesion and repulsion molecules // Neuron Glia Biol, 2009. V. 13, P. 1-13.

44. Dong, C., Li, W. D., Geller, F., Lei, L., Li, D., Gorlova, O. Y., Hebebrand, J., et al. Possible genomic imprinting of three human obesity-related genetic loci // Am J Hum Genet., 2005. -V. 76, P. 427-37.

45. Dong, C., Qian, Z., Jia, P., Wang, Y., Huang, W. and Li, Y. Gene-centric characteristics of genome-wide association studies // PLoS One., 2007. V. 2, P. el262.

46. Dong, L. M., Potter, J. D., White, E., Ulrich, С. M., Cardon, L. R. and Peters, U. Genetic susceptibility to cancer: the role of polymorphisms in candidate genes // Jama., 2008. V. 299, P. 2423-36.

47. Eknoyan, G. Adolphe Quetelet (1796-1874)~the average man and indices of obesity // Nephrol Dial Transplant., 2008. -V. 23, P. 47-51.

48. Elmore, S. Apoptosis: a review of programmed cell death // Toxicol Pathol, 2007. V. 35, P. 495516.

49. Elston, R. C. and Stewart, J. A general model for the genetic analysis of pedigree data // Hum. Hered., 1971. -V. 21, P. 523-542.

50. Farooqi, S. and O'Rahilly, S. Genetics of obesity in humans // Endocr Rev., 2006. V. 27, P. 71018.

51. Fernandez, S. A. and Fernando, R. L. Technical note: determining peeling order using sparse matrix algorithms // J Dairy Sci, 2002. V. 85, P. 1623-9.

52. Fisher, R. A. The correlation between relatives on the supposition of mendelian inheritance I I Trans. R. Soc., 1918. V. 52, P. 399-433.

53. Fradin, D., Boileau, P., Lepercq, J. and Bougneres, P. 'Non-Mendelian1 genetics of fetal growth // J Endocrinol Invest., 2006. -V. 29, P. 11-5.

54. Fraga, M. F., Berdasco, M., Ballestar, E., Ropero, S., Lopez-Nieva, P., Lopez-Serra, L., Martin-Subero, J. I., et al. Epigenetic inactivation of the Groucho homologue gene TLE1 in hematologic malignancies // Cancer Res., 2008. V. 68, P. 4116-22.

55. Freedman, M. L., Reich, D., Penney, K. L., McDonald, G. J., Mignault, A. A., Patterson, N., Gabriel, S. В., et al. Assessing the impact of population stratification on genetic association studies // Nat Genet., 2004. V. 36, P. 388-93.

56. Friedberg, I., Nika, K., Tautz, L., Saito, K., Cerignoli, F., Friedberg, I., Godzik, A., et al. Identification and characterization of DUSP27, a novel dual-specific protein phosphatase // FEBS Lett., 2007. V. 581, P. 2527-33.

57. Galton, F. Regression towards mediocrity in hereditary stature // Nature, 1886. V. 15, P. 246-63.

58. Gandhi, N. S. and Mancera, R. L. The structure of glycosaminoglycans and their interactions with proteins // Chem Biol Drug Des., 2008. V. 72, P. 455-82.

59. George, V. T. and Elston, R. C. Testing the association between polymorphic markers and quantitative traits in pedigrees // Genet Epidemiol, 1987. V. 4, P. 193-201.

60. Gerdin, A. K., Surve, V. V., Jonsson, M., Bjursell, M., Bjorkman, M., Edenro, A., Schuelke, M., et al. Phenotypic screening of hepatocyte nuclear factor (HNF) 4-gamma receptor knockout mice // Biochem Biophys Res Commun., 2006. V. 349, P. 825-32.

61. Gilmour, A. R., Gogel, B. J., Cullis, B. R., Welham, S. J. and Thompson, R. ASReml user guide release 2.0. Orange. NSW Agriculture, 2002. - P. 320.

62. Gorlova, O. Y., Amos, С. I., Wang, N. W., Shete, S., Turner, S. T. and Boerwinkle, E. Genetic linkage and imprinting effects on body mass index in children and young adults // Eur J Hum Genet., 2003. V. 11, P. 425-32.

63. Gorlova, O. Y., Lei, L., Zhu, D., Weng, S. F., Shete, S., Zhang, Y., Li, W. D., et al. Imprinting detection by extending a regression-based QTL analysis method // Hum Genet., 2007. V. 122, P. 159-74.

64. Goyenechea, E., Parra, D., Crujeiras, А. В., Abete, I. and Martinez, J. A. A nutrigenomic inflammation-related PBMC-based approach to predict the weight-loss regain in obese subjects // Ann Nutr Metab, 2009. V. 54, P. 43-51.

65. Granic, I., Dolga, A. M., Nijholt, I. M., van Dijk, G. and Eisel, U. L. Inflammation and NF-kappaB in Alzheimer's disease and diabetes // J Alzheimers Dis., 2009. V. 16, P. 809-21.

66. Grant, S. F. and Hakonarson, H. Microarray technology and applications in the arena of genome-wide association // Clin Chem., 2008. V. 54, P. 1116-24.

67. Gudbjartsson, D. F., Walters, G. В., Thorleifsson, G., Stefansson, H., Halldorsson, В. V., Zusmanovich, P., Sulem, P., et al. Many sequence variants affecting diversity of adult human height // Nat Genet., 2008. V. 40, P. 609-15.

68. Gulcher, J. R., Kong, A. and Stefansson, K. The role of linkage studies for common diseases // Сип-Орт Genet Dev., 2001. V. 11, P. 264-7.

69. Gunnell, D., Okasha, M., Smith, G. D., Oliver, S. E., Sandhu, J. and Holly, J. M. Height, leg length, and cancer risk: a systematic review // Epidemiol Rev, 2001. V. 23, P. 313-42.

70. Guo, X., Zhang, Z., Gerstein, M. B. and Zheng, D. Small RNAs originated from pseudogenes: cis-or trans-acting? // PLoS Comput Biol., 2009. V. 5, P. el000449.

71. Guo, Y. F., Shen, H., Liu, Y. J., Wang, W., Xiong, D. H., Xiao, P., Liu, Y. Z., et al. Assessment of genetic linkage and parent-of-origin effects on obesity // J Clin Endocrinol Metab., 2006. V. 91, P. 4001-5.

72. Hager, R., Cheverud, J. M. and Wolf, J. B. Maternal effects as the cause of parent-of-origin effects that mimic genomic imprinting // Genetics, 2008. V. 178, P. 1755-1762.

73. Haig, D. Genomic imprinting and the theory of parent-offspring conflict. // Semin. Dev. Biol., 1992. -V. 3, P. 153-160.

74. HajMohammadi, S., Enjyoji, K., Princivalle, M., Christi, P., Lech, M., Beeler, D., Rayburn, H., et al. Normal levels of anticoagulant heparan sulfate are not essential for normal hemostasis // J Clin Invest., 2003. V. Ill, P. 989-99.

75. Harbron, C. A pedigree-based algorithm for finding efficient peeling sequences // IMA J. Math. Appl. Med. Biol., 1995. -V. 12, P. 13-27.

76. He, M., Gitschier, J., Zerjal, Т., de Knijff, P., Tyler-Smith, C. and Xue, Y. Geographical affinities of the HapMap samples // PLoS One, 2009. V. 4, P. 4.

77. Hebebrand, J. and Hinney, A. Environmental and genetic risk factors in obesity // Child Adolesc Psychiatr Clin N Am., 2009. V. 18, P. 83-94.

78. Heilbronn, L. K. and Campbell, L. V. Adipose tissue macrophages, low grade inflammation and insulin resistance in human obesity // Curr Pharm Des, 2008. V. 14, P. 1225-30.

79. Higginbotham, H. R. and Gleeson, J. G. The centrosome in neuronal development // Trends Neurosci., 2007. V. 30, P. 276-83.

80. Hirschhom, J. N. and Daly, M. J. Genome-wide association studies for common diseases and complex traits // Nat Rev Genet., 2005. V. 6, P. 95-108.

81. Holmans, P. Nonparametric Linkage. John Wiley & Sons, 2001. - P. 487-505.

82. Hopper, J. L. and Mathews, J. D. Extensions to multivariate normal models for pedigree analysis // Ann Hum Genet., 1982. V. 46, P. 373-83.

83. Johnson, A. D. and O'Donnell, C. J. An open access database of genome-wide association results // BMC Med Genet., 2009. V. 10, P. 6.

84. Kamiguchi, H. and Lemmon, V. IgCAMs: bidirectional signals underlying ncurite growth // Curr Opin Cell Biol., 2000. V. 12, P. 598-605.

85. Kang, J. S., Feinleib, J. L., Knox, S., Ketteringham, M. A. and Krauss, R. S. Promyogenic members of the Ig and cadherin families associate to positively regulate differentiation // Proc Natl Acad Sci U S A., 2003. V. 100, P. 3989-94.

86. Kawauchi, T. and Hoshino, M. Molecular pathways regulating cytoskeletal organization and morphological changes in migrating neurons // Dev Neurosci, 2008. — V. 30, P. 36-46.

87. Keller, D. I., Grenier, J., Christe, G., Dubouloz, F., Ossvvald, S., Brink, M., Ficker, E., et al. Characterization of novel KCNH2 mutations in type 2 long QT syndrome manifesting as seizures // Can J Cardiol., 2009. V. 25, P. 455-62.

88. Kirichenko, A. V., Belonogova, N. M., Aulehenko, Y. S. and Axenovich, Т. I. PedStr software for cutting large pedigrees for haplotyping, IBD computation and multipoint linkage analysis // Ann Hum Genet., 2009a. V. 73, P. 527-31.

89. Kirichenko, A. V., Belonogova, N. M., Aulehenko, Y. S. and Axenovich, Т. I. PedStr software for cutting large pedigrees for haplotyping, IBD computation and multipoint linkage analysis // Ann Hum Genet., 2009b. V. 73, P. 527-31. Epub 2009 Jul 9.

90. Knowler, W. C., Williams, R. C., Pettitt, D. J. and Steinberg, A. G. Gm3;5,13,14 and type 2 diabetes mellitus: an association in American Indians with genetic admixture // Am J Hum Genet, 1988. -V. 43, P. 520-6.

91. Maes, H. H., Neale, M. C. and Eaves, L. J. Genetic and environmental factors in relative body weight and human adiposity// Behav Genet., 1997. V. 27, P. 325-51.

92. Magnusson, P. K. and Rasmussen, F. Familial resemblance of body mass index and familial risk of high and low body mass index. A study of young men in Sweden // Int J Obes Relat Metab Disord., 2002. -V. 26, P. 1225-31.

93. Maheshwari, A., Kurundkar, A. R., Shaik, S. S., Kelly, D. R., Hartman, Y., Zhang, W., Dimmitt, R., et al. Epithelial cells in fetal intestine produce chemerin to recruit macrophages // Am J Physiol Gastrointest Liver Physiol., 2009. V. 297, P. G1-G10.

94. Malavaki, C., Mizumoto, S., Karamanos, N. and Sugahara, K. Recent advances in the structural study of functional chondroitin sulfate and dermatan sulfate in health and disease // Connect Tissue Res, 2008. V. 49, P. 133-9.

95. Marchini, J., Donnelly, P. and Cardon, L. R. Genome-wide strategies for detecting multiple loci that influence complex diseases // Nat Genet., 2005. V. 37, P. 413-7.

96. Mascie-Taylor, C. G. and Goto, R. Human variation and body mass index: a review of the universality of BMI cut-offs, gender and urban-rural differences, and secular changes // J Physiol Anthropol.; 2007. V. 26, P. 109-12.

97. Mayeux, R. Mapping the new frontier: complex genetic disorders // J Clin Invest., 2005. V. 115, P. 1404-7.

98. Melkonyan, H. S., Chang, W. C., Shapiro, J. P., Mahadevappa, M., Fitzpatrick, P. A., Kiefer, M. C., Tomei, L. D., et al. SARPs: a family of secreted apoptosis-related proteins // Proc Natl Acad SciUSA., 1997.-V. 94, P. 13636-41.

99. Michalak, P. Coexpression, coregulation, and со functionality of neighboring genes in eukaryotic genomes // Genomics., 2008. -V. 91, P. 243-8.

100. Millington, G. W. Genomic imprinting and dermatological disease // Clin Exp Dermatol, 2006. V. 31, P. 681-8.

101. Mizugishi, K., Yamashita, Т., Olivera, A., Miller, G. F., Spiegel, S. and Praia, R. L. Essential role for sphingosine kinases in neural and vascular development // Mol Cell Biol., 2005. V. 25, P. 11113-21.

102. Mohlke, K. L., Skol, A. D., Scott, L. J., Valle, Т. Т., Bergman, R. N., Tuomilehto, J.5 Boelmke, M., et al. Evaluation of SLC2A10 (GLUT10) as a candidate gene for type 2 diabetes and related traits in Finns // Mol Genet Metab., 2005. V. 85, P. 323-7.

103. Monastyrskaya, К., Babiychuk, E. В. and Draeger, A. The annexins: spatial and temporal coordination of signaling events during cellular stress // Cell Mol Life Sci., 2009. V. 66, P. 2623-42.

104. Monks, S. A. and Kaplan, N. L. Removing the sampling restrictions from family-based tests of association for a quantitative-trait locus // Am J Hum Genet, 2000. V. 66, P. 576-92.

105. Moore, K. L. The biology and enzymology of protein tyrosine O-sulfation // J Biol Chem., 2003. -V. 278, P. 24243-6.

106. Moore, T. and Mills, W. Evolutionary theories of imprinting—enough already! // Adv Exp Med Biol, 2008. V. 626, P. 116-22.

107. Morison, I. M., Ramsay, J. P. and Spencer, H. G. A census of mammalian imprinting // Trends Genet, 2005.-V. 21, P. 457-65.

108. Mukhopadhyay, N. and Weeks, D. E. Linkage analysis of adult height with parent-of-origin effects in the Framingham Heart Study // BMC Genet., 2003. V. 4 Suppl 1, P. S76.

109. Nijhawan, D., Honarpour, N. and Wang, X. Apoptosis in neural development and disease // Annu Rev Neurosci, 2000. V. 23, P. 73-87.

110. Norgan, N. G. and Ferro-Luzzi, A. Weight-height indices as estimators of fatness in men // Hum Nutr Clin Nutr, 1982. V. 36, P. 363-72.

111. O'Connell, J. R. and Weeks, D. E. PedCheck: a program for identification of genotype incompatibilities in linkage analysis // Am J Hum Genet., 1998. V. 63, P. 259-66.

112. Ogden, C. L., Fryar, C. D., Carroll, M. D. and Flegal, К. M. Mean body weight, height, and body mass index, United States 1960-2002 // Adv E>ata., 2004. V. P. 1-17.

113. Ohtake, S., Kiniata, K. and Habuchi, O. Recognition of sulfation pattern of chondroitin sulfate by uronosyl 2-O-sulfotransferase // J Biol Chem., 2005. V. 280, P. 39115-23.

114. Okada, A., Charron, F., Morin, S., Shin, D. S., Wong, K., Fabre, P. J., Tessier-Lavigne, M., et al. Boc is a receptor for sonic hedgehog in the guidance of commissural axons // Nature., 2006. -V. 444, P. 369-73.

115. Omichi, C., Momose, Y. and Kitahara, S. Congenital long QT syndrome presenting with a history of epilepsy: Misdiagnosis or relationship between channelopathies of the heart and brain? // Epilepsia, 2009. V. 19, P. 19.

116. Pearson, T. A. and Manolio, T. A. How to interpret a genome-wide association study // Jama., 2008. -V. 299, P. 1335-44.

117. Peltonen, L. Positional cloning of disease genes: advantages of genetic isolates // Hum Hered., 2000.-V. 50, P. 66-75.

118. Peltonen, L., Palotie, A. and Lange, K. Use of population isolates for mapping complex traits // Nat Rev Genet., 2000. V. 1, P. 182-90.

119. Perry, R. J., Farquharson, C. and Ahmed, S. F. The role of sex steroids in controlling pubertal growth // Clin Endocrinol (Oxf). 2008. V. 68, P. 4-15. Epub 2007 Jul 20.

120. Phillips, K. and Matheny, A. P., Jr. Quantitative genetic analysis of longitudinal trends in height: preliminary results from the Louisville Twin Study // Acta Genet Med Gemellol, 1990. V. 39, P. 143-63.

121. Pizzi, M. A. and Crowe, M. J. Matrix metalloproteinases and proteoglycans in axonal regeneration // Exp Neurol., 2007. V. 204, P. 496-511.

122. Polasek, O., Marusic, A., Rotim, K., Hayward, C., Vitart, V., Huffman, J., Campbell, S., et al. Genome-wide association study of anthropometric traits in Korcula Island, Croatia // Croat Med J., 2009. V. 50, P. 7-16.

123. Price, A. L., Patterson, N. J., Plenge, R. M., Weinblatt, M. E., Shadick, N. A. and Reich, D. Principal components analysis corrects for stratification in genome-wide association studies // Nat Genet, 2006. V. 38, P. 904-9.

124. Pritchard, J. K., Stephens, M., Rosenberg, N. A. and Donnelly, P. Association mapping in structured populations // Am J Hum Genet, 2000. V. 67, P. 170-81.

125. Rabinowitz, D. and Laird, N. A unified approach to adjusting association tests for population admixture with arbitrary pedigree structure and arbitrary missing marker information // Hum Hered, 2000. V. 50, P. 211-23.

126. Rampersaud, E., Mitchell, B. D., Naj, A. C. and Pollin, Т. I. Investigating parent of origin effects in studies of type 2 diabetes and obesity // Curr Diabetes Rev, 2008. V. 4, P. 329-39.

127. Rannala, B. Finding genes influencing susceptibility to complex diseases in the post-genome era // Am J Pharmacogenomics, 2001. V. 1, P. 203-21.

128. Reissner, C., Klose, M., Fairless, R. and Missler, M. Mutational analysis of the neurexin/neuroligin complex reveals essential and regulatory components // Proc Natl Acad Sci USA., 2008. -V. 105, P. 15124-9.

129. Risch, N. J. Searching for genetic determinants in the new millennium // Nature., 2000. V. 405, P. 847-56.

130. Riz, I., Lee, H. J., Baxter, К. K., Behnam, R., Hawley, T. S. and Hawley, R. G. Transcriptional activation by TLX1/HOX11 involves Gro/TLE corepressors // Biochem Biophys Res Commun., 2009. -V. 380, P. 361-5.

131. Rothman, K. J. No Adjustments Are Needed for Multiple Comparisons // Epidemiology, 1990. V. 1,P. 43-46.

132. Saarni, S. E., Saarni, S. I., Fogelholm, M., Heliovaara, M., Perala, J., Suvisaari, J. and Lonnqvist, J. Body composition in psychotic disorders: a general population survey // Psychol Med., 2009. -V. 39, P. 801-10.

133. Satoh, W., Matsuyama, M., Takemura, H., Aizawa, S. and Shimono, A. Sfrpl, Sfrp2, and Sfrp5 regulate the Wnt/beta-catenin and the planar cell polarity pathways during early trunk formation in mouse // Genesis., 2008. V. 46, P. 92-103.

134. Shirane, M. and Nakayama, К. I. Protrudin induces neurite formation by directional membrane trafficking// Science., 2006. V. 314, P. 818-21.

135. Silventoinen, K., Sammalisto, S., Perola, M., Boomsma, D. I., Comes, В. K., Davis, C., Dunkel, L., et al. Heritability of adult body height: a comparative study of twin cohorts in eight countries // Twin Res., 2003. V. 6, P. 399-408.

136. Smith, C., Gibson, D. F. and Tait, J. F. Transmembrane voltage regulates binding of annexin V and lactadherin to cells with exposed phosphatidylserine // BMC Biochem., 2009. V. 10, P. 5.

137. Spielman, R. S., McGinnis, R. E. and Ewens, W. J. Transmission test for linkage disequilibrium: the insulin gene region and insulin-dependent diabetes mellitus (IDDM) // Am J Hum Genet, 1993.-V. 52, P. 506-16.

138. Stoger, R. Epigenetics and obesity // Pharmacogenomics, 2008. V. 9, P. 1851-60.

139. Stone, M. J., Chuang, S., Hou, X., Shoham, M. and Zhu, J. Z. Tyrosine sulfation: an increasingly recognised post-translational modification of secreted proteins // N Biotechnol., 2009. V. 25, P. 299-317.

140. Sudhof, Т. C. Neuroligins and neurexins link synaptic function to cognitive disease // Nature., 2008. V. 455, P. 903-11.

141. Sun, W., Hu, W., Xu, R., Jin, J., Szulc, Z. M., Zhang, G., Galadari, S. H., et al. Alkaline ceramidase 2 regulates betal integrin maturation and cell adhesion // Faseb J., 2009. V. 23, P. 656-66.

142. Terwilliger, J. D., Zollner, S., Laan, M. and Paabo, S. Mapping genes through the use of linkage disequilibrium generated by genetic drift: 'drift mapping' in small populations with no demographic expansion // Hum Hered., 1998. V. 48, P. 138-54.

143. Thomas, A. Optimal computation of probability functions for pedigree analysis // IMA J Math Appl Med Biol, 1986. V. 3, P. 167-78.

144. Thomas, Т., Voss, A. K., Chowdhury, K. and Gruss, P. Querkopf, a MYST family histone acetyltransferase, is required for normal cerebral cortex development // Development., 2000. -V. 127, P. 2537-48.

145. Veazie, P. J. When to combine hypotheses and adjust for multiple tests // Health Serv Res., 2006. -V. 41, P. 804-18.

146. Visscher, P. M. Sizing up human height variation // Nat Genet., 2008. V. 40, P. 489-90.

147. Visscher, P. M., Macgregor, S., Benyamin, В., Zhu, G., Gordon, S., Medland, S., Hill, W. G., et al. Genome partitioning of genetic variation for height from 11,214 sibling pairs // Am J Hum Genet., 2007.-V. 81, P. 1104-10. Epub 2007 Oct 1.

148. Wacholder, S., Chanock, S., Garcia-Closas, M., El Ghormli, L. and Rothman, N. Assessing the probability that a positive report is false: an approach for molecular epidemiology studies // J Natl Cancer Inst., 2004. -V. 96, P. 434-42.

149. Wakefield, J. Reporting and interpretation in genome-wide association studies // Int J Epidemiol., 2008.-V. 37, P. 641-53.

150. Watanabe, Т., Totoki, Y., Toyoda, A., Kaneda, M., Kuramochi-Miyagawa, S., Obata, Y., Chiba, H., et al. Endogenous siRNAs from naturally formed dsRNAs regulate transcripts in mouse oocytes // Nature., 2008. V. 453, P. 539-43.

151. Weedon, M. N., Lango, H., Lindgren, С. M., Wallace, C., Evans, D. M., Mangino, M., Freathy, R. M., et al. Genome-wide association analysis identifies 20 loci that influence adult height // Nat Genet., 2008. V. 40, P. 575-83.

152. Wehder, L., Arndt, S., Murzik, U., Bosserhoff, A. K., Kob, R., von Eggeling, F. and Melle, C. Annexin A5 is involved in migration and invasion of oral carcinoma // Cell Cycle., 2009. V. 8, P. 1552-8.

153. Whittaker, J. C., Gharani, N., Hindmarsh, P. and McCarthy, M. I. Estimation and testing of parent-of-origin effects for quantitative traits // Am J Hum Genet, 2003. V. 72, P. 1035-9.

154. Wilier, C. J., Speliotes, E. K., Loos, R. J., Li, S., Lindgren, С. M., Heid, I. M., Berndt, S. I., et al. Six new loci associated with body mass index highlight a neuronal influence on body weight regulation // Nat Genet., 2009. V. 41, P. 25-34.

155. WTCCC Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls // Nature, 2007. V. 447, P. 661-78.

156. Wu, G. and Meininger, C. J. Nitric oxide and vascular insulin resistance // Biofactors., 2009. V. 35, P. 21-7.

157. Xu, R., Jin, J., Hu, W., Sun, W., Bielawski, J., Szulc, Z., Taha, Т., et al. Golgi alkaline ceramidase regulates cell proliferation and survival by controlling levels of sphingosine and SIP // Faseb J., 2006.-V. 20, P. 1813-25.

158. Zaykin, D. V., Young, S. S. and Westfall, P. H. Using the false discovery rate approach in the genetic dissection of complex traits: a response to Weller et al // Genetics., 2000. V. 154, P. 1917-8.

159. Zaykin, D. V. and Zhivotovsky, L. A. Ranks of genuine associations in whole-genome scans // Genetics., 2005.-V. 171, P. 813-23.

160. Zeller, C., Hinzmann, В., Seitz, S., Prokoph, H., Burkhard-Goettges, E., Fischer, J., Jandrig, В., ct al. SASH1: a candidate tumor suppressor gene on chromosome 6q24.3 is downregulated in breast cancer // Oncogene., 2003. V. 22, P. 2972-83.

161. Zhao, J., Bradfield, J. P., Li, M., Wang, K., Zhang, H., Kim, С. E., Annaiah, K., et al. The Role of Obesity-associated Loci Identified in Genome-wide Association Studies in the Determination of Pediatric BMI // Obesity, 2009. V. 28, P. 28.

162. Zimmermann, D. R. and Dours-Zimmermann, M. T. Extracellular matrix of the central nervous system: from neglect to challenge // Histochem Cell Biol., 2008. V. 130, P. 635-53.