Бесплатный автореферат и диссертация по биологии на тему
Популяционно-генетическая адаптация человека к природным и антропогенным факторам среды
ВАК РФ 03.02.07, Генетика
Автореферат диссертации по теме "Популяционно-генетическая адаптация человека к природным и антропогенным факторам среды"
На правах рукописи
^ОО/О--
Боринская Светлана Александровна
ГЕНЕТИЧЕСКАЯ АДАПТАЦИЯ ПОПУЛЯЦИЙ ЧЕЛОВЕКА К ПРИРОДНЫМ И АНТРОПОГЕННЫМ ФАКТОРАМ СРЕДЫ
03.02.07 - генетика АВТОРЕФЕРАТ
диссертации на соискание ученой степени доктора биологических наук
Москва - 2013
31 ОКТ 2013
005536549
Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте общей генетики им.Н.И. Вавилова Российской академии наук.
Научный консультант:
доктор биологических наук, член-корреспондент РАН Янковский Николай Казимирович
Официальные оппоненты:
Баранов Владислав Сергеевич
доктор медицинских наук, профессор, член-корреспондент РАМН
зав. лабораторией в Федеральном государственном бюджетном учреждении Научно-исследовательском институте акушерства и гинекологии им. Д.О. Отта Российской академии медицинских наук, г. Санкт-Петербург.
Гельфанд Михаил Сергеевич доктор биологических наук, профессор
зам. директора в Федеральном государственном бюджетном учреждении науки Институте проблем передачи информации им. A.A. Харкевича Российской академии наук, г. Москва.
Малярчук Борис Аркадьевич доктор биологических наук, профессор,
зав. лабораторией в Федеральном государственном бюджетном учреждении науки Институте биологических проблем Севера Дальневосточного отделения Российской академии наук, г. Магадан.
Ведущая организация:
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский государственный университет имени М.В. Ломоносова».
Защита состоится « 18 » ноября 2013 г. в 14 часов на заседании диссертационного совета Д 002.214.01 при Федеральном государственном бюджетном учреждении науки Институте общей генетики им. Н.И.Вавилова Российской академии наук (119991, Москва, ул. Губкина, д.З). Тел. 8(499)135-62-13; FAX: 8(499)132-89-62; E.mail: aspirantura@vigg.ru
С диссертацией можно ознакомиться в библиотеке ИОГен РАН
Учёный секретарь диссертационного совета Д 002.214.01 по защите докторских и кандидатских диссертаций, Синелыцикова Т.А.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы
Популяционно-генетическая адаптация к локальным условиям среды может быть представлена как изменение частот аллелей вследствие естественного отбора признаков, ассоциированных с этими аллелями и важных для выживания и успешной репродукции человека. Помимо процессов адаптации, на изменение частот аллелей влияют генетический дрейф и миграции. Исследования генетической адаптации человека занимает одно из центральных мест в биологической антропологии, генетике человека и эволюционной биологии, и уже дали значительный вклад в понимание взаимодействия средовых и генетических факторов, влияющих на здоровье человека.
Ранее при идентификации адаптации к локальной среде часто использовалось сравнение распределения фенотипов по отношению к средовым переменным, предположительно отражающим давление отбора. Такой подход был использован в классических исследованиях географического распределения аллелей бета-талассемии [Холдейн, 1949] и серповидноклеточной анемии [Эллисон, 1954], придающих устойчивость к малярии. Более поздние исследования дали прямые подтверждения «малярийной гипотезы».
Для проверки гипотез о вовлечении определенного фенотипа в процесс адаптации и выявлении факторов среды, эту адаптацию вызывающих, необходим сбор фенотипических данных, что дорого и требует значительного времени, анализа больших выборок для достижения статистически значимых показателей [Hancock et al., 2008, 2010]. В то же время в последнее десятилетие интенсивно развиваются подходы к выявлению паттернов вариаций в геноме человека, свидетельствующих о действии отбора. Участки генома, подверженные действию отбора, отличаются по ряду характеристик от участков с нейтральными генетическими вариациями [Gillespi et al., 1991]. Недавнее развитие технологий и ресурсов (проекты НарМар, «1000 геномов» и др.) для исследования генетических вариаций человека в беспрецедентном масштабе позволяет исследователям сканировать полные геномы человека в поиске сигналов позитивного отбора (см. обзор в [Hancock et al., 2008, 2010]). Для многих локусов, выявленных методом геномного сканирования как предполагаемых мишеней отбора, связь с фенотипическими признаками пока не известна [Coop et al., 2009]. Не известны и факторы отбора этих локусов. Наиболее очевидными факторами являются адаптация к геоклиматическим условиям, особенностям традиционного питания, эндемичным инфекциям и особенностям образа жизни. Эти факторы можно подразделить на природные (особенности климата или биоты) и антропогенные, возникшие в результате деятельности человека (хозяйственно-культурные различия, возникшие в результате развития земледелия, одомашнивания скота, изменения социальной структуры). Эти факторы тесно взаимодействуют. Хозяйственно-культурые особенности обществ зависят от климатических условий, экорегиона. При этом ведение хозяйства определенного типа трансформирует ландшафт, меняет биоразнообразие. Одомашнивание животных приводит не только к изменению особенностей питания, но и к передаче возбудителей новых для человека инфекций от скота и других животных. Развитие земледелия ведет к росту плотности населения, что, в свою очередь, приводит к изменению эпидемиологической ситуации. Развитие технологий хранения продуктов также ведет к появлению дополнительных источников инфекций, распространяемых, например, грызунами. Таким образом, хозяйственная деятельность человека приводит к возникновению новых факторов отбора, адаптация к которым приводит к изменению частот аллелей генов, вовлеченных в адаптацию, или появлению и распространению новых аллелей. Проживающие в одном экорегионе общества с различным хозяйственным укладом могут отличаться по таким антропогенным факторам и вследствие этого могут иметь генетические различия, связанные с адаптацией к этим факторам.
В выявлении факторов среды, вызывающих генетическую адаптацию популяций человека, важным является сопоставление вариаций частот аллелей в популяциях и наличия потенциального фактора отбора в среде либо интенсивности его действия.
Различия между популяциями по составу и частоте аллелей формируются либо в результате локус-специфичных процессов (различные виды отбора, направленные на один или несколько локусов, определяющих адаптивный фенотип), либо в результате событий популяционного уровня (колебания численности и экспансия популяций, метисация и др.), которые затрагивают множество локусов одновременно. К указаниям на возможное действие отбора относят высокую популяционную частоту либо гомозиготность по эволюционно «молодым» аллелям, присутствие в популяции протяженных гаплотипов с частотой, превышающей ожидаемую для случайного распределения размеров гаплотипов, экстремально высокий уровень межпопуляционных различий по частоте аллеля (высокий уровень Fst) [Sabeti et al., 2006]. Совпадение ареалов действия конкретных факторов среды и высокой частоты тех или иных аллелей позволяет предполагать их связь, но не доказывает её. Однако именно такое совпадение, после контроля возможных причин корреляции на популяционном уровне (контроля генетической структурированности популяций), является основой для выдвижения и дальнейшей проверки гипотез о факторах отбора, влияющих на частоты аллелей в популяциях человека. Прямое доказательство таких гипотез может быть получено, если будет показана связь фенотипа и меры приспособленности (выживаемости или репродуктивного успеха) [Hancock et al., 2008, 2010].
Развитие данного направления исследований важно для понимания биологических основ заболеваний человека. Как вид Homo sapiens уникален в том, что имеет широчайший ареал расселения и за счет биологических и культурных адаптаций приспособлен к самым различным экорегионам, использованию различных стратегий ведения хозяйства и источников пищи. На протяжении большей части своего существования как вида человек вел образ жизни охотника-собирателя. С появлением производящего хозяйства возникли новые векторы давления отбора - переход на новый тип питания, изменение демографических характеристик обществ, появление новых источников инфекций в результате перехода к оседлому образу жизни, развитию технологий хранения продуктов, одомашнивания животных. В рамках гипотезы об «экономичных генах» («thrifty» гипотеза [Neel et al., 1998, 1999]) предполагается, что аллели генов, обеспечивших эффективное использование дефицитных нутриентов (сахаров, холестерина, соли) у охотников-собирателей, после развития производства продуктов и особенно в индустриализованных обществах стали аллелями риска соответствующих заболеваний (диабета, атеросклероза, гипертонии).
Выявление аллелей генов, являющихся факторами риска развития широкораспространенных заболеваний в одних условиях среды и протективных или нейтральных в других условиях среды, актуально как с точки зрения генетики человека и эволюционной биологии, так и для фундаментальных аспектов антропологии и практического здравоохранения.
Для исследования влияния природных и антропогенных факторов на частоты аллелей в популяциях человека и их связь с важными для здоровья признаками актуальными являются междисциплинарные исследования, дающие новые подходы к пониманию путей и механизмов адаптации популяций человека изменяющимся условиям среды. Такие исследования предпринимались в отношении климатических факторов [Coop et al., 2009; Hancock et al., 2008a] и эндемичных инфекций [Fumigalli et al., 2011]. Обширный массив сведений о факторах среды, влияющих на организм человека (особенности диеты, распространение инфекций и многие другие), содержится в базах данных, ранее сформированных исследователями в областях гуманитарных наук. Это в первую очередь база данных Дж.П. Мердока «Этнографический атлас». Такие базы пока крайне мало использовались в популяционно-генетических исследованиях человека [Gugliemino et al., 1995; Bersaglieri et al., 2004; Hancock et al., 2008b, 2010]. Они содержат информацию о сотнях этнических групп, которые, в случае географической компактности
обитания, могут рассматриваться как популяции. Использование данных «Этнографического атласа» для выявления корреляций с частотами аллелей популяций, обитающих в тех же регионах, может дать информацию о тех генах, аллели которых важных для адаптации к факторам.
ЦЕЛЬ И ЗАДАЧИ ИССЛЕДОВАНИЯ
Цель исследования - разработка подхода к выявлению генов человека, потенциально вовлеченных в популяционно-генетическую адаптацию к окружающей среде за счет изменения частот аллелей, и выявлению факторов среды, связанных с этой адаптацией, и апробация этого подхода для выявления природных и антропогенных факторов среды, влияющих на изменение частот аллелей генов, ассоциированных с важными для здоровья признаками.
Задачи исследования
1. Анализ литературных данных для выявления генов - потенциальных мишеней отбора, для которых известны частоты аллелей в большом количестве популяций мира, обитающих в контрастных условиях среды.
2. Исследовать характер географического распределения частот аллелей этих генов.
3. Сформировать коллекции биологических образцов из популяций, закрывающих «белые пятна» на геногеографической карте. Определить в этих образцах аллельный статус по генам - потенциальным мишеням действия отбора. Сформировать базы данных частот аллелей выбранных генов по опубликованным и собственным экспериментальным данным.
4. Определить фенотипические различия, детерминированные носительством разных аллелей исследуемых генов, их возможную роль в процессе адаптации и сопряженное влияние адаптивных аллелей на признаки, важные для здоровья людей.
5. Выявить средовые факторы, с которыми коррелируют частоты аллелей в популяциях.
6. Проанализировать соответствие распределения частот аллелей генетической структурированности популяций как альтернативное объяснение обусловленных отбором корреляций со средовыми факторами.
НАУЧНАЯ НОВИЗНА
В работе получены следующие оригинальные результаты:
Предложен новый подход к выявлению генов человека, потенциально вовлеченных в популяционно-генетическую адаптацию к окружающей среде, и факторов, связанных с адаптацией, на основе сравнения межпопуляционных различий в частотах аллелей и формализованных этнографических описаний, соответствующих популяциям этнических групп.
Экспериментально установлены частоты аллелей генов АРОЕ, ЬСТ, ССЯ5, АОН1В для популяций России и ряда сопредельных стран, из которых большинство было ранее не исследовано, а для некоторых были опубликованы ошибочные данные.
Созданы базы данных по частотам изученных аллелей генов АРОЕ, ЬСТ , ССЯ5, АИШВ.
Показано клинапьное (по широте) распределение частот аллелей еЗ и е4 в популяциях Африки и Евразии, при этом предковый аллель е4 достигает максимальной частоты в северных (субарктических) и южных (субсахарских) популяциях. Выдвинута гипотеза об участии гена АРОЕ в адаптации к климатическим условиям.
Показано, что частота аллеля е4 положительно коррелирует с вкладом охоты собирательства в хозяйство, и что ассоциация с охотой-собирательством выше, чем с
широтой. Такой анализ впервые проведен на количественных данных о вкладе охоты-собирательства в хозяйство.
Показано, что в популяциях Европейской части России гиполактазия детерминируется преимущественно или исключительно генотипом С/С по полиморфизму ¿СГ*-13910. Выявлено расхождение частот генотипа С/С и частот гиполактазии в азиатских популяциях, что указывает на возможное наличие в них других генетических детерминантов гиполактазии/персистенции лактазы у взрослых.
Дана косвенная оценка верхней возрастной границы снижения синтеза лактазы (22 года) у русских носителей генотипа С/С по полиморфизму ЬСТ*-139 ЮС/Т.
На основе сравнения частот аллеля СС1{5с1е132 в современных и исторических популяциях Евразии выдвинута гипотеза о том, что фактор отбора этого аллеля действовал до 3000 лет назад, и продолжал действовать также и после этого периода времени.
Показано наличие слабого (ОЯ = 1.22, С/95% = 1.10-1.36).), но статистически значимого (р=0.0002) протективного эффекта гетерозиготного носительства аллеля СС11511е132 в отношении ВИЧ-инфицирования на основе данных мета-анализа. Впервые дана оценка возможных межпопуляционных различий инфицируемости ВИЧ и выживаемости ВИЧ-инфицированных в зависимости от различий в популяционных частотах аллеля ССН5/1е132.
На основе собственных и опубликованных данных о частоте протективного в отношении алкоголизма аллеля АЫ)Н2 *504Ьу$ определено географическое распределение частот этого аллеля в Евразии для 190 популяций. Во всех исследованных популяциях РФ частота этого аллеля не превышает 1-2%. Таким образом, вклад носительства аллеля АЫ)Н2*504Ьу5 в генетически обусловленное снижение риска развития алкоголизма на популяционном уровне не может быть значительным для населения РФ.
На основе собственных и литературных данных для 172 популяций Евразии определен характер его географического распределения частот аллеля ЛИН]В*48Шх. Частота встречаемости этого аллеля, обладающего протективным действием в отношении алкоголизма, экспериментально установлена в 27 популяциях, представляющих 20 этнических групп Евразии.
Показано, что по частотам аллелей ЛОН1В*48Ш$ и АЬОН2*504Ьу8, а следовательно и по особенностям метаболизма этанола, определяемым ферментами, кодируемыми этими генами, русские не отличаются от других народов Европы
Показано, что носительство данного аллеля у русских является протективным в отношении запоев.
На основе анализа корреляций частот аллеля АВН1В*48Ш$ в популяциях Северной Африки и Евразии с распространенностью эндемичных инфекций в тех же популяциях выдвинута гипотеза о протективном действии этого аллеля в отношении филяриозов. Указаны методы экспериментальной проверки предложенной гипотезы.
ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ
Показано, что в популяциях европейской части России гиполактазия детерминируется преимущественно или исключительно генотипом С/С ЬСТ-139 ЮС/Т. Это дает основания для выбора данного генотипа как единичной мишени для ДНК диагностики гиполактазии в этих популяциях. Нераспознанная вовремя гиполактазия приводит к ухудшению качества жизни, которое может быть снято рекомендациями по диете. Доля взрослых индивидов, неспособных к усвоению цельного молока, составляет до 36% в европейской части России увеличиваясь до более 70% в коренном населении азиатской части РФ. С учетом высокой пенетрантности (до 100%) столь высокие частоты носительства данного генотипа делают практически значимым проведение ДНК-диагностики гиполактазии по носительству данного генотипа, в том числе предиктивной. Такая диагностика представляется особенно целесообразной, поскольку проявление
генетически детерминированной гиполактазии у части индивидов ошибочно приписывается другим заболеваниям.
Показано наличие слабого (ОЯ= 1.22), но статистически значимого протективного эффекта гетерозиготного носительства аллеля ССК5йеВ2 в отношении ВИЧ-инфицирования на основе данных мета-анализа. Дана оценка возможных межпопуляционных различий инфицируемости ВИЧ и выживаемости ВИЧ-инфицированных в зависимости от различий в популяционных частотах аллеля ССШе132.
На основе анализа корреляций частот аллеля АВН1В*48Ш$ с распространенностью эндемичных инфекций в тех же популяциях выдвинута гипотеза о протективном действии этого аллеля в отношении филяриозов и указаны методы экспериментальной проверки предложенной гипотезы. Это открывает путь к выявлению молекулярно-генетических механизмов, определяющих повышенную устойчивость или предрасположенность к данному заболеванию, затрагивающему большее количество индивидов (около 120 млн человек), чем все известные моногенно контролируемые наследственные заболевания человека.
Показано, что носительство аллеля АОН1В*48Шз у русских является протективным в отношении запоев.
Получены собственные и проанализированы литературные данные о частоте протективного в отношении алкоголизма аллеля АЬОН2*504Ьу5. Во всех исследованных популяциях РФ частота этого аллеля не превышает 1-2%. Таким образом, вклад носительства аллеля АЬОН2*504Ьуя в генетически обусловленное снижение риска развития алкоголизма на популяционном уровне не может быть значительным для населения РФ.
Результаты работы использовались
- в лекциях для студентов, аспирантов, прочитанных в рамках курса «спецглавы генетики» на кафедре генетики биологического факультета МГУ и курса общей биологии на факультете молекулярной и биологической физики МФТИ;
- в лекциях на курсах повышения квалификации учителей биологии биологического факультета МГУ;
- в общеобразовательных лекциях и выступлениях автора и других специалистов на общероссийских каналах телевидения и радио, публиковались в общероссийских средствах массовой информации.
ОСНОВНЫЕ ПОЛОЖЕНИЯ, ВЫНОСИМЫЕ НА ЗАЩИТУ
Предложен новый подход к выявлению генов человека, потенциально вовлеченных в популяционно-генетическую адаптацию к окружающей среде, и факторов, связанных с адаптацией, на основе сравнения межпопуляционных различий в частотах аллелей и формализованных этнографических описаний соответствующих изучаемым популяциям этнических групп.
Выдвинута гипотеза об участии гена АРОЕ в адаптации к климатическим условиям.
Изменение частот аллелей АРОЕ коррелирует с вкладом охоты-собирательства в хозяйство: частота аллеля е4 выше в популяциях охотников-собирателей.
В популяциях европейской части России гиполактазия детерминируется преимущественно или исключительно генотипом С/С ¿СГ-13910. Выявлено расхождение частот генотипа С/С и частот гиполактазии в азиатских популяциях, что указывает на возможное наличие в них других генетических детерминантов
гиполактазии/персистенции лактазы у взрослых.
Впервые для русских получена оценка возраста (22 года) фенотипического проявления различий между носителями генотипа С/С LCT-13910 и аллеля Т.
На основе сравнения частот аллеля CCR5del32 в современных и исторических популяциях Евразии выдвинута гипотеза о том, что фактор отбора этого аллеля действовал на протяжении нескольких тысяч лет.
Гетерозиготное носительство аллеля CCR5del32 обладает слабым (OR=1.22), но статистически значимым протективным эффектом в отношении ВИЧ-инфицирования, что показано на основе данных мета-анализа. Дана оценка возможных межпопуляционных различий инфицируемости ВИЧ и выживаемости ВИЧ-инфицированных в зависимости от различий в популяционных частотах аллеля CCR5del32. На популяционном уровне вклад аллеля CCR5del32 в выживаемость и инфицируемость ВИЧ относительно невелик.
На основе собственных экспериментальных и опубликованных данных о частоте протективного в отношении алкоголизма аллеля ALDH2*504Lys распределение частот этого аллеля в Евразии. Во всех исследованных популяциях РФ частота этого аллеля не превышает 1-2%. Таким образом, вклад носительства аллеля ALDH2*504Lys в генетически обусловленное снижение риска развития алкоголизма на популяционном уровне не может быть значительным для населения РФ.
Частота встречаемости аллеля ADHlB*48His, обладающего протективным действием в отношении алкоголизма, экспериментально установлена в 27 популяциях, представляющих 20 этнических групп Евразии. На основе собственных и литературных данных для 172 популяций определен характер географического распределения его частот в Евразии. Для исследованных популяций РФ частота этого аллеля варьирует от 3-8% для населения европейской части страны до более 30% для коренного населения Южной Сибири и Дальнего Востока
Показано, что по частотам аллелей ADHlB*48His и ALDH2*504Lys генов алкогольдегидрогеназы и альдегиддегирогеназы, а следовательно и по особенностям метаболизма этанола, определяемым ферментами, кодируемыми этими генами, русские не отличаются от других народов Европы.
Показано, что носительство аллеля ADHlB*48His у русских является протективным в отношении запоев.
На основе анализа корреляций частот аллеля ADHlB*48His с распространенностью эндемичных инфекций в тех же популяциях выдвинута гипотеза о протективном действии этого аллеля в отношении филяриозов; указаны методы экспериментальной проверки предложенной гипотезы
АПРОБАЦИЯ РАБОТЫ
Основные результаты были доложены на следующих семинарах, конференциях и конгрессах: 31st Annual Meeting Society for Cross-Cultural Research, Santa Fe, США, 2002; Molecular Evolution, Genomics and Bioinformatics , Sorrento, Италия, 2002; Human Origin and Disease Meeting, Cold Spring Harbor, США, 2002; Семинаре Нью-йоркского музея Естественной истории (Museum of Natural History), October 29, 2002, New York, США; Международная конференция "Новые информационные технологии в медицине и экологии", Ялта-Гурзуф, Украина, 2002; BGRS, Novosibirsk, 2002; 32nd Annual Meeting of Society for Cross-Cultural Research, Charleston, SC, США, 2003; Актуальные проблемы генетики, Москва, 2003; I Украинский конгресс по клинической генетике с международным участием "Метаболические наследственные заболевания". Харьков, Украина, 2003; 33rd Annual Meeting of Society for Cross-Cultural Research, San Jose, California, США, 2004; International workshop on nutrition and health of indigenous people of the North (NUHIP), Oulu, Финляндия, 2004; Ш Съезде Вавиловского общества генетиков и селекционеров, Москва, 2004; 14th Congress of European Anthropological Association "Human variability: A bridge between sciences and humanities". Komotini, Греция, 2004; 4th International Iran and Russia Conference "Agriculture and Natural Resources" ShahrKord, Иран, 2004;Научной сессии Отделения информационных технологий и вычислительных
систем РАН (ОИТВС РАН) «Информационные технологии в биологии» («Биоинформатика») 20 января 2004 г., Москва; 34th Annual Meeting of the Society for Cross Cultural Research and First General Scholarly Meeting of the Society for Anthropological Sciences. Santa Fe, New Mesico, США, 2005; Human Genome Meeting-2005, Kyoto, Япония, 2005; V съезд Российского общества медицинских генетиков, Уфа, 2005; VI Конгресс этнографов и антропологов России. Санкт-Петербург, 2005; Human Genome Meeting-2006, Helsinki, Финляндия, 2006; 7th Balkan Meeting of Human Genetics. Skopje, Республика Македония, 2006; Международная Школа-конференция «Поведение человека и животных: психологические, эволюционные и генетико-физиологические аспекты». Новосибирск, 2008; 39th European Human Genetics Conference (EHGC), Nice, Франция, 2007; Международная конференция, посвященная 90-летию академика Д.К.Беляева "Современные эволюционные представления в биологии, медицине и социологии". Новосибирск, 2007; Всероссийская конференция «Науки о жизни и образование. Фундаментальные проблемы интеграции» памяти профессора М.В. Гусева, Москва, 2009; Пятый Северный социально-экологический конгресс Москва, 2009; Пятый съезд Вавиловского общества генетиков и селекционеров, Москва, 2009; Международная научная конференция «Чарльз Дарвин и современная биология», Санкт-Петербург, 2009; Human Genome Meeting-2011, Dubai, OAE, 2011. World Congress of Epidemiology, Edinburgh, Шотландия, 2011.
Публикации
Материал диссертации опубликован в 58 отечественных научных журналах и сборниках, из них том числе 20 в журналах списка ВАК).
Личный вклад автора
Все результаты, представленные в работе, получены при непосредственном участии автора в период с 2002 по 2011 год. При постановке проблемы диссертационного исследования, формулировке целей и задач участие автора было определяющим.
Автор участвовал в планировании и проведении экспедиций по сбору популяционных коллекций образцов, руководил генотипированием, лично проводил сбор литературных данных ,создание баз данных, филогенетический анализ, интерпретацию и описание результатов. Большинство публикаций, приведенных в списке работ по теме диссертации, написаны лично автором.
Внедрение результатов работы. Результаты диссертационного исследования внедрены в научно-педагогическую практику Биологического факультета Московского государственного университета им. М.В. Ломоносова (Москва, Ленинские горы, д.1, стр. 12), Государственном университете «Московский физико-технический институт» (Московская область, г. Долгопрудный, Институтский переулок, 9).
Структура и объем диссертации
Диссертационная работа состоит из введения, описания материалов и методов, четырех глав, посвященных изучаемым генам с обзором литературы, описанием экспериментальных результатов и обсуждением для каждого гена, заключения, выводов и
списка литературы. Материал диссертации изложен на_страницах машинописного
текста, включая_рисунков и_таблиц. Список литературы содержит_работ, из
них_на иностранных языках.
работах в международных и 32 статьи по теме диссертации (в
МАТЕРИАЛЫ И МЕТОДЫ
Материалом для экспериментального исследования послужили биологические образцы неродственных индивидов, представляющих различные популяции России и других стран Евразии (табл. 1). Образцы были собраны в период 2001-2010 г под руководством или с участием автора. Сбор образцов проводился с соблюдением процедуры информированного согласия под контролем этической комиссии ИОГен РАН. Для индивидов, представляющих российские популяции, собиралась информация об этнической принадлежности предков двух поколений. Исследованные популяции представлены в разделах, описывающих экспериментальные результаты. Ряд популяционных коллекций биологических образцов или ДНК был предоставлен для исследования Е.И.Рогаевым (туркмены, москвичи), Э.К.Хуснутдиновой (татары, удмурты Пургинского р-на), В.А.Степановым (нивхи, удэгейцы, нанайцы, буряты агинские и курумканские), А.Р. Максимовым (калмыки), С. И. Куцевым (русские Ростовской обл). Сбор образцов, представляющих население арабских стран (студенты РУДН), проводился совместно с В.А.Кошечкиным под контролем этического комитета РУДН. Образцы для исследования ассоциации генотипов по гену ЬСТ с минеральной плотностью кости (МПК) были предоставлены В.Н. Петриным и С.Д. Арутюновым (МГМСУ), образцы ВИЧ-инфицированных пациентов - М.М. Гараевым (НИИ вирусологии), образцы для исследования влияния генов метаболизма алкоголя на потребление алкоголя и индивидуальные характеристики потребления алкоголя - Д. Леоном (ЛШГТМ). Протоколы исследования были утверждены этическими комитетами организаций, предоставивших образцы, либо этическим комитетом ИОГен РАН.
Табл.1. Общее количество проанализированных образцов
Название гена Кол-во популяций Кол-во образцов в популяционных коллекциях Кол-во образцов в исследовании ассоциации с фенотипами Всего образцов прогеноти-пировано
АРОЕ 16 1103 1103
LCT 18 1189 270 1459
CCR5 7 566 77 643
ALDH2 14 699 699
ADH1B 27 1722 642 2364
Выделение ДНК из образцов венозной крови проводилось фенол-хлороформным методом либо с помощью коммерческих наборов DNAPrep (Изоген, Москва) или QIAamp DNA Blood Mini Kit (QIAgen, Нидерланды-Германия). ДНК из образцов крови ВИЧ-инфицированных выделяли и в лаборатории биотехнологии НИИ вирусологии РАМН, оборудованной для работы с инфицированными образцами. Концентрация ДНК определялась спектрофотометрически. Генотипирование проводилось с помощью методов ПЦР-ПДРФ для гена АРОЕ как описано в статье [Боринская и др., 2007], ПЦР «в реальном времени» для гена LCT [Боринская и др., 2006], ПЦР для CCR5del32 [Сломинский и др., 1997], методом дуплексной четырехпраймерной ПЦР для генов ADH1B и ALDH [Tamakoshi et al., 2003]. Определение генотипов индивидов по STR-локусам проводилось с помощью набора PowerPlex (Promega) в сотрудничестве с ЭКЦ МВД (A.A. Рыбакова). Сбор и анализ опубликованных данных описан для каждого гена в разделе «Результаты и обсуждение».
"Этнографический атлас" Дж.П. Мёрдока (далее - «Атлас») был использован в качестве источника описаний факторов среды. «Атлас» содержит описания 1267 этнических групп мира, преимущественно доиндустриальных обществ, по состоянию на вторую половину XIX - начало XX века. Описания даны по более чем 100 этнографическим характеристикам, представленным в виде формализованных (кодированных) переменных, что позволяет проводить статистическую обработку данных.
«Атлас» был опубликован в виде серии статей в журнале Ethnology в период с 1960 по 1973 гг.,и дополнен описаниями народов России с участием автора [Korotayev, Kazankov, Borinskaya, Khaltourina, Bondarenko, Ethnology, 2004]. «Атлас» ранее использовался в популяционно-генетических исследованиях, но лишь как компендиум сведений о языковой принадлежности или экологической классификации среды [Guglielmino et al., 1995] либо наличии или отсутствии отдельного признака (например, молочного животноводства [Bersaglieri et al., 2004]). Насколько нам известно, количественные характеристики, представленные в "Этнографическом атласе", ранее для корреляционного анализа с генетическими данными не использовались.
Для оценки статистической значимости выявленных корреляций между частотами аллелей и средовыми факторами использовали критерии Пирсона или Спирмана (двусторонний тест). Поправку на множественное тестирование делали по Бонферрони если не указано иначе. Статистическую значимость частотных различий оценивали с использованием критерия хи-квадрат либо двустороннего точного критерия Фишера. Анализ внутрипопуляционной дифференциации по нейтральным STR-маркерам проводили с использованием точного теста Фишера в программе «Статистика» 6.0. Мета-анализ проводили с использованием свободно распространяемой компьютерной программы для эпидемиологов WinPepi v. 10 (2010). Программа позволяет оценить среднее значение OR согласно модели с фиксированными эффектами (оценка Мантеля-Хензеля) и модели со случайными эффектами (оценка по DerSimonian-Laird). Выбор между моделями производится на основе анализа гетерогенности совокупности данных (Q-тест Кохрена).
Множественное выравнивание аминокислотных последовательностей гена АРОЕ различных видов млекопитающих проводили с помощью программы ClustalX (http://www.ebi.ac.uk/). При реконструкции предковой последовательности гена АРОЕ приматов в качестве внешней группы (outgroup) была использована последовательность гена тупайи (Tupaia glis). Наиболее вероятная предковая последовательность для приматов была реконструирована с помощью программы PHYLIP 4.0 (Felsenstein J., PHYLIP (Phylogenetic Inference package), Version 4.0). Филогенетическое древо было построено с использованием программы DAMBE [Xia, X., and Z. Xie. 2001. DAMBE: Software package for data analysis in molecular biology and evolution. J. Hered. 92:371-373]. Соотношение Ka/Ks для каждой ветви рассчитывали по методу Li, 1993 [Li, W.-H. Unbiased estimation of the rates sof synonymous and nonsynonimous substitution. J.Mol.Evol. 36, 96-99, 1993], используя калькулятор [Zhang Z, Li J, Zhao XQ, Wang J, Wong GK, Yu J: KaKs Calculator: Calculating Ka and Ks through model selection and model averaging.Genomics Proteomics Bioinformatics 2006 , 4:259-263]. Расчет индекса ускорения при анализе накопления аминокислотных замен в белке АРОЕ приведен в описании результатов.
Определение минеральной плотности кости (МПК) проводили врачи МГСМУ (А.Н.Сафонова под руководством С.А.Арутюнова, при участии автора данной работы в планировании эксперимента и обработке результатов) с использованием рентгеновской двухфотонной абсорбциометрии дистального отдела предплечья при помощи аппарата-денситометра DTX 200 DXA BONE [Osteometer, Дания-США].
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
Для исследования были выбраны гены, отвечающие следующим требованиям: 1) показана ассоциация с важными для здоровья признаками; 2) известны частоты аллелей для большого количества популяций; 3) установлены значительные межпопуляционные различия по частотам аллелей этих генов; 4) имеются указания на то, что различия частот аллелей обусловлены действием отбора. Среди проанализированных генов этим требованиям отвечали следующие гены: аполипопротеина Е АРОЕ, лактазы LCT, хемокинового рецептора CCR5, алкогольдегидрогеназы ADH1B, альдегиддегирогеназы ALDH2. В нижеследующих разделах дана краткая характеристика каждого из этих генов и
описаны ход исследования и полученные результаты в соответствии с поставленными задачами.
1. Ген аполипопротеина Е АРОЕ (19ql3.2), полиморфизмы Cysll2Arg (rs429358) и Argl58Cys (rs7412)
1.1. Определение частот генотипов и аллелей в популяциях России и др. стран Евразии
Белок аполипопротеин Е (АРОЕ) играет ключевую роль метаболизме липопротеинов плазмы крови и транспорте липидов в тканях, регуляции уровня холестерина [Mahley, Rail, 2000; Wellington, 2004]. Ген АРОЕ полиморфен и имеет три общераспространенных аллеля, отличающихся аминокислотами в позициях 112 и 158 зрелого белка. Предковая форма (аллель е4) кодирует белок с Argin, Argiss, именно эти аминокислоты выявлены в соответствующих позициях у высших приматов и других исследованных животных.
Аллелю еЗ соответствует замена в позиции 112 аргинина на цистеин, давая сочетание Cysn2. Argi58. Эволюционно наиболее «молодой» аллель е2 детерминирует Cysm, CyS|5g. Носители генотипа е4/е4 имеют более высокий уровень общего холестерина и ЛПНП по отношению к носителям других генотипов, а носители е2/е2 - самый низкий, хотя в отдельных этнических группах последнее соотношение может варьировать [Bennet et al., 2007]. Аллель е4 является фактором риска болезней сердечно-сосудистой системы, болезни Альцгеймера, ассоциирован с ухудшенным восстановлением после травм головы, инсульта, церебральных кровоизлияний [Bennet et al., 2007; Воевода и др., 2006; Corder et al., 1993; Рогаев, 1999]. Однако у бушменов и некоторых других народов Африки этот аллель не является фактором риска, что предположительно связано и с их генетическими особенностями и/или с иными условиями жизни. Это послужило основанием для предположения, что аллель является «экономичным» («thrifty») аллелем [Corbo, Scacchi, 1999]. К началу данного исследования ген АРОЕ был одним из наиболее интенсивно изучаемых генов человека (в настоящее время - более 16000 статей в базе данных PubMed), частоты его были известны более чем для 200 популяций мира. Однако лишь для немногих российских популяций были установлены частоты аллелей гена АРОЕ [Скобелева и др., 1997; Коровайцева и др., 2001; Мустафина и др., 2001]. Нами установлены генотипы 1103 индивидов из 16 популяций, представляющих 12 этнических групп России и сопредельных стран. Для всех исследованных групп распределение частот генотипов соответствует равновесному по Харди-Вайнбергу. Полученные результаты сопоставлены с опубликованными данными (табл. 2). Установленные нами частоты близки к опубликованным данным для тех же или близких популяций за исключением марийцев (частота аллеля £4 -14.9% в нашем исследовании и 6.5% в исследовании [Мустафина и др., 2001]), что может объясняться различием в локализации исследованных групп и относительно небольшим размером изученных выборок.
1.2. Характеристика географического распределения частот аллелей гена АРОЕ в популяциях мира
Географическое распределение частоты аллеля е4 было известно к началу данной работы лишь для Европы [Gerdes et al., 1992; Corbo et al., 1995; Lucotte et al., 1997; Mastana et al., 1998; Corbo, Scacchi, 1999; Schiel et al., 2000] и характеризовалось увеличением частоты аллеля с юга на север, то есть распределение частоты являлось широтным. Широтное распределение частот аллелей интерпретируется как отражение адаптации к климатическим факторам [Cavalli-Sforza et al., 1994]. Известное к началу работы широтное распределение частот аллеля е4 в Европе могло быть частью картины такого распределения во всем мире либо отражением направлений основных потоков миграций с Юго-Востока на Северо-Запад. Для проверки справедливости гипотезы о широтном распределении аллеля е4 не только в Европе, но и других регионах мира, мы собрали информацию частотах е4 и других аллелей АРОЕ в популяциях мира, для которых были доступны данные о географической локализации. Поиск проводился в базе данных по
Табл. 2. Частоты аллелей гена АРОЕ в популяциях России и сопредельных стран
Популяция Регион N Частоты аллелей АРОЕ Литература
е2 | еЗ | е4
Арктика и Субарстика
Чукчи Чукотский АО 89 0.034 0.764 0.202 Собственные данные
Чукчи и эскимосы Чукотский АО 135 0 0.83 0.17 Воевода и др., 2006
Эскимосы Канада 175 0.010 0.760 0.230 Не§е1е е1 а1., 1997
Аборигены Аляски Аляска 127 0.020 0.787 0.193 8сЬееге1а1„ 1995
Ханты и манси Зап. Сибирь 36 0.03 0.78 0.19 Воевода и др., 2006
Саамы Финляндия 70 0.050 0.640 0.310 ЬеЫшеп е1 а1., 1994
Саамы Кольский п-ов 56 0.080 0.714 0.205 Собственные данные
Коми-ижемцы Ижемский район Республики Коми 66 0.045 0.735 0.220 Собственные данные
Волго-уральский регион
Коми-зыряне южные районы Республики Коми 50 0.10 0.77 0.13 Собственные данные
Коми 75 0.066 0.760 0.173 Мустафина и др., 2001
Удмурты 45 0.044 0.766 0.188 Мустафина и др., 2001
Удмурты Игринский р-н Удмуртской республики 62 0.089 0.750 0.161 Собственные данные
Коми-пермяки Пермь 59 0.068 0.788 0.144 Собственные данные
Мордва 45 0.055 0.844 0.100 Мустафина и др., 2001
Мари 38 0.075 0.855 0.065 Мустафина и др., 2001
Мари горные Мари Эл 47 0.117 0.734 0.149 Собственные данные
Чуваши 63 0.063 0.785 0.151 Мустафина и др., 2001
Татары 51 0.068 0.862 0.068 Мустафина и др., 2001
Башкиры 189 0.057 0.836 0.105 Мустафина и др., 2001
Сибирь и Средняя Азия
Эвенки Сибирь 124 0.004 0.843 0.153 КашЬоЬ е1 а1„ 1996
Эвенки пос. Ванавара, Эвенкия 41 0.037 0.841 0.122 Собственные данные
Якуты сельские районы Якутии 152 0.053 0.875 0.072 Григорьева, 2006
Якуты Якутия 101 0.099 0.757 0.144 РаНепоу е1 а1„ 2007
Шорцы Горная Шория 170 0.071 0.735 0.194 Воевода и др., 2006;
Хакасы Хакасия 141 0.07 0.79 0.15 Воевода и др., 2006
Алтайцы Сев.Алтай 57 0.07 0.87 0.06 Воевода и др., 2006
Буряты Улан-Удэнский р-н Республики Бурятия 52 0.048 0.788 0.163 Собственные данные
Буряты Вост. Монголия 125 0.032 0.804 0.164 Тзипо(1а е1 а1., 2002
Казахи Алма-Ата, Казахстан 112 0.040 0.826 0.134 Байтасова и др., 2001
Уйгуры Алма-Ата, Казахстан, 93 0.059 0.871 0.070 Байтасова и др., 2001
Горцы Памира Московская диаспора, уроженцы Горно-Бадахшанской АО 34 0 0.956 0.044 Собственные данные
Иранцы Уроженцы различных регионов Ирана 40 0.050 0.875 0.075 Собственные данные
Иранцы Иран, Тегеран 129 0.027 0.911 0.062 Кауяаш е1 а1., 2005
Иранцы Иран, Керманшах 135 0.041 0.926 0.033 КЪапчш е1 а1., 2005.
Восточнославянские группы разных регионов
Русские Новосибирск 603 0.068 0.813 0.119 Воевода и др, 2006
Русские Кострома 79 0.133 0.728 0.139 Собственные данные
Русские Санкт-Петербург 403 0.108 0.773 0.119 Скобелева и др., 1997
Русские Москва 205 0.080 0.800 0.120 Коровайцева и др., 2001
Москвичи Москва 95 0.100 0.795 0.105 Собственные данные
Русские Башкирия 78 0.103 0.782 0.115 Мустафина и др., 2001
Русские Краснодар 56 0.093 0.824 0.083 Собственные данные
Русские Ростов и Ростовский р-н 98 0.051 0.857 0.092 Собственные данные
Украинцы Восточная Украина 96 0.135 0.771 0.094 Собственные данные
Белорусы Разл. районы Белоруссии 110 0.114 0.795 0.091 Собственные данные
ключевым словам Apolipoprotein Е, АРОЕ в сочетании с allele, genotype, polymorphism. Найденные статьи были дополнены сведениями из базы данных ALFRED, ссылками из обзоров по различным тематикам, связанным с аллелями гена АРОЕ. Русскоязычные статьи были найдены в профильных русскоязычных журналах и по запросам авторам. Всего были отобраны данные для 298 популяций из 167 публикаций (по состоянию на 2009 г.). Из дальнейшего исследования были исключены выборки, представляющие некоренное население (русские Сибири, европеоиды ЮАР, Австралии и т.п.) или смешанное население, а также выборки численностью менее 30 человек.
Для анализа географического распределения частот аллелей гена АРОЕ из собранных данных были отобраны 175 популяций, представляющие автохтонное население. Распределение частот аллелей гена АРОЕ относительно широты приведено на рис. 1А. Результаты проведенного анализа показывают, что частоты аллелей еЗ и е4 в исследованных популяциях имеют широтное распределение не только в Европе, но и в других Частях Света. Частоты аллеля е4 варьируют от 2-3% в некоторых популяциях Северной Африки, Индии и Бразилии до 40% у охотников-собирателей Африки и Ю.Америки. Диапазон вариаций частот аллеля еЗ составил от 50% до 98%. Аллель е2 отсутствует в некоторых популяциях, достигая частоты более 30% у эве и мосси в Западной Африке. Для аллеля е2 закономерности географического распределения не выявлены. Коэффициенты корреляции между частотами аллелей составили R=0.720 для е4 и еЗ, R=0.459 для е2 и еЗ (р<0.0001 в обоих случаях), корреляция между частотами е2 и е4 незначима.
Так как проведенный анализ показал, что все выявленные корреляции частот аллелей со всеми проверенными средовыми показателями (см ниже) сильнее для аллеля е4, чем для аллеля еЗ (данные не приведены), что соответствует результатам [Eisenberg et al., 2010] по корреляции частот этих аллелей с широтой и средними температурными показателями; дальнейшие результаты приводятся только для аллеля е4.
Более детальный анализ показывает, что частота аллеля е4 минимальна (менее 5%) в популяциях, проживающих на широте от 13 до 38 град. с.ш. для Старого Света (близ Северного Тропика) (рис. 1А), тогда как для популяций Америки - от 13 до 25 град. ю.ш. Эта особенность игнорируется в работе [Eisenberg et al., 2010], в которой со ссылкой на нашу гипотезу об участие аллелей гена АРОЕ в адаптации к климату исследованы корреляции частот аллелей с широтой и различными температурными показателями. При построении графиков и анализе корреляций Эйзенберг с соавт. использовали абсолютную широту, «перегнув» график по экватору (рис. 1Б) и не проводя детального анализа особенностей распределения аллелей на различных континентах. В нашей работе более детальный анализ показывает, что при таком подходе особенности распределения частоты аллелей гена АРОЕ в популяциях, проживающих в различных широтных зонах Старого и Нового Света, остаются невыявленными.
Полученные [Eisenberg et al., 2010] результаты свидетельствуют о наличии негативной корреляции между абсолютной широтой и частотой аллеля. В работе [Eisenberg et al., 2010] проконтролировано влияние генетической структурированности популяций (отражающей сходство в результате расселения или притока генов из соседних популяций) на распределение частот аллелей гена АРОЕ. Для этого использованы данные о 644 258 SNP для 43 популяций панели HGDP [Cann et al. 2002]. На основе этих данных рассчитаны главные компоненты. Главные компоненты были включены в регрессионную модель. Показано, что вариации в популяционных частотах аллеля е4 не отражают популяционную структуру, что свидетельствует о роли отбора в их формировании [Eisenberg et al., 2010]. Более высокая частота аллеля е4 в высоких и низких широтах, по мнению Эйзенберга с соавт., может отражать более высокие энергозатраты как в холодном, так и в жарком климате по сравнению с умеренным. Авторы проверили ассоциацию частот аллелей АРОЕ с температурой (среднегодовая температура по данным
за 30 лет, дневным и годовым перепадом температур), полагая что температура может быть более строгим предиктором частоты, так как она более тесно связана с интенсивностью метаболизма. Однако экспериментальная проверка не подтвердила это предположение - ассоциация частот аплеля е4 с широтой гораздо сильнее, чем со среднегодовой температурой [Е15епЬе^ е! а1., 2010].
Географическая широта может быть кумулятивным показателем, отражающим не только температурные характеристики, но и другие особенности климата и иные факторы окружающей среды (доступные биоресурсы, тип хозяйства, эндемичные инфекции и т.д.). Мы использовали «Атлас» как источник сведений о представленности различных видов хозяйственной деятельности и оценили корреляцию этих переменных с частотой аллеля е4 для проверки <4Ьпйу»-гипотезы [СогЬо, ЗсассЫ, 1999]. Из популяций, для которых известны частоты аллелей гена АРОЕ, 77 имеют соответствия в «Атласе», из них 63 -популяции Старого Света и 14 - Америки. Популяции Америки характеризуются значительной вариацией частот аллелей в соседствующих популяциях, что может объясняться небольшим размером многих изученных выборок и/или сильным эффектом основателя в ряде популяций. Это послужило основанием для проведения дальнейшего анализа только на популяциях Старого Света.
Рис. 1. Распределение частот аллеля е4 гена АРОЕ относительно широты проживания популяции. А - популяции Старого Света, включенные в анализ «thrifty»-гипотезы (собственные данные), Б - рисунок из статьи [Eisenberg et al., 2010].
1.3. Связь частот аллелей гена АРОЕ с типом хозяйства
Гипотезу [Corbo and Scacchi, 1999] о повышенной адаптивной ценности аллеля е4 у охотников-собирателей можно проверить, показав, что частота аллеля е4 выше в группах охотников-собирателей, чем у проживающих в тех же регионах земледельцев. Однако какие именно популяции следует отнести к охотникам собирателям, при этом остается неясным - те, у которых вклад охоты-собирательства в хозяйство превышает 50%, или 15%, или выбрать какую-то иную границу. Более весомым свидетельством в пользу этой гипотезы было бы обнаружение корреляции между частотой аллеля е4 и вкладом охоты-собирательства в хозяйство. Для анализа были использованы данные из «Атласа», характеризующие вклад охоты-собирательства в хозяйства для каждого общества. Эта переменная варьировала от менее 5% до более 85% в изучаемой группе обществ.
В исследованной нами выборке 63 популяций Старого Света частота аллеля е4 позитивно коррелирует с вкладом охоты-собирательства в хозяйство (R=0.638, р<0.001) (рис. 2).
Интенсивность охоты-собирательства варьирует в зависимости от широты, и достигает максимума в высоких широтах, где земледелие невозможно, т.е. именно в тех регионах, в которых частота аллеля е4 высока. Поэтому корреляция частоты аллеля е4 может быть просто отражением корреляции обоих параметров с широтой. Мы более
детально исследовали корреляции частоты аллеля е4 с теми же независимыми переменными в северной (севернее 22° с.ш.) и южной подгруппах. В табл. 3 представлены результаты регрессионного анализа модели
е4 - охота-собирательство + широта + климатические факторы (температура, влажность)
В табл. 3 представлены значимые предикторы, отобранные алгоритмом с пошаговым включением факторов. Приведены также приращения коэффициента детерминации (й2), соответствующие каждому предиктору. Я2 интерпретируется как доля изменчивости зависимого признака, обусловленная изменчивостью предиктора. Вклад охоты-собирательства в хозяйство объясняет большую долю изменчивости частот аллеля е4. Температурные показатели не вошли в состав значимых предикторов.
Табл. 3. Результаты регрессионного анализа связи факторов среды и частот аллеля е4
В Стд. ошибка Бета-коэффициент 1 Р Изменение
Все данные
(Константа) 0.162 0.014 40.34Е16
Охота-собирательство 0.042 0.007 0.588 60.115 10.35Е"7 0.396
Широта -0.001 0.000 -0.373 -30.876 30.05Е^ 0.137
Итого Я2 0.533
Ш ^ 22 (N=35)
(Константа) -0.023 0.026 -0.891 0.381
Охота-собирательство 0.003 0.001 0.602 40.673 80.71Е"3 0.646
Широта 0.018 0.007 0.347 20.689 0.013 0.079
Итого Я2 0.725
Ы < 22 (N=28)
(Константа) 0.166 0.018 90.061 30.25Е"9
Охота-собирательство 0.043 0.011 0.612 30.794 0.001 0.375
Итого 0.375
Результаты более детального анализа показывают, что корреляция частоты аллеля е4 с охотой-собирательством особенно сильна в крайней южной (южнее экватора) и северной (выше 46° с.ш.) подвыборках (данные представлены в рукописи диссертации). Можно полагать, что внутри широтной зоны, в которой уже установлен соответствующий ей диапазон частота аллеля, действуют средовые факторы, модулирующие аллельные частоты. И охота-собирательство оказывается таким фактором. Однако какие именно параметры влияют на адаптивную ценность аллелей е4 и еЗ - особенности диеты, уровень физической активности, уровень энергозатрат или иные, остается неизвестным и это может быть предметом дальнейших исследований. Полученные результаты могут быть причиной выявленного Эйзенбергом с соавт. эффекта: более сильной корреляции частот аллеля е4 с широтой, а не со среднегодовой температурой, так как общества могут отличаться по вкладу охоты-собирательства.
Таким образом, при исследовании популяций Старого Света показано, что в обществах с высоким вкладом охоты-собирательства в хозяйство высока частота предкового аллеля е4, тогда как в обществах с производящим хозяйством доля его носителей ниже.
Согласно результатам исследования гаилотипов, все три аллеля гена АРОЕ появились в популяциях человека не менее 200 000 лет назад [Fullerton et al., 2000]. Однако предковая для человека форма е4, обладающая сродством к липидам низкой плотности, отличается по этой характеристике от белка АРОЕ приматов, который предпочтительно связывает липиды высокой плотности и функционально сходен в этом отношении с вариантом еЗ человека. Эти различия обусловлены заменой аминокислоты в позиции 61, в которой у всех приматов находится треонин, а у человека - аргинин [Dong, Weisgraber, 1996; Mahley, Rail, 2000]. Появление положительного заряда в этой позиции ведет к изменению взаимодействия доменов аполипопротеина Е, что влечет за собой изменение в сродстве к разным типам липидов. Удаление позитивного заряда в позиции 112 (замена Arg->Cys, ведущая к появлению аллеля еЗ) может рассматриваться как компенсаторная замена при наличии слабовредной мутации Thr61->Arg [Enard, 2012]. С другой стороны, сохранение в популяциях человека на протяжении более 200 000 лет аллеля е4, представленного у охотников-собирателей с частотой до 40%, указывает, что этот аллель может быть адаптивен или по крайне мере нейтрален (но не вреден) в определенных условиях внешней среды. Дополнительные данные для анализа этих аспектов могут быть получены при рассмотрении эволюции гена АРОЕ у приматов.
Рис. 2. Распределение частот аллеля е4 в зависимости от уровня вклада охоты-собирательства в хозяйство в популяциях Старого Света
По вертикальной оси указаны частоты аллеля 64. А - для 68 популяций Старого Света; Б - для подгруппы 7 популяций, проживающих южнее экватора (черные - Африка, лиловые - Океания). Для ПапуаНГ (Новая Гвинея) невозможно установить точное соответствие изученной популяции этническим группам, поэтому показан интервал значений переменной «охота-собирательство» для нескольких народов, представленных в «Этнографическом атласе».
1,4, Особенности эволюции аполипопротеина Е у приматов и других млекопитающих
Белок АРОЕ синтезируется в виде препептида, состоящего из 18 аминокислотных остатков сигнального пептида и 299 аминокислотных остатков, соответствующих зрелому белку. Зрелый белок имеет два домена, связанных относительно неструктурированным сегментом, чувствительным к протеазе. М-домен содержит участок распознавания рецепторов липопротеинов, а С-домен - участок связывания липидов ^агауапавшагш е1 а1., 2004]. Известно, что домены белков могут эволюционировать независимо друг от друга. Поэтому сравнение проводилось как по белку в целом, так и по его доменам. Для этого аминокислотные последовательности белка АРОЕ, полученные на основе нуклеотидных последовательностей выших приматов (идентификационные номера в СепВапк для шимпанзе, гориллы, орангутана и гиббона - АЕ200499, АР200502, АР200505 и АЕ200508), а также низших приматов и тупайи, были выровнены и затем, как описано в «Методах и материалах», были установлены аминокислотные замены в каждой линии
15
приматов. У всех изученных приматов включая человека белок АРОЕ содержит одинаковое количество аминокислотных остатков - 18 в сигнальном пептиде (кодирующие участки для которого у всех приматов идентичны) и 299 в зрелом белке. В 900 п.н. последовательности, кодирующей зрелый белок, нами найдено 65 различий у приматов. Все они представляют однонуклеотидные замены, из которых 30 -несинонимичных (ведущих к замене аминокислоты). Замены аминокислоты в различных ветвях филогенетического древа приматов представлены на рис. 3. Отличительной особенностью эволюции белка АРОЕ человека является то, что все шесть аминокислотных замен, возникших в ветви человека (из которых четыре фиксированы, а две полиморфны) локализованы в альфа-спиральных участках N-домена (рис. ЗА). У других высших приматов в этих участках имеется только по одной замене у шимпанзе, гориллы и гиббона и ни одной у орангутана. У макаки большинство замен локализовано в С-домене либо неспирализованных участках N-домена (рис. ЗА, В). Результаты анализа показывают существование различий в эволюции доменов белка АРОЕ у высших и низших приматов (табл. 4). Для того, чтобы проверить, претерпевал ли ген АРОЕ ускоренную или замедленную эволюцию у человека или других приматов, мы рассчитали индекс ускорения (Acceleration Index, A.I.) по [Zhang et al., 2002]. Вычисление индекса ускорения основано на предположении, что если скорость эволюции белка не меняется, то соотношение числа замен в линии человека после отделения от шимпанзе и в линии вида, внешнего по отношению к группе, будет соответствовать соотношению временной протяженности соответствующих линий. При расчете индекса ускорения для целого белка эффект нивелируется, так как у мыши быстрее относительно приматов эволюционирует С-домен. Это согласуется с данными [Zhang et al., 2002], который при расчетах для целого белка, также используя мышь как вид, внешний по отношению к группе (outgroup), не обнаружил ускорения эволюции АРОЕ. Следует отметить, что среди проверенных таким образом 120 белков N-домен АРОЕ имеет самый большой индекс ускорения (A.I. = 4.96) после FOXP2 и PRM2 [Zhang et al., 2002]. Эволюция всего белка АРОЕ как ускоренная оценена в работе [Kitano et al., 2004]. Однако авторы указанного исследования использовали орангутана как вид, внешний по отношению к исследуемой группе. Имеющуюся у шимпанзе и орангутана замены 5:Ala=>Val Kitano et al. интерпретировали ее как замену 5:Val=>Ala у человека. При этом у человека засчитывается на 1 замену больше.
Табл.4. Индекс ускорения (A.I.) эволюции доменов АРОЕ для приматов
с использованием мыши как вида, внешнего от отношению к группе
Вид tP tm N-домен (1-191) С-домен (192-299)
N m A.I. Р п М А.І. Р
Человек 5.5 174.5 5 32 4.96 0.006 0 41 0 0.280
Шимпанзе 5.5 174.5 3 32 2.97 0.103 1 41 0.77 0.720
Горилла 7.3 172.7 2 32 1.48 0.403 1 41 0.58 0.824
Орангутан 14 166 0 32 0 0.076 2 41 0.58 0.858
Гиббон 18 162 1 30 0.30 0.962 2 41 0.44 0.989
Макака 25 155 4 27 0.92 0.642 6 41 0.90 0.652
Чтобы проверить, не является ли ускоренное накопление аминокислотных замен в Ы-домене белка АРОЕ результатом повышенной скорости мутирования у человека ОС-богатого гена АРОЕ, мы сравнили соотношение смысловых и синонимичных замен в гене человека, шимпанзе и мыши (данные приведены в рукописи диссертации). Скорость мутирования кодирующих участков гена АРОЕ в линии человека не повышена - она не отличается от таковой в линии шимпанзе и не превышает таковой в линии мыши для обоих доменов белка АРОЕ. Одним из стандартных критериев для выявления действия отбора является соотношение смысловых (аминокислотных) и синонимических замен Ка/Кв, рассчитываемое с учетом вырожденности генетического кода. У человека Ка/Кв=1.3 для № домена гена АРОЕ, у шимпанзе и гориллы - 0.53 и 0.57 соответственно.
50
_I_
100 _I_
150 _I_
200 _L_
N-domain
H
SI
А л A
A A A
Л A
ГТКТТТ5
û A
250 299
_i_I_i_i_,_,-J
C-domain ПППИИВ 1=1
A A
18: Ala->Thr
61: Thr->Arg
112: Arg->Cyn
135: Ala->Val
158: Arg->Cye
17«: Val->Leu
1С
116: Val->Ala
Ala->Val
Leu—>Val Gin—>Lys
Chimpanzee
Orangutan
AAA
С
8 Pro->Thr
83: Ser->Thr
113 Ser->Gly
120 S.r->01j,
Met->Val
200 210 251 289 291 296
Ala->Pco Leu—>Gly
Ala->Thr Gly->Ser
Thr->Ala Ala->Thr Ser->Ile
Macaque
Рис. 3. Аминокислотные замены в аполипопротеине Е в линиях приматов
А. Структура аполипопротеина Е человека.
Прямоугольниками указаны альфа-спирали: спираль 1 (позиции 24-42), спираль Г (44-53), спираль 2 (5481), спираль 3 (87-122), спираль 4 (130-164) в N-домене (1-191 по [Weisgraber, 1994 и Dong et al., 1994]) и две спирали в С-домене (203-299 согласно [Segrest et al., 1992; Choy et al., 2004]. Пунктирной линией указаны остатки 165-179, которые структурируются при связывании липидов [Naraynaswami et al., 2004]. Голубым цветом тонированы участки связывания рецептора (136-150) и липидов (244-272). Красные треугольники указывают позиции аминокислотных замен, возникших в ветви человека (незакрашеные — полиморфные позиции 112 и 158). Розовые треугольники указывают замены, возникшие в стволе высших приматов до отделения ветви человека. Зелеными треугольниками указано положение аминокислотных замен в стволе низших приматов после отделения от высших приматов и ветви макаки. Замена в позиции 10 с неоднозначным положением на филогенетическом древе не представлена. В. Положение аминокислотных замен на филогенетическом древе приматов. Полиморфные позиции у человека подчеркнуты. С. Положение аминокислотных замен на 3D структуре белка АРОЕ. Замены, возникшие в линии человека, указаны красным, в линии макаки - зеленым. D. Позиции 61, 112 и 174 на ЗО-модели белка (модель из статьи [Chen et al., 12011]).
Это является еще одним свидетельством в пользу различий в действии отбора в линии человека и других приматов. Специфичные для человека замены аминокислот в позициях 18 и 135 возникли в вариабельных участках белка, которые могут быть не очень существенными для функций АРОЕ. Замены в позициях 61, 112 и 174 возникли в консервативных участках. О первых двух известно, что они меняют внутримолекулярные взаимодействия в белке и его сродство к липидам. Третья замена может стабилизировать третичную структуру белка (рис. 3D). В пользу адаптивности замен в позициях 112 и 174 свидетельствует выявленное нами совпадение замен по этим же позициям у сумчатых (опоссум и морской дьявол), у которых так же как и у человека треонин в позиции 61 заменен на аргинин, тогда как у всех других исследованных к настоящему времени млекопитающих треонин в данном положении консервативен. То, что сочетание замен в тех же трех позициях встречается не только у человека, но и у представителей столь отдаленных видов, свидетельствует в пользу неслучайности этого сочетания даже с учетом того, что все эти замены возникли в результате мутаций по "горячим точкам" -динуклеотиду CpG. Замена Arg-158 =>Cys произошла по абсолютно консервативной у млекопитающих позиции и уникальна для человека. Замена Thr61Arg может быть как случайной слабовредной заменой, так и адаптивной. У сумчатых отсутствует бурый жир, поэтому изменение метаболизма липидов может быть важно для терморегуляции. Выявленное нами сходство показывает, что исследование функций АРОЕ у лабораторных опоссумов может способствовать пониманию функциональных особенностей АРОЕ человека. В целом полученные нами результаты свидетельствуют об адаптивной эволюции N-домена белка АРОЕ человека в процессе антропогенеза.
2. Ген лактазы LCT (2q21), полиморфизм -13910С/Т (rs4988235)
Фермент лактаза, расщепляющий молочных сахар лактозу, продуцируется в кишечнике детенышей всех млекопитающих, обеспечивая возможность усвоения цельного молока, в котором лактоза обеспечивает до 30% энергетической стоимости молока. При пониженной продукции лактазы (гиполактазия) потребление цельного молока ведет к развитию неприятных симптомов (метеоризму, диарее и др.). У всех здоровых новорожденных лактаза вырабатывается в больших количествах, но уже к концу первого года жизни у части индивидов продукция фермента снижается в 2-4 раза [Auricchio et al., 1965]. Присущий данному индивиду уровень выработки фермента формируется между вторым и 20-21 годом жизни [Scrimshaw, Murray, 1988], однако возрастная динамика этого процесса изучена недостаточно. Аллель Т полиморфизма -13910С/Т в регуляторном участке гена лактазы LCT детерминирует персистенцию лактазы во взрослом возрасте, тогда как у носителей генотипа С/С происходит возрастное снижение активности лактазы [Enattah et al., 2002]. Генетически обусловленное снижение продукции лактазы с возрастом называют первичной гиполактазией в отличие от вторичной, при которой временное или постоянное снижение активности фермента происходит вследствие перенесенных заболеваний. Частота первичной гиполактазии в различных регионах мира варьирует от 1-3% у народов северо-запада Европы до 70% на юге Европы. У коренного населения Америки и Океании гиполактазия 100%, тогда как в некоторых популяциях Африки и Азии распространены другие аллели, детерминирующие персистенцию лактазы у взрослых. Недостаточность лактазы ассоциирована с рядом важных для здоровья признаков. В ряде исследований выявлена ассоциация со снижением минеральной плотности кости (МПК), тогда как другие авторы не подтвердили эту ассоциацию, получив противоречивые данные [Enattah et al., 2004, 2005; Gugatschka et al., 2007; Lomer et al., 2008; Kull et al., 2008; Smith et a!., 2009]. В российских популяциях к началу нашего исследования были известны частоты фенотипа гиполактазии [Козлов и др., 1998], однако какой именно аллель детерминирует этот признак, не было известно, и исследования ассоциации полиморфизма LCT-13910C/T с показателями МПК и другими важными для здоровья характеристиками не проводились.
2.1. Определение частот генотипов и аллелей по полиморфизму ¿СГ*-13910С/Т и их ассоциации с гиполактазией в популяциях России и других стран Евразии.
У 12 взрослых добровольцев (уроженцев европейской части России) по результатам измерения уровня глюкозы крови после нагрузки лактозой определен лактазный статус. Гиполактазия диагностирована у 7 из 12 испытуемых. У всех этих 7 испытуемых установлен генотип С/С по полиморфизму £С7*С/Т-13910. Остальные 5 испытуемых, у которых выявлен высокий уровень активности лактазы, оказались гетерозиготами С/Т. Таким образом, данные о генетическом контроле гиполактазии, полученные на финской выборке (ЕпаМаЬ е1 а1., 2002), подтверждены нами на исследованной небольшой российской группе: генотип С/С полиморфизма ¿С7*С/Т-13910 полностью ассоциирован с гиполактазией (7 из 7 случаев), а аллель Т проявляется как доминантный, обуславливая персистенцию лактазы.
Частоты генотипов и аллелей по полиморфизму ¿С7*С/Т-13910 установлены для 1189 индивидов из 18 популяций, представляющих 14 этнических групп (Табл. 5).
Распределение частот генотипов соответствует теоретически ожидаемому равновесному распределению Харди-Вайнберга во всех группах, кроме горцев Памира, для которых отклонение может объясняться небольшим размером выборки.
Из 14 этнических групп, для которых нами были установлены частоты генотипов, 6 были исследованы также другими авторами. В 4 случаях (русские, арабы, иранцы, удмурты) из 6 различия между установленными нами частотами и опубликованными другими авторами для соответствующих групп не достигают статистической значимости. Для двух групп (коми и саамов) различия значимы. Для группы коми-пермяков нами установлена частота генотипа С/С 0.42 (95% С10.36—0.46), тогда как в работе (Еппа1аЬ е1 а1., 2007) для небольшой выборки коми указана частот данного генотипа 0.70 (95% С1 0.59-0.86), при этом какая именно группа коми была исследована - не указано. Согласно ранее опубликованным данным по фенотипам гиполактазии, различные подгруппы коми могут отличаться по частоте этого признака (коми-пермяки - 50%, коми-ижемцы - 63% [Ког1оу, 1995]. Поэтому указанные различия вполне объяснимы, если исследованы разные группы коми. Аналогичная ситуация с саамами. Частота гиполактазии у саамов-сколтов (60%), у инари-саамов (25%) [Ко21оу, 1995]. Поэтому и в этом случае расхождения частот генотипа С/С объяснимы, так как в данной работе и в работе (ЕпаПаЪ е1 а1., 2007) исследованы разные подгруппы саамов.
Мы сопоставили частоты генотипа С/С по полиморфизму ¿СТ*С/Т-13910, установленные нами, с данными о частотах фенотипа гиполактазии в аналогичных или наиболее близких к изученным выборкам, полученными ранее на основе клинико-биохимической диагностики гиполактазии (рис. 4). Установленные нами частоты генотипа С/С весьма близки к частотам гиполактазии, установленным разными авторами на основе данных клинико-лабораторного анализа как тех же групп, которые изучены нами, так и для соседствующих с ними групп иной этнической принадлежности.
В изученных нами славянских группах частота генотипа С/С варьирует от 36% - 40% в популяциях северных русских, украинцев и белорусов до 50% и более у русских южных регионов, Поволжья и Сибири. Это соответствует частотам гиполактазии в соответствующих этнорегиональных группах. Частота генотипа С/С у кольских саамов (48%) (образцы собраны в Ловозерском р-не в 2006 г.) идентична опубликованной частоте гиполактазии у кольских саамов [Козлов, 1998; Ког1оу, Цвквуп, 1996]. В исследованных популяциях Волго-Уральского региона (удмурты, коми-пермяки, марийцы) частота генотипа С/С также соответствует установленной ранее частоте гиполактазии. Интересно отметить, что по распространенности гиполактазии марийцы резко отличаются от других популяций, населяющих Центральное Поволжье и Приуралье - удмуртов (59%), коми-пермяков (50%) и мордвы (52%). У марийцев гораздо выше доля индивидов, имеющих фенотип гиполактазии: 83% среди луговых, и 79% - среди горных марийцев (Тамм и др., 1987). Установленная нами частота генотипа С/С у марийцев (74%) также существенно
превышает частоты этого генотипа у коми-пермяков (42%) и удмуртов (55%), что полностью соответствуют опубликованным результатам фенотипических исследований. Установленные частоты генотипа С/С в популяциях казахов, уйгуров, горцев Памира, чукчей соответствуют ожидаемым частотам гиполактакзии в населении Центральной Азии и Сибири, хотя не для всех изученных нами групп можно найти точно соответствующие группы, для которых исследованы частоты гиполактазии.
Табл. 5. Распределение частот генотипов и аллелей полиморфизма ¿СГ*С/Т-13910 в _исследованных выборках_
Популяции Численность выборки Частота генотипов, % (N) Частота аллелей х2
С/С СТ ТТ С Т
1. Русские (Костромская обл) 102 36.2 (37) 45.1 (46) 18.6(19) 0.58±0.03 0.42±0.03 0.314
2. Русские (Курск) 112 53.6 (60) 38.4 (43) 8.0 (9) 0.73+0.03 0.27+0.03 0.110
3. Русские (Ростов) 114 53.5 (61) 40.4 (46) 6.1 (7) 0.74+0.03 0.26+0.03 0.187
4. Русские (Башкирия) 69 50.7 (35) 42.0 (29) 7.2 (5) 0.72+ 0.04 0.28+0.04 0.092
5. Русские (Чукотка) 26 46.2(12) 38.4 (10) 15.4 (4) 0.65+0.07 0.35+0.07 0.588
6. Украинцы 122 41.8 (51) 44.3 (54 ) 13.9 (17) 0.64+0.03 0.36±0.03 0.541
7. Белорусы 101 39.6 (40 ) 44.6 (45) 15.8(16) 0.62+0.03 0.38+0.03 0.198
8. Саамы 64 48.4(31) 42.2 (27) 9.4 (6) 0.70+0.04 0.30+0.04 0.001
9. Коми-пермяки 69 42.0 (29) 43.5 (30) 14.5 (10) 0.64+0.04 0.36+0.04 0.241
10. Удмурты 94 55.3 (52) 38.3 (36) 6.4 (6) 0.74+0.03 0.26+0.03 0.005
11. Марийцы горные 53 73.6 (39) 22.6(12) 3.8 (2) 0.85+0.03 0.15+0.03 0.721
12. Казахи 34 79.4 (27) 11.3 (6) 1.9(1) 0.88+0.04 0.12+0.04 0.765
13. Уйгуры 30 90.0 (27) 10.0 (3) 0 0.95+0.03 0.05+0.03 0.083
14. Буряты 78 89.7 (70) 10.3 (8) 0 0.95+0.02 0.05+0.02 0.257
15. Чукчи 35 88.6 (31) 11.4(4) 0 0.94±0.03 0.06+0.03 0.129
16. Горцы Памира 34 88.2 (30) 8.8 (3) 2.9(1) 0.93+0.03 0.07+0.03 4.222
17. Иранцы 34 91.2 (31) 8.9 (3) 0 0.96+0.02 0.04+0.02 0.072
18. Арабы 18 83.3 (15) 16.6 (3) 0 0.92+0.05 0.08+0.05 0.149
Частота генотипа С/С у горцев Памира (88%) близка к частоте гиполактазии в соседствующей с ними группе таджиков Афганистана (82%). Для проанализированной нами выборки казахов Казахстана частота генотипа С/С составила 79%, что соответствует опубликованным данным по частоте гиполактазии у казахов Китая (76%). Для чукчей частота гиполактазии не известна. Наиболее географически и культурно близкой к ним группой, для которой доступны данные о частоте гиполактазии, являются эскимосы. Эта частота (81%) близка к установленной нами частоте генотипа С/С у чукчей (89%).
Исключение представляет выборка бурят, для которых установленная нами частота генотипа С/С 0.89 (95% CI 0.84-0.92) значимо отличается от частоты гиполактазии 0.47 (95% CI 0.36-0.60) [Жвавый и др., 1991]. Причиной расхождения может быть небольшой размер фенотипированной выборки бурят (19 человек [Жвавый и др., 1991]), либо заниженная оценка частоты гиполактазии у бурят в клинико-биохимическом исследовании. В пользу последнего свидетельствует и отклонение оценки частоты гиполактазии 47% у бурят от общего географического градиента, и тот факт, что у соседних с бурятами монголов частота гиполактазии составляет 88% [Wang et al., 1984]. Тем не менее, в силу возможной генетической гетерогенности признака персистенции лактазы, нельзя исключить наличие в популяции бурят иных, кроме полиморфизма LCT *С/Т-13910, генетических вариантов, определяющих синтез лактазы у взрослых. Это предположение соответствует данным о независимо появившихся мутациях в регуляторном участке гена лактазы, детерминирующих фенотип персистенции лактазы, в
популяциях африканских и ближневосточных [Tishkoff et al., 2006; Ingram et al., 2007], a также y китайцев и тибетцев [Xu et al., 2010; Peng et al., 2012].
В 12 исследованных нами популяциях, для которых доступны данные по частоте гиполактазии, а также в 14 популяциях Евразии, исследованных другими авторами, частота клинически диагностированной гиполактазии коррелирует с частотой генотипа С/С (рис. 4). Коэффициент корреляции по выборке в целом составляет R=0.865, р<0.001. Для 15 европейских популяций, вошедших в выборку, корреляция составляет R=0.919, р<0.001. Это указывает на то, что генотип С/С является основным детерминантом гиполактазии в европейских популяциях. Для 11 азиатских популяций корреляция незначима (R=0.363, р=0.302). Значительно различаются частоты генотипа С/С и гиполактазии в популяциях бурят, якутов, уйгуров. Различия между частотами генотипа С/С и гиполактазии отмечены также в популяциях Северного Китая [Sun et al., 2007]. Для заключения о генетической гомогенности или гетерогенности детерминации гиполактазии в населении Азии необходимо провести дополнительные популяционно-эпидемиологические исследования для уточнения частот гиполактазии и молекулярно-генетический анализ регуляторного участки гена лактазы у представителей тех выборок, в которых частота генотипа С/С превышает частоту гиполактазии.
Для 42 популяций, в которых известна частота генотипа С/С (собственные и опубликованные данные), имеются соответствия в «Атласе». Анализ корреляций с переменными, характеризующими особенности хозяйства, выявил ожидаемую позитивную корреляцию с молочным животноводством (R=0.548, р=0.0002).
Рис. 4. Корреляция между частотой генотипа С/С и частотой фенотипа гиполактазии в популяциях Евразии.
Вертикальная ось - частота генотипа СС, горизонтальная ось - частота гиполактазии. Темные квадратики -популяции России. 1 - ирландцы, 2 -шведы, 3- немцы, 4 - финны, 5-украинцы, 6 - поляки, 7 - французы, 8 -русские (Кострома/Московская обл.), 9
- итальянцы северные, 10 - уйгуры, 11 -буряты, 12 - кольские саамы, 13 - коми-пермяки, 14 - мордва мокша, 15 -мордва эрзя, 16-удмурты, 17-корейцы, 18 — казахи, 19 - марийцы, 20
- ханты и манси, 21 - чукчи, 22 - горцы Памир/таджики Афганистана, 23 -иранцы, 24 - китайцы, 25 - японцы (лит. ссылки приведены в рукописи диссертации).
Полученные нами данные о распределении частот ассоциированного в европейских популяциях с гиполактазией генотипа С/С по полиморфизму /ХТ*С/Т-13910 в популяциях России и сопредельных стран хорошо вписываются в общую картину географической изменчивости частот гиполактазии в популяциях Евразии [Козлов, 1996; Козлов и др., 1998; Enattah et al., 2007]. Для популяций азиатской части России необходимы дополнительные исследования генетических полиморфизмов, ассоциированных с гиполактазией для того, чтобы определить, является ли для них полиморфизм С/Т-13910 по гену LCT единственным или лишь одним из нескольких, ассоциированных с гиполактазией.
Для изученных популяций европейской части России различия между частотами клинически диагностированной гиполактазии в популяциях и установленными нами частотами генотипа С/С находятся в пределах статистической ошибки. Это позволяет заключить, что генотип С/С-13910 по гену LCT в изученных группах является наиболее
частым, а возможно единственным, определяющим персистенцию лактазы и способность к усвоению молока взрослыми. Таким образом, ДНК-диагностику на носительство генотипа С/С локуса С/Т -13910 у представителей европейских популяций России можно рассматривать как предиктивный тест в отношении первичной гиполактазии задолго до ее фенотипического проявления.
2.2. Оценка возраста проявления фенотипическнх различий у носителей разных генотипов по полиморфизму LC7X7T-13910
При гиполактазии индивид испытывает неприятные симптомы после потребления цельного молока (до 1 стакана в день проходит бессимптомно), но не все связывают эти симптомы с молоком. Однако в среднем носители генотипа С/С по полиморфизму ¿СГ*С/Т-13910 потребляют меньше молока, чем носители аллеля Т. Мы провели обследование 270 здоровых молодых мужчин (совместно с А.Н.Петриным и С.А.Арутюновым, МГМСУ) в возрасте от 20 до 52 лет (средний возраст 26.2±0.4 года). В исследуемую группу были включены преимущественно русские мужчины (доля потомков от смешанных браков русских, украинцев и белорусов составила в изученной выборке 6.5%), уроженцы различных регионов европейской части России.
Информацию о частоте потребления цельного молока и кисломолочных продуктов собирали с помощью опросника, в котором для каждого вида продукта отмечали частоту его потребления за последний год (ежедневно или почти ежедневно; реже чем ежедневно; никогда).
Частота ассоциированного с гиполактазией генотипа С/С по полиморфизму LCT*С/Т-13910 составила 45.2%, что соответствует распространённости фенотипическнх проявлений гиполактазии у русского населения (36-49% [Козлов, 2004]).
Установленная по данным опроса частота потребления кисломолочных продуктов (кефира, сыра и творога) у носителей разных генотипов не различается (табл. 6). Однако выявлены различия частоты потребления цельного молока. Среди носителей аллеля Т, детерминирующего персистенцию лактазы, 28% потребляют цельное молоко ежедневно, тогда как среди носителей генотипа С/С, детерминирующего первичную гиполактазию, доля таких индивидов составляет 16% (табл. 6). Различия значимы (р = 0.021 по двустороннему тесту Фишера). Никогда не потребляют молоко 11% и 15%, соответственно. Эти цифры близки к опубликованным данным (10% и 22%), полученным при обследовании 792 москвичей (возраст 20-79 лет) с известными генотипами по полиморфизму ¿СГ*С/Т-13910 [Tirapson et al., 2010].
Анализ частоты потребления цельного молока в разных возрастных группах показывает, что до 22 лет носители разных генотипов не отличаются по частоте потребления молока (рис. 5). Ежедневное потребление молока отмечают 35% носителей генотипа С/С и 36% носителей аллеля Т. В более старшем возрасте у носителей генотипа С/С доля ежедневно потребляющих молоко снижается в 5 раз (с 35% до 7%), а у носителей аллеля Т - чуть более чем на треть (с 36% до 22%). Доля не потребляющих молоко у носителей генотипа С/С возрастает более чем в 2 раза (с 8% до 18%), а у носителей аллеля Т не меняется (10% и 11%).
Полученные нами данные о наличии возрастной границы изменения частоты потребления молока в изученной группе русских объясняют причину отсутствия связи между полиморфизмом гена LCT и потреблением цельного молока в исследовании Хабаровой с соавт. [Khabarova et al., 2009]. Авторы обследовали 231 индивида (русские Северо-Запада РФ ) 17-26 лет и сообщили об отсутствии (Р=0,094) достоверных различий по потреблению молока между носителями генотипа С/С, с одной стороны, и генотипов С/Т и Т/Т, с другой [Khabarova et al., 2009]. Однако после увеличения размеров выборки до 518 человек, различия достигли значимого уровня [Khabarova et al., 2011]. Возрастные различия в цитируемых работах не исследовались.
Возрастная динамика активности лактазы в европейских (в том числе русских) популяциях изучена мало. У населения Северо-Западной Европы (Эстонии, Финляндии)
Табл. 6. Потребление молочных продуктов носителями разных генотипов по полиморфизму /ХТ*С/Т-13910 __
Частота потребления молочных продуктов Молоко Сыр, творог Кефир
Генотип С/С (122 чел.) Число индивидов (частота) Р Число индивидов (частота) Р Число индивидов (частота) Р
Никогда 0.15 (18) Различия по ежедневному потреблению Р=0,021 OR = 2.02 0.03 (4) 1 0.05 (6) 1
Редко 0.69 (84) 0.78 (95) 0.65 (79)
Ежедневно 0.16(20) 0.19(23) 0.30 (37)
Генотипы С/Т + Т/Т (148 чел.)
Никогда 0.11 (16) 0.02 (3) 0.02 (3)
Редко 0.61 (90) 0.78(116) 0.72 (106)
Ежедневно 0.28 (42) 0.20 (29) 0.26 (39)
□ с/т+т/т ■ с/с
о 0,70
о
m о 0,60 о с
Ч 1 0,50
| | £ 0,40
Й о" 2 0,30
4 к
ё ё о>2о
5 0)
Ч е- 0,10 £ о
s с 0,00
22 23
Возраст
Рис. 5. Возрастное изменение доли индивидов, ежедневно потребляющих молоко, в зависимости от генотипа
характерная для взрослых активность лактазы стабилизируется, по-видимому, только к 19-21 году [Таммур, 1991; ваЫ, Ьаиша1а, 1978]. Для России такие исследования не проводились, но если по этой особенности популяции русских сходны с европейскими, то выборки, сформированные в относительно широком возрастном диапазоне (20-56 лет в нашей работе, 17-26 лет в исследовании Хабаровой и др.) могут включать индивидов, находящихся на разных этапах «лактазного онтогенеза», что затрудняет анализ получаемых результатов. После выделения возрастной группы с явно завершёнными возрастными изменениями активности фермента (подвыборка 23+ года в нашем исследовании), связь между генотипом и пищевыми предпочтениями (употребление/избегание цельного молока) проявляется более четко.
2.3. Связь частоты потребления молока с МПК у носителей разных генотипов по полиморфизму 1СТ* С/Т-13910
Снижение минеральной плотности кости (МПК) ниже уровня нормы выявлено у 21.3% обследованных, при этом снижение МПК соответствует уровню остеопении 16.8%, уровню остеопороза - 4.5%. В группе ежедневно потребляющих молоко МПК выше по сравнению с группой молоко не употребляющих (0.597 г/см2 и 0.566 г/см2, р = 0.032).
Доля индивидов с пониженной МПК выше среди тех, кто не потребляет молоко, а среди пьющих его ежедневно самая низкая (р = 0.045).
Предполагаемая ассоциация генотипов по полиморфизму £СГ*С/Т-13910 со снижением МПК реализуется через количество потребляемого кальция, преимущественно в виде молока и молочных продуктов [Ьаак80пеп еі а1., 2009]. Поэтому для исследования связи генотипа и частоты потребления молока с МПК мы исключили группу возрастом < 22 лет, так как в ней частота потребления молока не отличается у носителей разных генотипов.
В целом по группе мужчин 23 лет и старше без учета частоты потребления молока различия средних показателей МПК у носителей разных генотипов незначимы согласно результатам дисперсионного анализа (р = 0,905). У носителей генотипа С/С не выявлены значимые различия значений МПК между группами, потребляющими молоко с разной частотой (рис.6). Однако у носителей аплеля Т, детерминирующего персистенцию лактазы у взрослых, частота потребления молока связана с МПК. У тех, кто молоко не потребляет, МПК составляет 0.543 г/см2, у потребляющих молоко не чаще 2 раз в неделю МПК составляет 0.580 г/см2 , а у пьющих молоко ежедневно МПК составляет 0.637 г/см2 (р = 0.0003) (рис.6).
0,70 - LCT - - DOC I и СЛУГЛ" |
0,60 - Г 0,55 і ; 0,50 0,45 - ; 0,40--И Ш й] Никогда Редко Ежедневно Потребление молока в группе старше 22 лет
Рис. 6. Связь МПК и частоты потребления молока у носителей разных генотипов по полиморфизму LCT*С/Т-13910 в группе старше 22 лет.
Таким образом, нами показано, что в возрастной группе старше 22 лет у индивидов с генетически детерминированной персистенцией лактазы (генотипы Т/Т и Т/С) как абсолютные (в г/см2), так и относительные (Т-критерий) показатели МПК пропорциональны частоте потребления молока (р = 0.0003). У индивидов с генотипом С/С частота потребления молока на МПК не сказывается.
Недавно опубликованные данные крупного финского исследования (более 1500 индивидов в возрасте 31-46 лет) свидетельствуют, что у мужчин с генотипом С/С ниже уровень потребления кальция по сравнению с носителями других генотипов (Р=0.001). У носителей генотипа Т/Т минеральная плотность дистальных частей большой берцовой и лучевой костей оказалась на 3% выше (Р<0.03) [Tolonen et al., 2011].
Снижение МПК у носителей генотипа С/С может объясняться как меньшим потреблением молока, так и ухудшенным усвоением кальция. Подтверждение выявленной нами ассоциации, для которого необходимо исследование выборок большего размера и различного половозрастного состава, будет означать, что более чем треть населения РФ является носителями «рискового» генотипа, который может быть выявлен методами ДНК-диагностики до проявления клинических симптомов ассоциированного с ним снижения
МПК. Носительство генотипа С/С при сниженном уровне потребления молока, но более частом, чем у носителей других генотипов, приеме препаратов кальция [Enattah et al., 2005b] либо наличии альтернативных пищевых источников кальция [Gugatschka et al., 2007] не приводит к понижению МПК. Для подтверждения полученных нами данных о связи полиморфизма LCT*-139 ЮС/Т с уровнем потребления молока и МПК необходимо проведение исследований на этнически однородных выборках большего размера и различного половозрастного состава.
3. Ген хемокинового рецептора CCR5 (локус Зр21), аллель CCR5del32 (rs333)
Ген CCR5 кодирует хемокиновый рецептор, который является одним из основных ко-рецепторов, опосредующих проникновение макрофаготропного ВИЧ в клетки [Deng et al., 1996]. Делеция размером 32 п.н. (CCR5del32) приводит к синтезу функционально неактивного продукта. Индивиды, гомозиготные по этой делеции, остаются неинфицированными даже при длительной экспозиции к инфицирующему агенту [Dean et al., 1996; Liu et al., 1996]. У гетерозигот CCR5wt/ CCR5del32 пролонгирован период от инфицирования до развития СПИДа (см. обзор в [O'Brien, Nelson, 2004]).
Максимальные частоты CCR5del32 (15-18%) отмечены у русских и финно-язычных народов (эстонцы, финны, мордва) [Асеев et al., 1997; Рябов и др., 2002; Limborska et al., 2002; Kalev et al., 2000]. У народов юга Европы и Индии его частота значительно ниже (25%), а в Африке, Юго-Восточной Азии и у коренного населения Нового Света этот аллель практически не встречается [Stephens et al., 1998; Лившиц и др., 2000; Martinson et al., 1997; Libert et al., 1998; Su et al., 2000; Ramana et al., 2001; Jagodzinski et al., 2000; Yudin et al., 1998].
Предполагается, что мутация CCR5del32 возникла на северо-западе Европы и могла распространиться оттуда вместе с потоками миграций или во время завоеваний (например, при походах викингов 8-10 вв. [Lucotte et al., 2001]). Другим объяснением может быть то, что частота мутации возросла под действием отбора. Фактором отбора могли быть эпидемии тех инфекций, к которым носители мутации более устойчивы [Libert et al., 1998].
Моделирование процесса распространения аллеля показало, что если эффективность отбора была одинакова на разных территориях, то наиболее вероятным районом, из которого распространялся аллель, является южная Финляндия. При допущении различной эффективности действия отбора (20% различия между севером и югом и 5% различия между западом и востоком Европы) наиболее вероятным районом распространения являются территории Испании или Германии [November et al., 2005].
3.1. Экспериментальное определение частот аллеля CCR5del32 в некоторых популяциях
Как было показано ранее, частота аллеля CCR5del32 варьирует даже в популяциях, представляющих одну этническую группу [Limborska et al., 2002]. Для уточнения распределения частот аллелей в различных группах русских мы исследовали русских Костромы (более северную, чем исследованные ранее группы русских) и русских Ростова-на-Дону, сравнив частоты аллелей в этих группах и в других восточнославянских группах (украинцев и белорусов). Мы определили частоты генотипов и аллелей также и в неисследованных ранее в этом отношении группах калмыков, горцев Памира и выборке, представляющей население Ирана (табл. 7). Распределение частот генотипов в исследованной выборке для локуса CCR5 соответствует теоретически ожидаемому равновесному распределению Харди-Вайнберга. В различных группах русских частота аллеля CCR5del32 варьирует от 9.1% до 16.6% (табл. 7), поэтому в исследованиях по типу «случай-контроль» для этого локуса желательно использование контрольных популяций не только той же этнической принадлежности, но и имеющих происходящих из того же региона, что и группа пациентов.
3.2. Распределение частот аллеля CCR5del32 в популяциях Евразии
База данных частот аллеля CCR5del32 в популяциях Евразии и Северной Африки была создана на основе собственных и опубликованных данных (51 статья). Выборки, содержащие менее 30 индивидов, были исключены из дальнейшего анализа. Для построения карты (выполнено О.П. Балановским) были использованы данные для 31854 индивида из 185 популяций (рис.7).
Полученные данные уточняют географическое распределение частот аллеля CCR5del32. Максимальная частота аллеля вокруг Балтийского и Белого морей, по мере удаления от этой области линейно частота снижается. Имеется дополнительный локальный максимум в азиатской части России (шорцы). Выявлены корреляции с климатическими параметрами (среднегодовая температура и др.), но эти корреляции, по сравнению с предыдущим исследованием [Limborska et al., 2002], в котором было использовано меньшее количество популяций, снизились. Можно заключить, что влияние климата на распределение частот аллеля, если и есть, то имеет непрямой характер. Сбор данных и анализ географического распределения частот аллеля CCR5del32 был выполнен совместно с О.П.Балановским и соавт. (Balanovsky et al., 2005).
Табл. 7 . Частоты аллеля CCR5del32 в популяциях России и сопредельных стран
Популяция N Частота аллеля CCR5del32 С/95% Источник.
Украинцы 103 0.107 0.085-0.129 Собственные данные
Белорусы 125 0.124 0.103-0.145 Собственные данные
Калмыки 70 0.021 0.009-0.033 Собственные данные
Иранцы 41 0.024 0.007-0.041 Собственные данные
Горцы Памира 34 0.044 0.019-0.069 Собственные данные
Русские, Ленинградская, обл 33 0.166 0.120-0.212 [Magierowska et al., 1998]
Русские, Кострома 54 0.157 0.122-0.192 Совместно с Ж.М.Кожекбаевой
Русские, (СПб) 50 0.130 0.096-0.164 [Асеев и др., 1997]
Русские, Москва 83 0.139 0.112-0.166 [Libert et al., 1998]
Русские, Москва 176 0.122 0.105-0.139 [Voevodin et al., 1998]
Русские, Рязань 78 0.120 0.094-0.146 [Limborska et al., 2002]
Русские, Липецк 48 0.104 0.045-0.192 [Гараев M., собств.данные]
Русские, Новосибирск 53 0.104 0.074-0.134 [Yudin et al., 1998]
Русские, г. Лысьва 186 0.100 0.084-0.116 [Рябов и др., 2002]
Москвичи (без указания национальности) 171 0.091 0.074-0.106 [Ryabov et al., 2004]
Русские Ростовской обл. 99 0.136 0.112-0.160 Собственные данные
Рис. 7. Карта распределения частот аллеля CCR5del32 в популяциях Евразии и Северной Африки
33. Анализ возможных факторов формирования распределения частот аллеля CCR5del32 в популяциях Евразии
Анализ корреляций частот аллеля CCR5del32 с переменными из «Атласа» не выявил значимых корреляций с характеристиками типа хозяйства. Выявлена корреляция с развитием технологий хранения продуктов, однако при поправке на множественное тестирование она становится незначимой. Данных по эндемичным инфекциям для европейских популяций в «Атласе» недостаточно для анализа (представлены преимущественно тропические инфекции).
В качестве возможных факторов повышения частоты аллеля CCR5del32 в литературе указываются процессы дрейфа либо отбора, предполжительно на устойчивость к инфекциям. В качестве фактора отбора могли послужить эпидемии прошлого либо постоянно циркулировавшие инфекции, особенно если они давали вклад в детскую смертность (см краткий обзор в [Hedrick, Varelli, 2006]. Установить, какие именно инфекции до настоящего времени не удалось - предположения основаны на моделях, но не экспериментальных исследованиях.
Однако исходя из опубликованных к настоящему времени данных можно сделать предположения о времени действия факторов отбора. Исследование останков 19 индивидов из захоронений Бронзового Века (почти 3000 лет назад) на территории Германии и Италии показало, что частота CCR5del32 составляла в популяциях того времени 11.8%, что соответствует средней частоте в современных европейских популяциях. Следовательно, если частота аллеля возросла в результате отбора, отбор действовал уже 3000 лет назад.
Частота аллеля CCR5del32 установлена в популяциях, расселившихся в Европе в относительно недавний исторический период. В различных группах евреев-ашкеназов она варьирует от 25% у литовских евреев до 2-3% у евреев Венгрии, Чехословакии и Украины, составляя в среднем 11.7%. У евреев-сефардов, марроканских и йеменских евреев не превышает 2-5% [Maayan et al., 2000, Klitz et al., 2001, Lucotte, Smets, 2003], что соответствует частотам у народов, проживающих в тех же регионах, что и сефарды.
Отличия ашкеназов от сефардов и других групп евреев указывают, что частота CCR5del32 у ашкеназов возросла после того, как они отделились от сефардов [Maayan et al., 2000]. Для того, чтобы объяснить столь сильное различие по частоте аллеля между ашкеназами и сефардами притоком генов от европейских популяций, надо предположить, что такой приток составил 80%, что не соответствует оценкам по другим системам генетических маркеров [Hammer et al., 2000]. Следовательно, частота мутации у ашкеназов повысилась в результате отбора либо случайных изменений частот аллеля (этот фактор особенно сильно мог действовать в еврейских популяциях, так как они прошли через многократные периоды снижения и роста численности).
У венгерских цыган частота этого аллеля составляет 12.2% [Juhasz et al., 2012]. Цыгане, предки которых покинули Индию более 1000 лет назад, расселились в Европе в Средние века. Частота CCR5del32 в Индии не превышает 3-5%. Для цыган также следует предполжить повышение частот либо под действием отбора, либо в результате дрейфа. При этом, как и в еврейских популяциях, эти процессы «настроили» частоту аллеля на «европейский уровень». При том, что эффекты дрейфа, особенно в небольших расселяющихся группах, необходимо учитывать, совокупность приведенных данных свидетельствует скорее в пользу отбора, который действовал на территории Европы как до 3000 тыс. лет назад, так и позже, в период расселения описанных выше групп.
3.4. Протективный эффект CCR5del32 в отношении ВИЧ:
исследование случая фокусной нозокомиальной ВИЧ-инфекции и мета-анализ
Статистические оценки по данному разделу выполнены совместно с А.В.Рубановичем
Для того, чтобы оценить возможный вклад межпопуляционных различий по частоте аллеля CCR5del32 в устойчивость к инфекциям, мы использовали данные по ВИЧ-инфекции. Эпидемия СПИД, начавшаяся с единичных зарегистрированных случаев в 1981 г., в настоящее время представляет одну из важнейших проблем здравоохранения как в России, так и в мире [Bridge et al., 2010]. В России развитие эпидемического процесса характеризуется формированием нозокомиальных очагов инфекции (т.е. очагов, возникших вследствие заражения пациентов в больнице) в 1988-1989 гг. Вспышка началась с ВИЧ-инфицированного ребенка, госпитализированного в детскую больницу г. Элисты, и в результате несоблюдения противоэпидемических мероприятий распространилась в больницах Калмыкии, Ростовской, Волгоградской областей и Ставропольского края. Всего из одного исходного источника (фокусная инфекция) было инфицировано более 260 детей и их матерей [Покровский и др., 1990; Покровский, 1996], многие из которых к настоящему времени умерли (рис.8).
Рецептор CCR5 опосредует связывание ВИЧ с клеточной мембраной и проникновение определенных штаммов вируса в клетку [Restrepo et al., 2011]. У носителей CCR5del32 в гомозиготном состоянии функциональные рецепторы CCR5 отсутствуют, а при гетерозиготности по делеционному аллелю их количество снижено. Индивиды, гомозиготные по CCR5del32, доля которых в европейских популяциях составляет 1%-2%, обладают высокой, но не абсолютной устойчивостью к инфицированию. Среди ВИЧ-инфицированных пациентов гомозиготные носители CCR5del32 встречаются очень редко - всего описано 12 таких случаев в мире из более 20 000 обследованных, и в большинстве из этих случаев вирус обладал тропизмом к рецептору CXCR4, но не к CCR5 [Huang et al., 1996; Liu et al., 1996; Samson et al„ 1996; Dean et al., 1996; Marmor et al. 2001; Oh et al., 2008]. У гетерозиготных носителей CCR5del32 с ВИЧ-инфекцией ниже вирусная нагрузка, медленнее падает количество CD4+ Т-клеток и медленнее развиваются симптомы СПИД [Dean et al., 1996; Huang et al., 1996; Hendel et al., 1998; Misrahi et al., 1998; Ioannidis et al., 2003; Mulherin et al., 2003; Oh et al., 2008, Barroga et al., 2000]. Частота гетерозиготных носителей CCR5del32 значительно повышена в группе индивидов, которые были инфицированы в 1980-х гг. и имели продолжительность жизни более 10 лет [Dean et al., 1996].
0,8
л
Ь
I 0,6
0,4
0,2
I Русские I Калмыки
1990 1992 1994 1996 1998 2000 2002 200» 2006 Год
Рис. 8. Динамика выживаемости пациентов с нозокомиальной ВИЧ-инфекцией
русских (Ростов-на-Дону - 107,Элиста- 13 человек) и калмыков (Элиста-57 человек). График построен на основе анонимных данных, предоставленных автору медучреждениями Ростова-на-Дону и Элисты.
Однако данные о протектнвном эффекте гетерозиготности в отношении инфицирования ВИЧ противоречивы. В ряде работ выявлена более низкая частота гетерозигот среди инфицированных пациентов по сравнению с неинфицированными, подвергавшимися риску инфицирования, или по сравнению с частотой в общей выборке из той же популяции, что может указывать на частичную резистентность индивидов с генотипом CCR5 wt/del32 к инфицированию ВИЧ [Samson et al., 1996; Marmor et al. 2001]. В других исследованиях такой эффект обнаружен не был - различия в частотах гетерозиго CCR5 wt/del32 и/или аллеля del32 между группами ВИЧ-позитивных и ВИЧ-негативных индивидов либо отсутствовали, либо были статистически незначимыми [Huang et al., 1996; Казеннова и др., 1998; Шадрина и др., 2000; Adojaan et al., 2007]. В данной работе мы исследовали влияние гетерозиготного носительства аллеля CCR5del32 на выживаемость детей с фокусной нозокомиапьной ВИЧ-инфекцией и риск инфицирования при инъекционном пути заражения, а также провели мета-анализ опубликованных данных для оценки возможного снижения риска инфицирования у гетерозиготных носителей аллеля CCR5del32.
3.5. Частота CCR5del32 у ВИЧ-инфицированных и в контрольных группах
Для каждого индивида в выборке детей с нозокомиальной ВИЧ-инфекцией и для индивидов контрольных групп были установлены генотипы по гену CCR5 и выявлены носители аллеля CCR5del32 (табл. 8). Распределения генотипов во всех изученных группах значимо не отличались от равновесного по Харди-Вайнбергу.
Для популяции калмыков частота аллеля CCR5del32 установлена впервые и составила 0.021+0.012. Такая низкая частота аллеля в популяции калмыков соответствует его частоте в соседствующих с ними популяциях Кавказа (3-5%) и низкой частоте в популяциях Центральной Азии, родственных калмыкам по происхождению (например, 1.1% у монголов Китая [Ои е1 а1„ 2000]). В выборке ВИЧ-инфицированных детей калмыков (27 чел.) носители этого аллеля выявлены не были (различия с частотой в контрольной группе незначимы: р=0.558 по точному тесту Фишера).
У русских, согласно опубликованным данным, в различных географических группах частота аллеля СС7?5</е/32 варьирует от 0.104 до 0.157 (обзор дан в [ВаЫпоувку е1 а1., 2005]). Так как большинство инфицированных русских детей в изученной выборке находились в больницах Ростова-на-Дону, а для русских Ростовской области частота аллеля CCR5del32 не была известна, была сформирована контрольная группа из добровольцев - студентов медвуза Ростова-на-Дону, два поколения предков которых, согласно данным опроса, являлись русскими и родились в Ростовской области. Частота аллеля CCR5del32 составила в этой группе 0.136 +0.024, что находится в пределах диапазона вариабельности частот в различных географических группах русских. У ВИЧ-инфицированных русских детей частота аллеля CCR5del32 оказалась несколько ниже (0.110+0.031), однако различия не достигают значимого уровня (0/?= 1.21, р=0.69).
Табл. 8. Распределение частот генотипов и аллелей по гену CCR5 у ВИЧ-
Группа N Число индивидов (частоты генотипов, %) Частота аллелей и стат. ошибка (±SE) Сравнение ВИЧ+и контрольно й группы
wtAvt wt/del del/del wt del
ВИЧ, дети калмыки 27 27 0 0 1 0 OR = 2.85 р=0.558
Контроль, калмыки Элисты 70 67 (95.71) 3 (4.28) 0 0.979 + 0.012 0.021 + 0.012
ВИЧ, русские дети 50 39 (78.0) 11 (22.0) 0 0.890 + 0.031 0.110 + 0.031 OR= 1.21 р = 0.690
Контроль, русские Ростовской обл. 99 73 (73.7) 25 (25.3) 1 (1.0) 0.864 + 0.024 0.136 + 0.024
3.6. Мета-анализ: снижает ли гетерозиготное носительство CCR5del32 риск инфицирования?
Для проведения мета-анализа из более 360 статей, выявляемых в PubMed по запросу «CCR5 AND deletion AND HIV» (сентябрь 2011), были отобраны статьи, в которых сравниваются частоты аллелей и генотипов в выборках ВИЧ-инфицированных индивидов и соответствующих контрольных выборок неинфицированных индивидов. Публикации, содержащие исследования азиатских, африканских и латиноамериканских популяций, в которых аллель CCR5del32 встречается с частотой 1-3% или ниже, были исключены.
Из-за различий частот аллеля CCR5del32 в популяциях европейского происхождения (от 5-8% на юге Европы до 15-18% на севере) [Balanovsky et al., 2005] необходимо, чтобы индивиды контрольных групп строго соответствовали по этнической принадлежности (а в некоторых случаях и по подгруппам внутри этнической группы) индивидам группы инфицированных. Поэтому публикации, в которых этническая принадлежность исследуемых групп не указана или исследуемые выборки не были этнически гомогенными, также были исключены. В итоге для мета-анализа были отобраны исследования европеоидов - 25 групп, включая собственные данные, всего 5967 ВИЧ-инфицированных индивидов и 5410 индивидов в контрольных группах.
Частота гомозигот по делеции составила 4 из 5967 для ВИЧ-инфицированных против 63 из 5410 в контроле. Такое соотношение частот соответствует ОЯ=17.6 при р=4.410"16. В данном случае оценка относительного риска приблизительно равна OR, то есть вероятность инфицирования гомозигот по делеции в 17.6 раз меньше, чем для носителей остальных генотипов. Близкие оценки протективного эффекта гомозиготности по делеции получены в отдельных исследованиях для белых американцев при сравнении групп серонегативных индивидов, подвергавшихся риску инфицирования, с серопозитивными и популяционным контролем [Zimmerman et al., 1997; Liu et al., 2004] и других исследованиях [Dean et al., 1996; Samson et al., 1996]. Поэтому гомозиготы CCR5del32/ CCR5del32 были исключены из дальнейшего анализа, и для оценки риска инфицирования рассматривали соотношение гетерозиготных носителей аллеля CCR5del32 и индивидов, у которых данный аллель отсутствовал, т.е. соотношение генотипов wt/ CCR5del32 и wt/wt в группах ВИЧ-инфицированных и популяционном контроле.
Сравнение частот генотипов показало, что только в 4 из в 25 исследований, вошедших в мета-анализ, частота гетерозигот wt/ CCR5del32 у инфицированных превосходила таковую у здоровых лиц. При предположении о случайности эффекта вероятность события «из 25 работ в не более чем в 4 частота гетерозигот у больных выше, чем у здоровых» равна 4.7-10"7 (аналогично вероятности выпадения не более 4 «орлов» в 25 бросаниях монеты).
Для каждой выборки было вычислено отношение шансов (OR) и проведено их усреднение с учетом численности выборок и степени однородности эффектов. Результаты представлены в графической форме (рис. 9).
При проведении мета-анализа принято рассматривать возможность искажения представленности данных в публикациях (publication bias). Это связано с тем, что авторы работ и редакции журналов охотнее публикуют положительные результаты, чем отрицательные или "нулевые". Кроме того, слишком часто публикуются работы с большими эффектами, полученные для малых выборок. Все это может привести к завышению оценки усредненного значения эффекта при мета-анализе (рис. 10А). Стандартный метод проверки симметричности представленных данных состоит в построении зависимости величины эффекта (OR) от объема выборки (funnel-plot -"график-воронка"). Сильная асимметрия этого графика может указывать на избирательную представленность данных в публикациях. В нашем случае (рис. 10Б) асимметрия незначима: ранговая корреляция Кендалла между OR и объемом выборки равна 0.21 при /7=0.187; асимметрия по регрессионному тесту [Egger et al., 1997] недостоверна (р=0.148).
Samson etal., 1996 Morawetz et al., 1997 Zimmerman et al., 1997 Eugen-Olsen et al., 1997 Balotta et al., 1997 Stewart et al., 1997 Pastinen et al., 1998 Poljak et al., 1998 Alvarez et al., 1998 Казеннова и др., 1998 Шадрина и др, 2000 Ruizet al.. 2001 Barber et al., 2001 Barabds et al.. 2002 Рябов и др.. 2002 Phillpot et al., 2003 Bognev el al., 2004 Liu et al., 2004 Wasik et al., 2005 Trecarichi et al.. 2006 Adojaan et al.. 2007 Oh et al., 2008 Takacovd et al., 2008 Parczewski et al., 2009 Наст, работа, русские МН-среднее
♦ ♦ ♦
і і ♦ ♦ ♦ ♦
1:Ц 'У;
0 0.5 1.5 OR
Рис. 9. Оценки отношений шансов (ОН) и соответствующие 95%-ые доверительные интервалы для 25 выборок европеоидов.
Вертикальная пунктирная линия соответствует 0/?= 1 (отсутствие эффектов). Точки справа от этой прямой указывают на протективный эффект генотипа ССЯ5 \vtZdel32. Размеры маркеров-квадратиков условно пропорциональны объемам выборок. Нижний маркер-ромб соответствует усредненной оценке ОЯ по Мантелю-Хензелю (МН-среднее).
А Б
Рис. 10. Зависимость величины эффекта (OR) от состава выборок, вошедших в мета-анализ (funnel-plot - "график-воронка"). Сильная асимметрия этого графика может указывать на избирательную представленность данных в публикациях (publication bias). А - Гипотетическое распределение исследований по размеру изученных выборок и силе эффекта. При исключении менее охотно публикуемых результатов исследований малых выборок со слабыми эффектами (точки в пунктирном овале) значение OR оказывается завышенным (красная стрелка) относительно "реального" (черная стрелка). Б - распределение исследований по размеру выборок и силе эффекта для 25 публикаций, включенных в мета-анализ в данной работе (асимметрия незначима).
Таким образом при мета-анализе, включающем и собственные экспериментальные данные, выявлен статистически значимый, хотя и слабый протективный эффект гетерозиготного носительства аллеля CCR5del32 в отношении инфицирования ВИЧ: OR= 1.22 при р=0.0002. Достаточно низкое значение OR объясняет, почему в большинстве статей не обнаружены значимые различия частоты гетерозигот по данному аллелю (и частот аллеля) между ВИЧ-инфицированными и контрольными группами. Вычисления показывают, что при частоте делеционного аллеля 10% и OR= 1.22 значимый эффект (р=0.05 при мощности 80%) может быть обнаружен лишь при общем объеме выборки 4500 (2250 больных и 2250 здоровых).
Полученная оценка OR= 1.22 не означает, что риск инфицирования для носителей гомозиготного генотипа wt/wt на 22% выше, чем для носителей гена CCR5del32. По определению OR является отношением шансов, но не рисков инфицирования. Отношение рисков (RR), которое определяется как отношение заболеваемостей при различных генотипах, невозможно непосредственно оценить в ассоциативных исследованиях типа «case-control». Можно лишь предложить различные косвенные оценки RR на основе значений OR и популяционных частот аллелей, либо данных по заболеваемости [Viera. 2008]. Кроме того, всегда выполняется неравенство: OR>RR. По результатам настоящего мета-анализа соответствующие оценки равны: 5£=0.851 и P(wt/wt)=0.835, откуда R/?=0.13. Таким образом, для гомозигот wt/wt вероятность инфицирования как минимум на 13% выше, чем для носителей аллеля CCR5del32.
Наша оценка основана на сравнении соотношения частот генотипов wt/ CCR5del32 и wt/wt у ВИЧ-инфицированных и в популяционном контроле. При этом очевидно, что ВИЧ-инфицированные контактировали с вирусом и были инфицированы, а в популяционном контроле индивиды с вирусом не контактировали (доля контактировавших и/или ВИЧ-инфицированных предполагается пренебрежимо малой в исследованных популяциях европейского происхождения). Более точно оценить протективный эффект гетерозиготности можно при использовании контрольной группы из индивидов, контактировавших с вирусом, но оставшихся ВИЧ-негативными. Однако в существующих группах высокого риска (больные гемофилией; половые партнеры ВИЧ-инфицированных; потребители инъекционных наркотиков; мужчины, практикующие незащищенные рецептивные анальные половые контакты с мужчинами (MSM); лица, занимающиеся проституцией) доля индивидов, контактировавших с вирусом, сильно различается и не всегда может быть установлена. При проведении мета-анализа результатов таких исследований можно использовать модель со случайными эффектами. Однако из-за гетерогенности выборок оценки OR в различных исследованиях в значительной мере отражают не собственно протективный эффект аллеля в группе контактировавших с вирусом, а вероятность контакта с вирусом в различных группах риска.
Этот феномен может быть проиллюстрирован при сравнении частоты гомозигот по делеционному аллелю у неинфицированных пациентов в двух группах риска - больных гемофилией [Salkowitz et al., 2001] и потребителей внутривенных наркотиков [Рябов и др., 2002]. В группе потребителей внутривенных наркотиков частота гомозигот CCR5del32/del32 составила 5.5% (4 из 53 человек), а среди неинфицированных пациентов с гемофилией - 16.3% (7 из 43 человек), при том, что популяционная частота таких гомозигот в европеоидных популяциях не превышает 1-2%. Различия в частотах гомозиготных носителей делеции в двух группах риска статистически значимы (р = 0.038, двусторонний тест Фишера). Более высокая частота гомозигот CCR5del32/del32 среди больных гемофилией объясняется более высоким риском заражения - у пациентов, получавших интенсивное лечение препаратами крови в 1978 - 1985 годах, он составлял 94% [Salkowitz et al., 2001], и, соответственно, протективный эффект проявился более ярко. Так как почти 100% больных, получавших препараты крови, контактировали с вирусом, можно полагать, что более высокая частота гомозигот по делеционному аллелю, т.е. более выраженный протективный эффект, не может быть достигнут из-за генетической гетерогенности признака устойчивости к заражению макрофаготропными
штаммами ВИЧ [58], подобно тому, как в природных условиях в одной и той же популяции происходит отбор протективных аллелей различных генов, обеспечивающих устойчивость к инфекции (например, к малярии).
На основе мета-анализа опубликованных данных нами впервые оценено влияние гетерозиготного носительства делеционного аллеля ССК5с1е132 на риск ВИЧ-инфицирования в популяциях европейского происхождения (без учета пути заражения, серотипа вируса и различий в проведении антиретровирусной терапии). Выявленный нами протективный эффект невелик (О/? = 1.22), но статистически значим, и соответствует, согласно расчетам, не менее чем 13% снижению риска инфицирования у носителей генотипа СС115к1Ме132. Небольшая величина ОН объясняет, почему в большинстве статей обнаруживаемые различия в частотах генотипов и/или аллеля ССЯ5(1е132 между группами ВИЧ-инфицированных и популяционным контролем статистически незначимы.
Демонстрация достоверности данного феномена требует исследования выборок тем большего размера, чем ниже частота встречаемости аллеля в популяции. В частности, в популяциях Китая, где частота встречаемости аллеля СС/?5г/е/32 ниже, чем у европейцев, мета-анализ (14 исследований, 1607 инфицированных и 1632 индивида в контрольных группах) не обнаружил значимого протективного эффекта гетерозиготного носительства кМек ОЛ = 1.156 (95%С1 = 0.808-1.654) [Не е1 а1, 2011].
Наиболее высока (15-18%) частота аллеля групп Северо-Запада Европы (финны, эстонцы, мордва, татары и др.), тогда как в большинстве популяций Африки и Азии частота аллеля не превышает 2% (см выше). Могут ли различия в частоте протективного аллеля ССК5с1е132 играть существенную роль в защите от ВИЧ-инфекции на популяционном уровне или объяснять различия в смертности ВИЧ-инфицированных?
Теоретически популяционные эффекты, обусловленные присутствием делеционного аллеля, можно оценить следующим образом. Пусть q - частота делеционного аллеля и - выживаемость инфицированных носителей
генотипов \vtZwt, к1/ССК5йе132, ССК5(1е132/ССК5с1е132 соответственно. Тогда средняя популяционная выживаемость 8рор превышает выживаемость носителей генотипа \vtZwt на величину
Л* = - = О - ?)2 ^ + 2*(1 - 9)5^ + - 5„ - 2(Я„, - )?.
В последнем равенстве мы пренебрегли членами порядка д2. Таким образом, протективный эффект гетерозиготного носительства аллеля ССЯ5е!е132 (40% снижение смертности инфицированных) при частоте данного аллеля 10% дает 8% снижение смертности в целом для ВИЧ-инфицированных по сравнению с группой, в которой носители аллеля отсутствуют. Аналогично рассчитывается снижение риска инфицирования за счет присутствия в популяции аллеля ССЯ5(1е132. Если вероятность инфицирования гетерозигот понижена на 13%, то в популяции в целом частота инфицирования снижена на 3.3%. При 15% частоте аллеля снижение инфицируемости составило бы 5.6%, а смертности ВИЧ-инфицированных - 12%.
Таким образом, на популяционном уровне защита от инфицирования ВИЧ и снижение смертности ВИЧ-инфицированных даже в группах с высокой частотой ССК5с1е132 (15%) невелика. Помимо ССЛ5<1е132 имеются другие гены, которые влияют на восприимчивость к ВИЧ и ход развития ВИЧ-инфекции [Р1асепйш й а., 2009] и могут вносить вклад в межпопуляционные различия. Однако возможный вклад этих генов в межпопуляционные различия в развитии ВИЧ-инфекции требует дальнейших исследований, в которых, как надеется автор, выборки с нозокомиальными инфекциями более не будут доступны.
4. Гены, контролирующие метаболизм алкоголя:
Алкоголь окисляется в организме человека в два этапа. До 80-90% экзогенного этанола окисляется под действием печеночных ферментов алкогольдегидрогеназы и альдегиддегидрогеназы, кодируемых генами АОН1В и \LD112. Вторым по значению (около 9%) является окисление микросомальными системами. Каталазное окисление дает вклад около 1% (см. обзоры [На1е], Велик, 1987; Лужников, 1994]).
4.1. Определение частот аллелей и генотипов ALDH2*Glu504Lys (rs671) в исследуемых популяциях
К началу нашего исследования были известны частоты аллелей ALDH2 в популяциях Европы и Восточной Азии. Однако для популяций Центральной Азии данные практически отсутствовали, популяции Ближнего Востока были представлены немногими группами. Для населения России было исследовано несколько популяций (русские Вологды, адыгейцы, чуваши, ханты, коми, буряты, алтайцы, якуты, чукчи, сибирские эскимосы) общей численностью 690 человек. При этом при достаточно большом размере одних выборок (якуты - 270 человек), размер выборок, представляющих южносибирские популяции, был невелик (алтайцы - 17 человек, буряты - 30 чел) [Курилович и др., 1994; Thomasson et al. 1992; Oota et al. 2004; Novoradovsky et al. 1995]. Из 690 человек лишь один (в выборке бурят) оказался гетерозиготным носителем аллеля ALDH2*504Lys [Thomasson et al. 1992]. В связи с этим оставались неясными границы распространения аллеля ALDH2*504Lys. Поэтому были выбраны доступные для исследования популяции России, Центральной Азии и Ближнего Востока, которые позволили бы заполнить белые пятна на геногеографической карте.
Нами установлены генотипы для 699 человек из 14 популяций, представляющих 11 этнических групп. Частоты аллелей и генотипов представлены в табл. 9. Лишь в пяти из исследованных групп выявлены носители аллеля ALDH2*504Lys, остальные группы оказались мономорфны - в них все индивиды имели генотип Glu/Glu по полиморфизму ALDH2*Glu504Lys. В популяциях европейской части России аллель не выявлен, его частота, согласно расчетам для размера исследованных выборок, не превышает 2%. Это соответствует опубликованным данным для европейских популяций, обобщенным в нашей статье в соавторстве с группой проф. К. Кидда [Li et al., 2009]. Общая численность изученных выборок, представляющих европейские популяции (ирландцы, англичане, датчане, финны, шведы, немцы, саамы Норвегии и Швеции, венгры, испанцы), для которых доступны опубликованные данные, составила более 1700 человек. Из них только у венгров аллель представлен с частотой 1%, тогда как в других популяциях аллель не выявлен. Опубликованные данные для популяций европейской части России (русские Архангельской обл. и Вологды, коми-зыряне и чуваши) показывают, что аллель отсутствует в этих популяциях, за исключением 1 индивида в выборке русских Архангельской обл. [Li et al., 2007].
4.2. Анализ географического распределения частот аллеля ALDH2*504Lys в популяциях мира
Для анализа распределения частот аллеля ALDH2 *504Lys в популяциях мира были использованы собственные и собраны литературные данные для 80691 индивида из 366 популяций. Популяции Африки и Америки были исключены, так как данный аллель в них практически отсутствует. Для построения карты были использованы собственные и опубликованные данные преимущественно для азиатских популяций, всего для 49501 индивида из 190 популяций (рис. 11А). Как видно из полученного распределения, частота аллеля ALDH2*504Lys достигает максимума в населении южных провинций Китая (китайцы хакка - 40.9%) и в центральной Японии, тогда как в популяциях северных и западных провинций Китая частота аллеля составляет 9-15%%. В популяциях Кореи частота аллеля составляет 15%-26%, в Вьетнаме, Лаосе и Камбодже не превышает 14-17%%. В Австралии и Океании частота аллеля не превышает нескольких процентов. В направлениях на север и на запад от зоны максимума частота аллеля снижается, достигая 1%-3% в популяциях Центральной Азии, Южной Сибири и Дальнего Востока. На Ближнем Востоке аллель практически отсутствует. Полученные нами данные позволяют установить северную и западную границы ареала распространения ALDH2*504Lys.
Выявленная картина географического распределения аллеля ALDH2*504Lys может объяснять локальным действием отбора в популяциях Восточной Азии в сочетании с более поздними миграциями, приведшими к распространению аллеля из регионов с его высокой частотой. Альтернативное объяснение (повышение частоты за счет генетического
Табл. 9. Частоты аллелей ALDH2*504Lys и ADHlB*48His в популяциях России и
сопредельных стран
Популяция ALDH2*504Lys ADHlB*48His
N Частота аллеля N Частота аллеля
Русские (Кострома) 118 0.030 (0.019-0.041)
Русские (Курск) 86 0.076 (0.056 -0.096)
Русские (Ростовская обл.) 48 0 (0-0.020) 96 0.042 (0.028 -0.056)
Русские (Москва) 104 0.019(0.010-0.028)
Русские (Чукотка) 29 0.069 (0.036 -0.102
Украинцы 109 0.083 (0.064 -0.102)
Белорусы 126 0.028 (0.018-0.038)
Саамы Кольские 62 0.040 (0.022 -0.058)
Коми-зыряне 49 0.051 (0.029-0.073)
Марийцы 62 0 (0-0.016) 98 0.112(0.089-0.135)
Удмурты (Малопург. р-н) 84 0 (0-0.012) 68 0.125(0.097- 0.153)
Удмурты (Игринский р-н) 94 0.117(0.094-0.150)
Татары казанские 21 0.119(0.059-0.169)
Калмыки (Элиста) 59 0.263 (0.222 -0.304)
Иранцы 41 0 (0-0.024) 41 0.244(0.197 -0.291)
Туркмены 65 0 (0-0.015) 54 0.204(0.165 -0.243)
Таджики 16 0.031 (0-0.062) 16 0.344 (0.260 -0.428)
Горцы Памира 34 0 (0-0.029) 30 0.217(0.164-0.270)
Казахи 34 0.014 (0-0.028) 35 0.200(0.152 -0.248)
Уйгуры 30 0.017 (0-0.034) 29 0.190(0.138-0.242)
Буряты (Улан Удз) 70 0 (0-0.014) 61 0.213(0.176 -0.250)
Буряты (Курумкан) 67 0 (0-0.015) 61 0.197(0.161 -0.233)
Буряты (Агинские) 69 0.014 (0.0040.024) 65 0.254 (0.216-0.292)
Чукчи 45 0.022 (0.007 -0.037)
Нивхи 31 0.177 (0.129-0.225)
Удэгейцы 67 0.037 (0.021-0.053) 58 0.267 (0.226 -0.308)
Нанайцы 12 0 (0-0.083) 13 0.269(0.182-0.356)
Всего: 699 1617
Рис. 11. Географическое распределение частот аллелей генов метаболизма алкоголя.
А - аллель ALDH2*504Lys в Евразии (на основе данных для 190 популяций). Отмечены границы областей с частотой аллеля 12% и 24%. Б - аллель ADHlB*48His (на основе данных для 172 популяций) Карты построены с помощью программы Surfer 8.00 (Golden Software).
дрейфа) маловероятно, так как этот район во все периоды истории человечества был одним из самых плотно заселённых.Возникновение аллеля в Южном Китае подтверждается результатами анализа гаплотипов локуса ALDH2 [Luo et al., 2009]. Так как опубликованы данные, указывающие на возможное повышение частот аллеля ALDH2*504Lys в популяциях Юго-Восточной Азии под действием отбора [Oota et al., 2004], установленная картина географического распределения частот аллеля ALDH2*504Lys может послужить основой исследования факторов отбора, действовавших в прошлом или действующих в настоящее время.
4.3. Определение частот аллелей и генотипов гена альдегиддегндрогеназы
ADHlB*Arg48His (rsl229984 ) в исследуемых популяциях и ассоциация аллелей
с характером потребления алкоголя
Начиная с популяционного исследования Goedde et al. [1992] к 2005 г. были опубликованы данные о частотах аллелей ADHlB*Arg48His для 150 популяций мира. При этом, также как и для локуса ALDH2, большинство данных было получено для популяций Европы и Юго-Восточной Азии, с небольшим количеством популяций Ближнего Востока (друзы, самаритяне, разные группы евреев) [Osier et al., 2002]. В европейских популяциях частота аллеля ADHlB*48His не превышала 8%, в населении Юго-Восточной Азии достигала 70%, а на Ближнем Востоке варьировала от 24% до 42% у друзов и разных групп евреев ([Neumark et al.,1998; Osier et al., 2002]. Более высокие частоты (46%-68%) были определены для этнических групп Ирана (108 турков северозападного Ирана, 107 туркменов северного Ирана и 106 персов-зороастрийцев из г.Тегерана) [Sepehr et al., 2004] и самаритян Израиля (68% [Osier et al., 2002]. Для турков Турции частота аллеля составила 12.5% [Goedde et al., 1992]. Таким образом, для популяций Ближнего Востока частоты аллеля ADHlB*48His варьировали в значительном диапазоне - от 12.5% до 68%.
Для населения России были установлены частоты аллелей в популяциях алтайцев, бурят, якутов, чукчей, сибирских эскимосов и в нескольких русских популяциях. При этом для русских были получены противоречивые данные о частота аллеля ADHlB*48His: 41% для русских Москвы (выборка 52 новорожденных москвичей [Ogurtsov et al., 2001]), 19.7% для русских Новосибирска (выборка 299 чел. [Belkovetz et al., 2001]), 6% для русских Вологды (48 человек [Osier et al., 2002]) и 3.6%-7.5% в трех выборках общей численностью 339 человек русских Сибири [Марусин и др., 2004]. Повышенная частота аллелей у русских [Ogurtsov et al., 2001] была многократно процитирована как в научных публикациях (например, [Brennan et al., 2004, Li et al., 2007]), так и в СМИ, причем в части публикаций эти данные интерпретировались как генетическая особенность русских, связанная с их предрасположенностью к потреблению больших доз алкоголя [Mainville, 2004], что противоречит данным других авторов о снижении количества потребляемого алкоголя у носителей этого аллеля (обсуждение приведено в обзоре литературы).
Для уточнения частот аллеля ADHlB*48His у русских и в популяциях Ближнего Востока, а также для уточнения распределения частот аллеля на геногеографической карте Евразии, нами было проведено генотипирование индивидов из 26 выборок общей численностью 1617 человек, представляющих 20 этнических групп России и сопредельных стран (табл. 9). Частоты генотипов во всех изученных выборках соответствуют равновесному распределению Харди-Вайнберга, за исключением маленькой (13 человек) выборки нанайцев.
Проведенный нами анализ собственных и опубликованных данных показывает, что частота аллеля ADHlB*48His во всех исследованных группах русских, кроме упомянутых выше двух работ с предполагаемым завышением частот, составляет от 1.9% до 7.6% (в среднем 4.9%) (табл. 10), что не отличается от частот этого аллеля в европейских популяциях (0-8%).
Для русских мужчин показано, что носительство аллеля ADHlB*48His обладает протективным действием в отношении запоев. В группе 642 русских мужчин с охарактеризованным (по данным опроса) потреблением алкоголя выявлено 68 (10.6%)
Табл. 10. Частоты аллеля ADHlB*48His у русских различных регионов
Исследованная группа N Частота ADH1B *48His, % Лит.
Русские Архангельской обл. 30 5.0 Han et al., 2007
Русские Вологды 47 6.0 Osier et al., 2002
Русские Костромы 118 3.0 Собственные данные
Русские Курска 86 7.6 Собственные данные
Русские Ростовской обл. 96 4.2 Собственные данные
Русские Москвы 104 1.9 Собственные данные
Русские Москвы 797 5.9 Hashibe et al., 2008
Русские Башкортостана 99 2.5 Borinskaya et al., 2009
Русские Томской обл. 487 6.0 Borinskaya et al., 2009
Русские Чукотки 29 6.9 Собственные данные
ВСЕГО: 1893 4.9
Русские Москвы 52 41.3а Ogurtsov et al., 2001
Русские Новосибирска 299 19.7 а Belkovets et al.,2001
а - предполагаемое завышение частот аллеля, выборки исключены из дальнейшего анализа
Табл. 11. Частота аллеля ADHlB*48His в популяциях Ближнего Востока и Африки
Популяция N Частота аллеля ADHlB*48His, % Лит.
Турки (Турция) 44 12.5 (9.0-16.0) Goedde et al. 1992
Турки (Турция) 211 8.1 (6.8-9.4) Kayaalti Z, Solemezoglu, 2010
Туркмены (Туркменистан) 54 20.4 (16.5-24.3) Собственные данные
Туркмены (Иран) 253 21.0 (19.2-22.8) Akbari et al., 2009
Иранцы (Иран) 41 24.4 (19.7-29.1 ) Собственные данные
Арабы Кувейта 16 9.4 (4.2-14.6) Li, Kidd, 2009
Арабы Палестины 70 15.7 (12.6-18.8) Li, Kidd, 2009
Арабы Палестины 9 16.7 (3.6-41.4) Собственные данные
Арабы Сирии 23 13.0 (4.9-26.3) Собственные данные
Арабы Ливана 19 15.8 (6.0-31.3) Собственные данные
Арабы Иордании 21 31.0 (17.6-47.1) Собственные данные
Арабы Ирака 8 25.0 (7.3-52.4) Собственные данные
Арабы Йемена и Омана 5 10.0 (0.05-19.5) Собственные данные
Арабы Египета 6 16.7 (2.1-48.4) Собственные данные
Арабы Судана 3 16.7 (0.05-31.9) Собственные данные
Алжирцы и Тунисцы 4 12.5 (0.09-34.1) Собственные данные
Арабы Марокко 7 7.1 (0.03-13.9) Собственные данные
Арабы Марокко 94 8.0 (6.0-10.0) Osier et al., 2002
Друзы (Израиль) 74 27.0 (23.4-30.6) Osier et al., 2002
Самаритяне (Израиль) 34 68.0 (62.3-73.7) Osier et al., 2002
Евреи ашкеназы (Израиль) 81 27.8 (24.3-31.3) Li, Kidd, 2009
Евреи ашкеназы (Израиль) 23 20.0 (14.1-25.9) Hasin et al., 2002
Евреи сефарды (Израиль) 25 41.0 (34.0-48.0) Hasin et al., 2002
Йеменские евреи(Израиль) 38 42.1 (36.4-37.8) Osier et al., 2002
Эфиопские евреи (Израиль) 30 40.8 (34.5-47.1) Osier et al., 2002
Турки Ирана 108 46.0 а Sepehr et al., 2004
Туркмены Ирана 107 51.0а Sepehr et al., 2004
Персы-зороастрийцы 106 68.0 а Sepehr et al., 2004
а - предполагаемое завышение частот аллеля, выборки исключены из дальнейшего анализа
носителей генотипа Arg/His. Ни один из них не имел запоев в год, предшествующий обследованию. Среди 574 носителей генотипа Arg/Arg доля мужчин, имевших запои, составила 8.4% (48 человек). Различия в отношении запоев между носителями разных генотипов статистически значимы по точному критерию Фишера, OR= 12.62, 95% C.I. 1.57 -о, Р=0.006).
Нами установлена частота аллеля ADHlB*48His у иранцев (24.4%) значительно ниже частоты 46%-68%, приведенной в статье [Sepehr et al., 2004], но близки к недавно опубликованным данным о частоте этого аллеля у туркмен Ирана (20.4%) [Akbari et al., 2009]. Так как ни в одной из ближневосточных популяции частота аллеля ADHlB*48His не превышает 45% (табл. 11), а в работе [Sepehr et al., 2004] сообщается об отклонении от распределения Харди-Вайнберга, можно предполагать, что частоты в [Sepehr et al., 2004] завышены в результате ошибки генотипирования.
4.4. Анализ географического распределения частот аллеля ADHJB*48His в
популяциях мира
Для детального исследования географического распределения частот аллеля ADHlB*48His мы проанализировали опубликованные данные. При этом в 48 проанализированных нами публикациях некорректные частоты аллелей приведены в 4 статьях: ошибки генотипирования были выявлены в трех обсуждавшихся выше статьях [Ogurtsov et al., 2001; Belkovetz et al., 2001; Sepehr et al., 2004] и в статье [Ma et al., 2005] перепутаны обозначения аллелей. Однако в крупнейшей базе данных ALDFRED частоты алеллей для этих групп остались неисправленными. Исключив из анализа популяции с ошибочными и сомнительными данными, мы использовали данные для 172 популяций Евразии и Африки с доступными для определения географическими координатами для построения карты распределения частот аллелей (рис. 11Б). Популяции, представляющие коренное население Америки, не были включены в анализ, так как аллель ADHlB*48His практически отсутствует.
Так как предполагается, что аллель ADHlB*Arg48His был привнесен в российские популяции с миграциями из ближневосточных или юго-восточных популяций, были проведена оценка возможной внутрипопуляционной дифференциации между подгруппами носителей аллеля 48His и индивидов с генотипом 48Arg/48Arg. Такие различия могли бы указать на источниковые популяции для аллеля ADHlB*48His в изученных группах. Для определения внутрипопуляционной дифференциации использовали данные о генотипах по нейтральным STR-маркерам (15 STR-маркеров коммерческого набора PowerPlexl6 фирмы Promega) для тех же индивидов, для которых были установлены генотипы по ADHlB*Arg48His. Показано, что межпопуляционные различия между русскими, украинцами, белорусами и коми по STR-локусам незначимы, а в ряде случаев внутрипопуляционные различия превышали межпопуляционные С учетом относительно невысокой частоты аллеля ADHlB*48His эти выборки были объединены. Были подсчитаны частоты каждого аллеля каждого STR-локуса в подгруппах носителей аллеля His (генотипы Arg/His и His/His) и носителей генотипа Arg/Arg. Из сравнения были исключены редкие аллели. Из 108 сравнений было выявлено 6 случаев с вероятностью случайности различий р<0.05. Однако с учетом поправки Бонферрони (уровень р<0.0005) эти различия оказались незначимы. Таким образом, внутрипопуляционная дифференциация носителей аллеля ADHlB*48His не выявлена.
4.8. Сопоставление географического распределения частот аллелей
ADHlB*48His и ALDH2*504Lys и возможные факторы отбора
В ряде работ показано, что в популяциях Юго-Восточной Азии оба аллеля -ADHlB*48His и ALDH2 *504Lys - находятся под действием отбора [Oota et al., 2004, 2007]. Предположения о том, что частоты этих аллелей в популяциях Юго-Восточной Азии возросли под действием отбора, были выдвинуты вскоре после того, как было
установлено, что различия между «типичными» ADHlB*48Arg и ALDH2*504Glu) и «атипичными» (ADHlB*48His и ALDH2*504Lys) вариантами обусловлены единичными аминокислотными заменами, и что «атипичные» варианты являются эволюционно более поздними, чем распространенные у европеоидов «типичные» изоформы ферментов. Доводом в пользу отбора было то, что повышена частота производных аллелей, расположенных на разных хромосомах генов, которые контролируют одно звено метаболизма, и оба атипичных варианта ферментов повышают концентрацию ацетальдегида [Dcuta et al., 1986]. В качестве фактора отбора предполагались особенности диеты, в частности, потребление алкоголь-содержащих напитков и пищи. При этом подразумевалось, что адаптивную ценность этим аллелям обеспечивало именно их протективный эффект в отношении развития алкоголизма [Dcuta et al., 1986]. Согласно недавнему исследованию, частота аплеля ADH]B*48His максимальна (98.5%) в провинции Чжэцзян на юго-востоке Китая, в районе, где обнаружены самые ранние археологические свидетельства одомашнивания риса [Peng et al., 2010]. Однако с нашей точки зрения совпадение максимальных частот аллелей с регионами распространения рисоводства не означает, что именно употребление алкоголь-содержащих напитков на основе риса было тем фактором, который вызывал повышение частот атипичных аллелей. Одомашнивание риса могло сказаться на эпидемиологической обстановке. В Юго-Восточной Азии, как и в некоторых других регионах, рис выращивается на заливных полях. Эти поля представляют очаги размножения москитов, улиток и других переносчиков возбудителей тропических инфекций [Ohmae et al., 2003; Shenoi et al., 2005; Athari et al., 2006; Yasuoka, Levins, 2007]. Можно предполагать, что поскольку аллель ADHlB*48His распространён, хотя и с меньшей частотой, в популяциях Ближнего Востока, где заливное рисоводство отсутствует, факторы отбора в них могут быть сходными с таковыми в популяциях Юго-Восточной Азии. Эти же факторы могут действовать и в Африке, где распространен другой аллель со сходным фенотипическим проявлением, ADHlB*370Cys [Osier et al., 2002]. Адаптивная ценность апллей может быть связана не с их влиянием на метаболизм экзогенного алкоголя, а с метаболизм тех эндогенных субстратов, которые могут быть существенны для развития паразитов. Гипотеза о том, что фактором отбора аллелей ADHlB*48His и ALDH2*504Lys могла быть какая-либо тропическая инфекция (по типу малярии и серповидноклеточной анемии), была выдвинута Дж. Лонгом. [Long, 2001]. Сходное предположение выдвинуто группой К.Кидда [Oota et al., 2004].
Табл. 12. Коэффициенты корреляции частот аллеля ADHlB*48His с
распространенностью факторов среды (двусторонний тест Пирсона)
Идентификацио нный номер переменной в Атласе Фактор среды R Р
v.3 Земледелие 0,13 0,71
v.5 Скотоводство -0,69 0,02
v.1253 Лейшманиаз -0,52 0,10
v.1254 Трипаносомоз -0,35 0,29
v.1255 Малярия 0,41 0,21
v.1256 Шистосоматоз 0,52 0,10
v.1257 Филяриоз 0,82 0,0001
v.1258 Спирохетозы 0,18 0,60
v.1259 Проказа 0,48 0,14
Если какой-либо из перечисленных факторов среды влияет на частоту аллеля, то можно ожидать, что в популяциях, в среде обитания которых фактор присутствует, частоты аллеля будут в среднем выше, чем в тех, в которых фактор отсутствует. Чтобы проверить эту гипотезу, мы использовали описанный в предыдущих разделах подход и провели анализ корреляций частот аллеля АОН1В*48Ш1 с наличием эндемичных
инфекций, скотоводства (одомашнивание скота послужило распространению инфекций) и земледелия. Для 14 изученных групп в «Атласе» имелись соответствия. Полученные коэффициенты корреляции приведены в табл. 12. Для двух переменных (скотоводство и филяриоз) получены значимые корреляции, но лишь для филяриоза корреляция остается значимой после поправки на множественное тестирование. В тех популяциях, для которых филяриозы эндемичны, частота аллеля АВН1В*48Шз составляет от 20% до 80%. В тех популяциях, где эта инфекция не представлена, частота аллеля не превышает 30% (рис. 12).
Филяриатозы Эндемичны ■ Micronesians Vietnamese Nasioi Khmer Falasha Japanese □ □ □□ □ □ rP O □ a._. . Atayal Malaysians Chinese Korean
Отсутствуют RU5s£!TAd«>el □□ CD n □ q, D Danes - Udmurts M°n9°l lrishTurks
0 20 40 60 80 100%
Частота аллеля ADH1B*48His
Рис. 12. Частоты аллеля АОН1В*48Шв в популяциях в зависимости от наличия филяриозов в регионе проживания
Полученные результаты позволяют выдвинуть гипотезу о том, что аллель АОН1В*48Ш$ может быть протективным в отношении развития филярийной инфекции у человека. Для того, чтобы проверить, что именно с аллель обеспечивает
корреляцию с наличием филяриозов в среде проживания, мы определили корреляции частот аллелей, сцепленных с данным 8№ (рис. 13).
-45 kb
с 105 2 kb или 90.4_
ADH7 |_| ADH1C |-1 ADH1b\
R
Filaria п
Malaria R
Р
Рис. 13. Коэффициенты корреляции частот аллелей локуса ADH с наличием филяриозов в регионе проживания. Для сравнения приведены аналогичные коэффициенты для малярии. Источник данных для частот аллелей - база ALFRED.
sty
0.26
0.15
/ \
Arg47Hls Rsa -
0.12
0.3
0.40
0.07
0.31
0.2
0.25
0.16
Соответствующие коэффициенты корреляции убывают по обе стороны от АИШВ* Arg48His. Это позволяет заключить, что если отбор на устойчивость к филяриозам действовал на локус ДОЯ, то именно функциональный полиморфизм АИШВ* А^48Нй! был его мишенью. Корреляция выявлена нами при исследовании немногих популяций (всего 14 - 7 из эндемичных зон, и 7 из зон, свободных от данной инфекции). Увеличение количества популяций за счет добавления опубликованных данных по европейским популяциям (все из которых свободны от этой инфекции) или восточноазиатским (для большинства из которых инфекция была эндемична в недавнем прошлом) принципиально картину не изменит. Интерес представляет добавление данных по популяциям "промежуточной" зоны. Однако в любом случае наличие корреляции является лишь более или менее веским основанием для гипотезы. Предложенная гипотеза требует экспериментальной проверки. Ее подтверждение или опровержение может быть получено при сравнении частот аллеля АОИ1В*48Н1х в группах больных филяриозами и индивидов, проживающих в зонах распространения инфекции, но остающихся неинфицированными на протяжении длительного времени. Возможна проверка предложенной гипотезы на животных моделях филяриозов (например, на крысах) с применением ингибиторов АльДГ (например, дисульфурама), так как блокирование работы АльДГ приведет к тому же фенотипическому эффекту, что и ускорение работы АДГ. В случае, если гипотеза подтвердится, дисульфурам, использовавшийся ранее в клинической практике для лечения алкоголизма и существующий в виде препаратов пролонгированного действия, может быть использован для профилактики филяриозов.
Заключение
В представляемом исследовании созданы базы данных частот аллелей, проведен анализ корреляций частот аллелей с параметрами среды (географическое положение, экорегион, тип хозяйства, особенности питания, наличие эндемичных инфекций). Как источник информации о параметрах среды использован «Этнографичекий атлас» Дж.П.Мёрдока, который представляет собой уникальный компендиум этнографической информации, описывающий более тысячи обществ. Примененный подход позволил проверить имевшиеся гипотезы и выдвинуть новые о факторах отбора, влияющих на частоты аллелей в популяциях человека (табл. 13).
Табл. 13. Созданные базы данных, исследованные ассоциация с фенотипами и
выявленные корреляции
Ген Кол-во популяций Ассоциации с фенотипами Потенциальные факторы отбора (на основе корреляций с параметрами среды) Ген. структ.
АРОЕ 332 Охота-собирательство, климат [ЕівепЬе^ ее а1„ 2010]
ЕСТ 160 Частота потребления молока, связь потребления молока и МПК Дойка, скотоводство -
ССІІ5 185 Проективный эффект для чЛ!д&\Ъ2 в отношени ВИЧ-инфицирования (0Я=1.22) Не выявлено [№)уетЬег Ы аі., 2005], 8ТЯ (Ро\уегР1ех)
АШН2 190
АйНІВ 172 Защита от запоев (ОЯ=11.1) Инфекции (филярия) БТЯ (Ро\уегР1ех)
Для апробации подхода были отобраны гены с известными функциями. Но такие же корреляции могут быть выявлены для генов с неизвестными функциями, что может стать
основой для предположения о факторах, адаптация к которым привела к межпопуляционным различиям частот аллелей, а следовательно, и о функциях этих генов.
Однако предложенный подход имеет ряд ограничений. Как и в других исследованиях, основанных на анализе корреляций, необходимо учитывать «проблему Гальтона», т.е. то, что введение в анализ множества близкородственных групп создает «искусственную» корреляцию. Решением этой проблемы может быть тщательный отбор групп для корреляционного анализа, с учетом генетической структурированности популяций. Если частота какого-либо аллеля коррелирует с главными компонентами (по множеству маркеров, например, SNP как в работе [Eisenberg et al., 2010] или STR как в работе [November et al., 2005] и в данном исследовании), отражающими генетические различия между популяциями, это является указанием на то, что различия в частотах аллеля сформировались не в результате отбора (локус-специфичного процесса), а в результате популяционных процессов, затрагивающих множество локусов.
Необходимо учитывать также, что при анализе отдаленных популяций, например, таких как восточноазиатские и европейские, любые генетические различия между популяциями окажутся «скоррелированы» с различиями культурными и климато-географическими. Предложенный в данной работе подход с использованием не дихотомизированных переменных, а количественных данных, отчасти может решить эту проблему. Использование количественных данных позволяет изучать корреляции не только глобально или в крупных регионах, но и в более ограниченных группах популяций.
Еще одной проблемой на пути развития предложенного направления является генетическая гетерогенность изучаемых фенотипических признаков, как, например, в случае с исследованными в данной работе генами LCT, ADH1B или ставшим хрестоматийным примером множественных аллелей устойчивости к малярии в разных генах. Необходим тщательный учет полиморфизма изучаемых локусов. Хотя для большинства SNP человека фенотипическое проявление неизвестно (если оно вообще существует), развитие современных постгеномных технологий ведёт к быстрому накоплению данных, и эта проблем может быть отчасти решена уже в ближайшем будущем.
Ограничением предложенного подхода является относительно небольшое количество пересечений между генетически изученными популяциями и теми обществами, которые представлены в «Этнографическом атласе». С учетом быстро происходящего накопления генетических данных, с ростом как числа исследованных генетических локусов, так и числа и разнообразия изучаемых популяций всех регионов мира, необходимо развитие баз данных, содержащих описания параметров среды, которые могут выступать как факторы отбора. Предложенный в данном исследовании подход к выявлению генов человека, потенциально вовлеченных в популяционно-генетическую адаптацию к окружающей среде за счет изменения частот аллелей, и выявлению факторов среды, связанных с этой адаптацией, показывает перспективность развития данного направления исследований.
ВЫВОДЫ
1. Предложен новый подход к выявлению генов человека, потенциально вовлеченных в популяционно-генетическую адаптацию к окружающей среде, и факторов среды, связанных с адаптацией, на основе сравнения межпопуляционных различий в частотах аллелей и формализованных этнографических описаний этнических групп, которым соответствуют изучаемые популяции. Показана эффективность этого подхода для выдвижения и проверки гипотез о вовлечении в адаптацию аллелей и выявлении потенциальных факторов отбора на примере генов аполипопротеина Е АРОЕ, лактазы LCT, хемокинового рецептора CCR5, алкогольдегидрогеназы ADH1B.
2. Установлено географическое распределене частот аллелей генов человека на основе созданных баз данных для генов АРОЕ (аллели е2, еЗ, е4, всего 330 популяций), LCT* -
13910С/Т (160 популяций), CCR5del32 (185 популяций), ADHlB*Arg48His (172 популяции), ALDH2*Glu504Lys (190 популяций), включающие собственные данные {АРОЕ- 1103 индивида, LCT- 1459, CCR5 -643, ADH1B - 1722, ALDH2 -699), полученные преимущественно для ранее неизученных популяций Евразии и Африки.
3. Показано клинальное распределение по широте частот аллелей еЗ и е4 гена АРОЕ в популяциях Африки и Евразии, при этом предковый аллель е4 достигает максимальной частоты в северных (субарктических) и южных (субсахарских) популяциях. Предложена гипотеза об участии гена АРОЕ в адаптации к климатическим условиям. С применением предложенного нового подхода проверена опубликованная ранее гипотеза о более высокой частоте аллеля е4 у охотников-собирателей («thrifty»-гипотеза). Показано, что частота аллеля е4 положительно коррелирует с вкладом охоты-собирательства в хозяйство, и что ассоциация с охотой-собирательством выше, чем с широтой.
4. Показано для восточных славян, что генотип С/С по полиморфизму в регуляторном участке гена лактазы LCT-13910C/T детерминирует гиполактазию, а носительство аллеля Т - персистенцию лактазы у взрослых. Частоты генотипа С/С в популяциях европейской территории России совпадают с установленными ранее клинико-биохимическими методами частотами фенотипа гиполактазия. На основе этого сделан вывод, что в этих популяциях гиполактазия детерминируется преимущественно или исключительно генотипом С/С. Такое совпадение отсутствует в азиатских популяциях, что указывает на возможное наличие в них других генетических детерминантов гиполактазии/персистен-ции лактазы у взрослых.
5. Для русских впервые получена оценка верхней возрастной границы фенотипического проявления различий между генотипом С/С LCT-13910, детерминирующим гиполактазию, и носителями аллеля Т, детерминирующим персистенцию лактазы (22 года) на основе данных о снижении доли индивидов, ежедневного потребляющих молоко, среди носителей генотипа С/С. В группе мужчин старше 22 лет выявлена связь потребления молока с минеральной плотностью кости у носителей аллеля Т и отсутствие такой связи у носителей генотипа С/С. У носителей аллеля Г, пьющих молоко ежедневно, МПК составляет 0.637 г/см2 , у потребляющих молоко не чаще 2 раз в неделю МПК составляет 0.580 г/см , а у тех, кто молоко не потребляет, МПК составляет 0.543 г/см2 (р = 0.0003). У носителей генотипа С/С не выявлены значимые различия значений МПК между группами, потребляющими молоко с разной частотой.
6. На основе собственных и опубликованных данных определено географическое распределение частот аллеля CCR5del32 в популяциях Евразии. На основе сравнения частот аллелей в современных и исторических популяциях Европы и Ближнего Востока выдвинута гипотеза о том, что отбор внес вклад в повышение частоты аллеля CCR5del32, и что отбор действовал на протяжении нескольких тысячелетий.
7. Впервые показано наличие слабого (OR=1.22, Я/?=0.13), но статистически значимого протективного эффекта гетерозиготного носительства аллеля CCR5del32 в отношении ВИЧ-инфицирования. Для гомозигот wt/wt вероятность инфицирования как минимум на 13% выше, чем для носителей аллеля CCR5del32. Исходя из полученной оценки рассчитаны возможные межпопуляционные различия в инфицируемости в зависимости от различия в популяционных частотах аллеля CCR5del32. При вероятности инфицирования гетерозигот CCR5del32 на 13% ниже по сравнению с индивидами, гомозиготными по функциональному аллелю, и практической неинфицируемости гомозиготных индивидов CCR5del32/CCR5del32 снижение инфицируемости в популяции с 15% частотой аллеля CCR5del32 (что близко к максимальной частоте в европейских популяциях) составит всего 5.6% по сравнению с популяцией, в которой данный аллель отсутствует. Согласно полученной оценке, межпопуляционные различия по частоте
аллеля CCR5del32 не вносят существенного вклада в различия по уровню инфицируемости ВИЧ.
8. Определено географическое распределение частот протективного в отношении алкоголизма аллеля ALDH2*504Lys в Евразии на основе данных для 190 популяций, включающих собственные данные для 16 популяций. Во всех исследованных популяциях РФ частота этого аллеля не превышает 2%, вследствие чего вклад носительства аллеля ALDH2*504Lys в генетически обусловленное снижение риска развития алкоголизма на популяционном уровне не может быть значительным для населения РФ. Определено географическое распределение частот протективного в отношении алкоголизма аллеля ADHlB*48His в Евразии и Северной Африке на основе данных для 172 популяций, включающих собственные данные для 27 популяций. Для исследованных популяций РФ частота носителей этого аллеля варьирует от 3-8% для населения европейской части страны до более 35% для коренного населения Южной Сибири и Дальнего Востока. По частотам аллелей ADHlB*48His и ALDH2*504Lys генов алкогольдегидрогеназы и альдегиддегирогеназы, а следовательно и по особенностям метаболизма этанола, определяемым ферментами, кодируемыми этими генами, русские не отличаются от других народов Европы
9. Выявлено протективное действие носительства аллеля ADHlB*48His в отношении запоев у русских (OR= 12.62, р=0.006).
10. На основе анализа корреляций частот аллеля ADHlB*48His с распространенностью эндемичных инфекций в тех же популяциях выдвинута гипотеза о протективном действии этого аллеля в отношении филяриозов.
СПИСОК ОПУБЛИКОВАННЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ Статьи, опубликованные в изданиях, рекомендованных ВАК
1 Боринская С. А., Сафонова А. В., Петрин А. Н., Арутюнов С. Д., Хусаинова Р.И., Хуснутдинова Э.К., Ребриков Д. В., Янковский Н. К., Козлов А.И., Рубанович А. В. Ассоциация генотипа С/С по полиморфизму LCT-13910C/T в регуляторном участке гена лактазы с возрастным снижением минеральной плотности кости // Медицинская генетика, 2012, Т. 20, № 10, стр.17-23.
2 Боринская С.А., Кожекбаева Ж.М., Залесов A.B., Ользеева Е.В., Максимов А.Р., Куцев С. И., Гараев М.М., Рубанович A.B., Янковский Н.К. Снижение риска инфицирования ВИЧ и летальности у гетерозигот по делеционному аллелю гена хемокинового рецептора CCR5del32: исследование случая фокусной нозокомиальной ВИЧ-инфекции и мета-анализ // Acta Naturae, 2012. Т. 4. № 1. С. 36-46.
3 Боринская С.А., Ким A.A., Кальина Н.Р., Ширманов В.И., Кошечкин В.А., Янковский Н.К. Геногеографическое распределение частот аллелей генов метаболизма алкоголя и возможные факторы его формирования // Экологическая генетика, 2011. Т. 96. № 3. С. 44 - 53.
4 Степанов В.А., Балановский О. П., Мельников A.B., Лаш-Завада А.Ю., Харьков В.Н., Тяжелова Т.В., Ахметова В. Л., Жукова О. В., Шнейдер Ю. В., Шильникова И. Н., Боринская С. А., Марусин А. В., Спиридонова М. Г., Симонова К. В., Хитринская И. Ю., Раджабов М. О., Романов А. Г., Штыгашева О. В., Кошель С. М., Балановская Е. В., Рыбакова А. В..Хуснутдинова Э. К., Пузырев В. П., Янковский Н. К. Характеристика популяций Российской Федерации по панели пятнадцати локусов, используемых для ДНК-идентификации и в судебно-медицинской экспертизе // Acta Naturae, 2011. Т. 3. №2. С. 59-71.
5 Stepanov VA, Melnikov AV, Lash-Zavada AY, Kharkov VN, Borinskaya SA, Tyazhelova TV, Zhukova OV, Schneider YV, Shil'nikova IN, Puzyrev VP, Rybakova AA, Yankovsky NK. Genetic variability of 15 autosomal STR loci in Russian populations //Leg. Med.
(Tokyo), 2010.V. 12(5). P. 256-258.
6 Borinskaya S., Kal'ina N., Marusin A., Faskhutdinova G, Morozova I, Kutuev I, Koshechkin V., Khusnutdinova E., Stepanov V., Puzyrev V., Yankovsky N., Rogaev E. Distribution of alcohol dehydrogenase ADHlB*4SHis allele in Eurasia. // Am. J. Hum. Genet. 2009. V. 84 (1). P. 89-92.
7 Li H., Borinskaya S., Yoshimura K., Kal'ina N., Marusin A., Stepanov V., Qin Zh., Khaliq Sh., Lee M.-Y., Yang Y„ Mohyuddin A., Gurwitz D., Qasim Mehdi S., Rogaev E., Jin L„ Yankovsky N., Kidd J., Kidd K. Refined Geographic Distribution of the Oriental ALDH2*504Lys (nee 487Lys) Variant // Ann. Hum. Genet. 2009. 73V. (3). P. 335-345.
8 Боринская C.A., Козлов А.И., Янковский H.K. Гены и традиции питания. // Этнографическое обозрение. 2009. № 3. С. 117-137.
9 Янковский Н.К., Боринская С.А. Генетические исследования как основа интеграции наук о жизни и человеке // Вавиловский журнал генетики и селекции (Информационный вестник ВОГиС), 2009, Т. 13, № 2 . С. 384-389.
10 Kozlov A. Borinskaya S., Vershubsky G., Vasilyev E„ Popov V. , Sokolova M„ Sanina E„ Kaljina N., Rebrikov D., Lisitsyn D., Yankovsky N. Genes related to metabolism of nutrients in population of Kola Sami II Int J Circumpolar Health. 2008. V. 67 (1). P. 56-66.
11 Соколова M.B., Васильев E.B., Козлов А.И., Ребриков Д.В., Сенкеева С.С., Кожекбаева Ж.М., Люндуп Н.С., Свечникова Н.С., Огурцов П.П., Хуснутдинова Э.К., Янковский Н.К., Боринская С.А. Полиморфизм С/Т-13910 регуляторного участка гена лактазы LCT и распростораненность гиполактазии в популяциях Евразии // Экологическая генетика. 2007. Т. 5. № 3. С. 26-35.
12 Боринская С.А., Кальина Н.Р. , Санина Е.Д. , Кожекбаева Ж.М. , Веселовский Е.М., Гупало Е.Ю., Гармаш И.В., Огурцов П.П., Паршукова О.Н., Бойко С.Г., Вершубская Г.Г., Козлов А.И., Рогаев Е.И., Янковский Н.К. Полиморфизм гена аполипопротеина Е АРОЕ в популяциях России и сопредельных стран // Генетика. 2007. Т. 43. № 10. С. 1434-1440.
13 Боринская С.А., Ребриков Д.В. , Нефёдова В.В., Кофиади И.А., Соколова М.В., Колчина Е.В., Куликова Е.А., Чернышов В.Н., Куцев С.И., Полоников А.В., Иванов В.П., Козлов А.И., Янковский Н.К. Молекулярная диагностика и распространенность первичной гиполактазии в популяциях России и сопредельных стран // Молекулярная биология. 2006. Т. 40. № 6. С. 1031-1036.
14 Kozlov A, Vershubsky G, Borinskaya S, Sokolova M, Nuvano V. Activity of disaccharidases in arctic populations: evolutionary aspects disaccharidases in arctic populations. // J. Physiol. Anthropol. Appl. Human Sci. 2005. V.24 (4). P. 473-476.
15 Balanovsky O, Pocheshkhova E, Pshenichnov A, Solovieva D, Kuznetsova M, Voronko O, Churnosov M, Tegako O, Atramentova L, Lavryashina M, Evseeva I, Borinska S, Boldyreva M, Dubova N, Balanovska E. Is spatial distribution of the HIV-1-resistant CCR5del32 allele formed by ecological factors? // J. Physiol.
Anthropol. Appl. Human Sci. 2005. V.24 (4). P. 375-382.
16 Соколова M.B., Бородина T.A., Гасемианродсари Ф., Козлов А.И., Гречанина Е.Я., Фещенко С.П., Боринская С.А., Янковский Н.К. Полиморфизм ассоциированного с гиполактазией локуса С/Т-13910 гена лактазы LCT у восточных славян и иранцев // Медицинская генетика. 2005. № 11. С.523-527.
17 Боринская С.А., Гасемианродсари Ф„ Кальина Н.Р., Соколова М.В., Янковский Н.К. Полиморфизм гена алкогольдегидрогеназы ADH1B в восточнославянских и ираноязычных популяциях // Генетика. 2005. Т. 41. № 11. С. 1563-1566.
18 Кожекбаева Ж. М., Бородина Т.А., Боринская С. А., Гусар В. А., Фещенко С.П., Ахметова В.Л., Хусаинова Р.И., Гупало Е.Ю., Спицын В. А., Гречанина Е.Я., Хуснутдинова Э.К., Янковский Н. К. Распределение ВИЧ-протективных аллелей (CC/?5delta32, CCR2-64I и SDFl-3'A) в выборках русских, украинцев и белорусов // Генетика. 2004. Т. 40(10). С. 1394-1401.
19 Боринская С.А. Генетическое разнообразие народов // Природа. 2004. № 10. С.33-37.
20 Боринская С.А., Хуснутдинова Э.К.Этногеномика: история с географией // Человек.
2002. № 1. С.19-30.
Публикации в сборниках материалов отчетных конференций подпрограмм «Динамика генофондов» «Генофонды и генетическое разнообразие» Программ фундаментальных исследований Президума РАН
21 Боринская С.А., Ким A.A., Гуреев A.C., Санина Е.Д., Н.К.Янковский Факторы формирования генофондов популяций: сравнительный анализ финно-угорских и восточно-славянских групп // В сб.: Материалы отчетной конференции Подпрограммы «Генофонды и генетическое разнообразие» Программы фундаментальных исследований Президиума РАН «Биологическое разнообразие» (2009-2010 гг.). М.:ИОГен им. Н.И. Вавилова РАН, 2011. С. 162-163. (ISBN 978-5-98446-009-5-220)
22 Янковский Н.К., Кальина Н.Р., Боринская С.А. Полиморфизм генов, ассоциированных с широко распространенными заболеваниями, в российских популяциях // В сб.: Материалы отчетной конференции «Динамика генофондов» (Программа фундаментальных исследований РАН № 11 «Биоразнообразие и динамика генофондов», подпрограмма П «Динамика генофондов»). Москва: ИОГен им. Н.И. Вавилова РАН, 2008. С. 86-87.
23 Янковский Н.К., Соколова М.В., Козлова А.И., Боринская С.А. Полиморфизм генов, ассоциированных с широко распространенными заболеваниями, в российских популяциях: ассоциация полиморфизма гена лактазы LCT-139 ЮС/Т с гиполатказией в российских популяциях. // В сб.:Материалы отчетной конференции «Динамика генофондов» (Программа фундаментальных исследований РАН № 11 «Биоразнообразие и динамика генофондов», подпрограмма П «Динамика генофондов»), посвященной памяти академика Ю.П.Алтухова. Москва: ИОГен им. Н.И. Вавилова РАН, 2007. С. 111-112.
24 Янковский Н.К., Кальина Н.Р., Санина Е.Д., Козлова А.И., Рогаев Е.И., Боринская С.А. Полиморфизм генов, ассоциированных с широко распространенными заболеваниями, в российских популяциях: Распространение частот аллелей гена аполлипопротеина Ев российских популяциях // В сб. материалов отчетной конференции «Динамика генофондов» (Программа фундаментальных исследований РАН № 11 «Биоразнообразие и динамика генофондов», подпрограмма II «Динамика генофондов»), посвященной памяти академика Ю.П.Алтухова. Москва: ИОГен им. Н.И. Вавилова РАН, 2007. С.113-114.
25 Янковский Н.К., Кальина Н.Р., Боринская С.А. Функционально значимые полиморфизмы генома и их роль в адаптации человека: Полиморфизм гена ADH1B в популяциях России и сопредельных стран. // Сб. материалов отчетной конферецнии (2006 г.) «Динамика генофондов». ФИАН, 2007. С. 71. ISBN 978-5-902622-13-0
Другие издания
26 ЯнковскийН. К., Боринская С. А. Эволюция генофондов: популяционные и локус-специфические процессы // Чарльз Дарвин и современная биология. Труды международной научной конференции (21-23 сентября 2009 г., Санкт-Петербург) Отв.ред. Э. И. Колчинский, ред. А. А. Федотова. Санкт-Петербург, 2010. С. 222-231.
27 Величковский Б.Б., Боринская С.А., Вартанов A.B., Гаврилова С.А., Прохорчук Е.Б., Рогаев Е.И., Рощина И.Ф., Величковский Б.М. Нейрокогнитивные особенности носителей аллеля б4 гена аполипопротеина Е (АРОЕ) II Теоретическая и экспериментальная психология. 2009. № 4. 25-37.
28 Боринская С.А Влияние факторов природной и антропогенной среды на популяционно-генетические характеристики человека // История и современность. 2008. № 1.С. 142-153.
29 Козлов А.И., Лисицын Д.В., Козлова М.А., Богоявленский Д.Д., Боринская С.А., Варшавер Е.А., Вершубская Г.Г., Кальина Н.Р., Лапицкая Е.М., Санина Е.Д. Кольские саамы в меняющемся мире. - М.: Институт Наследия, ИЛ «АрктАн-С». 2008. 96 с.
30 Боринская С.А. Генетические адаптация популяций к природным и культурным факторам внешней среды. Научные труды МНЭПУ. Вып.З. М., Изд-во МНЭПУ, 2006.
46
С. 51-59.
31 Боринская С.А., Коротаев А.В. Количественный подход к изучению ген-культурных взаимодействий. // В сб. Антропология на пороге III тысячелетия. М., "Старый Сад", 2003. Т. 1.С. 503-517.
32 Янковский Н.К., Боринская С.А. Геном человека: научные и практические достижения и перспективы. Аналитический обзор. // Вестник РФФИ. 2003. № 2. С. 46-63.
Тезисы (избранные)
1. Leon D., Borinskaya S., Gil A., Kiryanov N., McKee M., Oralov A., Saburova L., Savenko O., Shkolnikov V., Vasilev M., Watkins H. Alcohol-induced damage to heart muscle rather than atherosclerosis may drive the association of circulatory disease with hazardous drinking in Russia // J Epidemiol Community Health 2011;65:A15.
2. Ким A.A., Санина Е.Д., Ширманов В.И., Кошечкин В.А. , Боринская С.А. Гены метаболизма алкоголя: вариации частот аллелей в популяциях Африки и Ближнего Востока // В сб. тезисов Международной конференции "Проблемы популяционной и общей генетики", посвященной памятной дате - 75-летию со дня рождения академика Ю.П. Алтухова. Москва, 14-16 ноября 2011.
3. ЯнковскийН. К., Боринская С. А. Эволюция генофондов: популяционные и локус-специфические процессы // Чарльз Дарвин и современная биология. Труды международной научной конференции (21-23 сентября 2009 г., Санкт-Петербург) Отв.ред. Э. И. Колчинский, ред. А. А. Федотова. Санкт-Петербург 2010, С. 222-231
4. Stepanov V., Melnikov A., Lash-Zavada A., Tyazhelova Т., Kharkov V., Akhmetova V., Zhukova О., Schneider Y., Shil'nikova I., Borinskaya S., Kal'ina N., Rybakova A., Shtygasheva O., Khusnutdinova E., Puzyrev V., Yankovsky N. Population genetics of forensic STRs in Russia // The 2nd International Conference on Forensic Genetics FORENSICA-2010. Tel6, The Czech Republic, 24th - 26th May 2010.
5. Кальина H.P., Санина E.B., Янковский H.K. Полиморфизм генов метаболизма алкоголя в населении Евразии // Сборник сообщений Пятого съезда Вавиловского общества генетиков и селекционеров (ВОГиС), Москва, 21 -27 июня 2009. С. 428.
6. Малышева А.С., Санина Е.В., Лавряшина М.Б., Васинская О.А., Кальина Н.Р., Боринская С.А. , Балановский О.П. Распределение аллелей гена аполипопротеина Е в популяциях человека // Сборник сообщений Пятого съезда Вавиловского общества генетиков и селекционеров (ВОГиС), Москва, 21 -27 июня 2009. С. 456.
7. Боринская С.А. Природные и антропогенные факторы формирования генетического разнообразия популяций человека // Сборник сообщений Пятого съезда Вавиловского общества генетиков и селекционеров (ВОГиС), Москва, 21 -27 июня 2009. С. 393.
8. М. Sokolova, К. Ignatov, S. Borinskaya, V. Kramorov, N. Yankovsky. Allele high-specific amplification for detection of LCT C/T-13910 SNP associated with adult-type hypolactasia// 39th European Human Genetics Conference (EHGC) in Nice, France, in June 2007. Eur. J. Hum. Genet. 2007. V. 15 (1). P. 285.
9. Borinskaya S., Kal'ina N., Marusin A, Stepanov V., Yuriev E., Khusnutdinova E., Puzyrev V., Yankovsky N. ADHlB*48His allele frequency distribution in populations of Russia and neighboring countries // Human Genome Meeting 2006, May 30- June 3 2006, Helsinki, Finland. P. 273.
10. Sokolova M., Kofiadi I. , Rebrikov D„ Borodina Т., Kozlov A., Borinskaya, Yankovsky N. DNA diagnostics of adult-type hypolactasia in populations of Russia and neighboring countries. // Human genome meeting. May 31 - June 3 2006, Helsinki, Finland.
11. Sokolova M.V., Rebrikov D.V., Borodina T.A., Kozlov A.I., Borinskaya S.A., Yankovsky N.K. Hypolactasia-associated polymorphism in lactase gene LCT C/T-13910 in populations of Russia and neighboring countries. 7th Balkan Meeting of Human Genetics. BMHG2006. August 31 - September 2, 2006, Skopje, Republic of Macedonia.
12. Козлов А.И., Боринская C.A., Соколова M.A., Здор Э.В. Потребление пищевых Сахаров и нарушения обмена углеводов у коренного населения Севера. // Материалы 13-го
Международного конгресса по приполярной медицине (ред. Л.Е.Панин). Новосибирск, ООО «РИЦ», 2006. 147-148.
13. Боринская С.А., Янковский Н.К. Количественный подход к изучению взаимодействия генетических и средовых факторов // Медицинская генетика. 2005. Т. 4. № 4. С. 55.
14. Borinskaya S.Genetic transformation in human populations and cultural evolution //Abstr. Of 34th Annual Meeting of the Society for Cross Cultural Research and First General Scholarly Meeting of the Society for Anthropological Sciences. Santa Fe, New Mesico, U.S.A. 23-27 February, 2005. P. 26
15. Соколова M.B., Бородина T.A., Козлов А.И., Гречанина Е.Я., Фещенко С.П., Боринская С.А., Янковский Н.К. Полиморфизм локуса LCT С/Т-13910, ассоциированного с гиполактазией, у восточных славян // Тез. Докл., V съезд Российского общества медицинских генетиков, 24-27 мая 2005 г., Уфа. Медицинская генетика, 2005. Т. 4, № 6, С. 268.
16. Rogaev E.I., Moliaka Y.K., Borinskaya S.A., Riazanskaya N.N., Veselovsky E.M., Grigorenko A.P. Evolutionary-Functional Study of Genes for Aging-Associated Disease: Alzheimer's Disease as an example. // HUG02005 Human Genome Meeting, Kyoto, Japan, April 18-21, 2005. P. 217.
17. Ghasemian Rodsari F., Sokolova M., Kalyina N., Borinskaya S., Yankovsky N. Iranian and Pamir populations in Eurasian context: allele frequencies of eight loci associated with common diseases. // 8th Iranian Congrss of Biochemistry and First International Congress of Biochemistry and Molecular Biology, Tehran, Iran, September 11-15, 2005. Selected Abstracts. Clinical Biochemistry. 2005. V. 38. p.857.
18. Ghasemian Rodsari F., Kozhekbaeva Zh., Borinskaya S., Yankovsky N. Worldwide distribution of apolipoprotein E gene alleles: is ApoE*e4 allele a factor of adaptation to climate in humans? // 4th International Iran and Russia Conference "Agriculture and Natural Resources". September 8-10, 2004, ShahrKord, Iran.
19. Боринская C.A., Коротаев A.B., Янковский Н.К. Культура как фактор внешней среды, влияющий на популяционно-генетические признаки у человека. В сб. тез. "Генетика в XXI современное состояние и перспетивы развития. 3-й съезд ВОГиС, Москва, 6-12 июня 2004 г.
20. Borinskaya S.A. A quantitative approach to study population genetic variapility under different natural and cultural environment. Human variability: A bridge between sciences and humanities. 14й1 Congress of European Anthropological Association. 1-5 September, 2004, Komotini, Greece, p. 8.
21. Соколова M.B., Ж.М. Кожекбаева, T.B. Тяжелова, С.А. Боринская, Н.К. Янковский. ДНК-диагностика гиполактазии в российских популяциях // Сб. тез. конференции "Актуальные проблемы генетики ". Москва, 2003, Т.2. С. 39-40.
22. Borinskaya Svetlana. Gene-culture relationships: cross-cultural tests of population genetic traits. 32nd Annual Meeting of Society for Cross-Cultural Research, feb 19-24 2003, Charleston, SC, USA. P.13.
23. Borinskaya S, Korotaev A. Correlations between Genetic and Cultural Traits in Populations of Humans Bioinformatics of Genome Regulation and Structure / Ed. by N. A. Kolchanov et al. Vol. 4. Novosibirsk: BGRS, 2002.
24. Yankovsky N., Borinskaya S, Rogaev E., Korotaev A. et al., Change of population genetic traits under different natural and cultural environment: new dimension in understanding of human diseases. Abstr. of Human Origin and Disease Meeting, Cold Spring Harbor, 2002.
25. Borinskaya S, Milchevsky Yu., Ember C., Korotaev A. Qualitative approach to study gene-culture relationship: population frequencies of dopamine receptor gene alleles correlate with complexity of political organization of human societies. Abstr. of Human Origin and Diseases Meeting, CSHL, 2002.
26. Borinskaya S. Dopamine receptor gene allele and sociocultural characteristics: cross-cultural test. Abstr. of 31st Annual Meeting Society for Cross-Cultural Research, Santa Fe, 2002.
Благодарности
Автор выражает благодарность д.б.н. А.В.Рубановичу (ИОГен РАН), д.б.н., проф. Е.И.Рогаеву, д.б.н. Д.В.Ребрикову (ИОГен РАН), д.м.н., проф. А.Н.Петрину (МГСМУ), проф. С.А.Арутюонву (МГМСУ), д.б.н. А.И.Козлову (ИВФ РАО), д.б.н., проф., акад АН РБ Э.К.Хуснутдиновой (ИБГ УНЦ РАН), д.б.н., проф. В.А.Степанову (ИМГ СО РАН), к.филол.н. А.С.Архиповой (РГГУ), к.филол.н. А.С.Козьмину (РГГУ), д.и.н., проф. А.И.Коротаеву (РГГУ И ИВ РАН), д.и.н., член-корр РАН Н.Н.Крадину (ДВГУ), д-ру Carol Ember (Yale University), д-ру Kenneth Kidd (Yale University), д-ру David Leon (LSHTM), в сотрудничество с которыми собирались образцы или разрабатывались подходы к их анализу. Автор также выражает благодарность М.В.Соколовой, Ф. Гасемианродсари, Н.Р.Кальиной, выполнявшим диссертационные работы под руководством автора в лаборатории анализа генома, а также сотрудникам лаборатории анализа генома Е.Д.Саниной, А.А.Ким, Ж.М. Кожекбаевой, В.Н.Попову, Л.Г.Савиной и всем коллегам, взамодействие с которыми позволило выполнить данную работу. Особую благодарность автор выражает научному консультанту д.б.н., проф., член-корр. РАН Н.К.Янковскому за поддержку выполненных исследований, критические замечания и полезные советы, высказанные в процессе написания работы, а также создание условий, в которых невозможно уклониться от защиты диссертационной работы.
Выполнение работы поддержано следующими фондами и программами:
РГНФ 01-06-00144-а "Исследование этноспецифичности психологиченских факторов риска развития алкоголизма и наркомании и их корреляции с генетическими факторами риска", РФФИ 03-06-80277-а "Создание базы данных 'Этнографический атлас народов России1 и отработка методов ее использования в кросс-культурных исследованиях"; 05-06-80427-а "Сравнительное исследование особенностей питания и популяционно-генетических характеристик этнотерриториальных групп, относящихся к различным адаптивным типам"; 07-04-01281-а Генетические факторы устойчивости/восприимчивости к ВИЧ-инфекции и развитию СПИДа; 04-04-49196-а "Мультиплексный анализ SNP по генам общераспространенных и социально-значимых заболеваний в выборках русских, украинцев и белорусов"; 07-04-01749-а "Характеристика популяций и населения мегаполисов Российской Федерации по аллелям локусов, используемых для ДНК-идентификации в судебно-медицинской экспертизе"; Программами фундаментальных исследований Президиума РАН «Динамика генофондов» (проект "Полиморфизм генов, ассоциированных с широкораспространенными заболеваниями, в российских популяциях"), "Генофонды и генетическое разнообразие" (проект «Факторы формирования генофондов популяций: сравнительный анализ финно-угорских и восточно-славянских групп»), Программой Фундаментальные науки медицине (проект "Исследование носительства генотипа СС по полиморфизму С/Т-13910 в регуляторном участке гена лактазы LCT как фактора риска развития остеопороза в российских популяциях"), проектом российско-германского сотрудничества BMBF 02/046 "SNP detection in 20 populations of Eurasia" и Программой "Научные и научно-педагогические кадры инновационной России" на 2009 - 2013 годы, Мероприятие 1.1 Проведение научных исследований коллективами научно-образовательных центров, ГК № 02.740.11.0854 "Гены и транскрипция при болезни Альцгеймера".
Заказ № 36-Р/10/2013 Подписано в печать 14.10.13 Тираж 100 экз. Усл. п.л. 2,6
ООО "Цифровичок", тел. (495) 797-75-76 www.cfr.ru; е-таП:info@cfr.ru
Текст научной работыДиссертация по биологии, доктора биологических наук, Боринская, Светлана Александровна, Москва
Федеральное государственное бюджетное учреждение науки Институт общей генетики им. Н.И. Вавилова Российской академии наук
На правах рукописи
05201352037
Боринская Светлана Александровна
ПОПУЛЯЦИОННО-ГЕНЕТИЧЕСКАЯ АДАПТАЦИЯ ЧЕЛОВЕКА К ПРИРОДНЫМ И АНТРОПОГЕННЫМ ФАКТОРАМ СРЕДЫ
03.02.07 - генетика
диссертация на соискание ученой степени доктора биологических наук
Научный консультант: доктор биологических наук, член-корреспондент РАН Янковский Николай Казимирович
Москва 2013
Оглавление
1. ВВЕДЕНИЕ......................................................................................................................................................................................................................6
Характеристика популяционно-генетических исследований в целом..................................6
Актуальность исследования............................................................................................................................................................................7
Цели и задачи исследования..........................................................................................................................................................................11
Научная новизна..................................................................................................................................................................................................................12
Практическая значимость....................................................................................................................................................................................14
Основные положения, выносимые на защиту..................................................................................................................15
Апробация работы............................................................................................................................................................................................................17
Формальные характеристики работы..............................................................................................................................................18
2. Материалы и методы ..................................................................................................................................................................................19
2.1. Материалы......................................................................................................................................................................................................................19
2.2. Определение минеральной плотности кости......................................................................................................21
2.3. Определение фенотипа гиполактазии..............................................................................................................................21
2.4. Молекулярно-генетические методы..................................................................................................................................21
2.5. Этнографические описания ............................................................................................................................................................22
2.6. Статистические методы и филогенетический анализ..........................................................................26
2.7. Выбор объектов исследования - гены АРОЕ, ЬСТ, ССИ5, АБШВ, АЮН2 28
3. Ген аполипопротеина Е АРОЕ, аллели eZ £3, е4 ................................................................................29
3.1. Обзор литературы. Функции и генетический полиморфизм
аполипопротеина Е ......................................................................................................................................................................................................29
3.2. Определение частот аллелей и генотипов по гену АРОЕ в популяциях
России и сопредельных стран ....................................................................................................................................................................38
3.3. Характеристика географического распределения частот аллелей гена
АРОЕ в популяциях мира ................................................................................................................................................................................41
3.4. Связь частот аллелей гена АРОЕ с типом хозяйства ............................................................................50
3.5. Особенности эволюции АРОЕ у человека и других приматов..............................................55
3.5.1. Анализ замен аминокислот в линиях приматов........................................................................................58
3.5.2. Ускоренная эволюция АРОЕ И-домена в линии человека....................................................64
4. Генлактазы ЬСТ, полиморфизм -13910С/Т......................................................................................................70
4.1. Обзор литературы. Генетическая детерминация наследственной лактазной 70
недостаточности (гиполактазии) .............................................................................
4.2. Исследование ассоциации генотипа С/С полиморфизма LCT*C/T-13910 с фенотипом гиполактазии в выборке добровольцев ............................................................................................76
4.3. Определение частот аллелей и генотипов по локусу С/Т-13910 в
исследуемых популяционных выборках ................................................................................................................................77
4.4. Корреляция частот генотипа С/С и фенотипа гиполактазии в популяциях Евразии ..................................................................................................................... 79
4.5. Потребление молока и молочных продуктов носителями разных
генотипов .................................................................................................................. 85
4.6. Связь потребления молока с МПК ................................................................... 86
4.7. Связь частоты потребления молока с МПК у носителей разных генотипов
по полиморфизму LCT*C/T-13910 ....................................................................................................................................................87
4.8. Корреляция частот персистенции лактазы с этнографическими характеристиками ..........................................................................................................................................................................................................90
5. Ген хемокинового рецептора CCR5, аллель CCR5del3..................................................................93
5.1. Обзор литературы. Полиморфизм гена CCR5 и гипотезы о
происхождении и распространении аллеля CCR5del32 ....................................... 93
5.2. Экспериментальное определение частот аллеля CCR5wt/del32 в
избранных популяциях ........................................................................................................................................................................................96
5.3. Распределение частот аллеля CCR5del32 в популяциях Евразии................................98
5.4. Анализ возможных факторов формирования распределение частот аллеля CCR5del32 в популяциях Евразии ..................................................................................................................................................99
5.5. Протективный эффект CCR5del32 в отношении ВИЧ:
исследование случая фокусной нозокомиальной ВИЧ-инфекции и мета-анализ 104
6. Гены, контролирующие метаболизм алкоголя: ADH1B и ALDH2 .......... 115
6.1. Обзор литературы. Полиморфизм генов ADH и ALDH и их
популяционно-генетические исследования ........................................................................................................................115
6.1.1. Метаболизм этанола в организме человека ....................................................................................................115
6.1.2. Полиморфизм генов метаболизма этанола и номенклатура аллелей..................116
6.1.3. Популяционные исследования частот аллелей генов ADH1B и ALDH2 .... 118
6.1.4. Структура гаплотипов локуса ADH............................................................................................................................121
6.2. Экспериментальное определение частот аллелей и генотипов гена альдегидцегидрогеназы ALDH2*Glu504Lys в исследуемых популяциях ........................125
6.3. Анализ географического распределения частот аллеля АЬВН2*504Ьу$
в популяциях мира ........................................................................................................................................................................................................128
6.4. Экспериментальное определение частот аллелей и генотипов гена алкогольдегидрогеназы АЭН1В *Ав исследуемых популяциях ........................130
6.5. Анализ географического распределения частот аллеля АОН1В*47Шз в популяциях мира ..............................................................................................................................................................................................................136
6.6. Исследование фенотипического проявление аллеля АПН1В*48Шз ......................139
6.7. Сопоставление географического распределения частот аллелей АЪН1В*48Ш$ и АЬИН2 *504Ьуъ и возможные факторы отбора........................................................141
Заключение ................................................................................................................................................................................................................................145
Выводы ............................................................................................................................................................................................................................................156
Благодарности ......................................................................................................................................................................................................................159
Литература ..................................................................................................................................................................................................................................160
Список используемых сокращений
Список используемых сокращений
ПЦР - полимеразная цепная реакция
ПДРФ - полиморфизм длины рестрикционных фрагментов
ПААГ - полиакриламидный гель
АДГ, ADH - алкогольдегидрогеназа
АльДг, ALDH - альдегидцегидрогеназа
БА - болезнь Альцгеймера
ССЗ - сердечно-сосудистые заболевания
ALFRED - Allele Frequency Database - база данных частот аллелей CEPH-HGDP - популяционная коллекция (культура клеток), полученная от 952 индивидов из 52 этнических групп. Поддерживается Центром изучения полиморфизма человека (Centre d'Etude du Polymorphisme Humain, Париж, Франция), в рамках проекта «Разнообразие генома человека» (Human Genome Diversity Project) (Cann et al. 2002; Rosenberg 2006). HapMap (/zaplotype map) - международный проект, целью которого является создание карты гаплотипов генома человека для описания общих закономерностей генетической изменчивости генома. Полученные в ходе проекта генетические данные находятся в открытом доступе на сайте http://hapmap.ncbi.nlm.nih.gov/ [International HapMap Consortium, 2003, 2010].
MIM, OMIM ID - идентификационный номер гена в базе данных менделирующих признаков человека
SNP - Single nucleotide polymorphism - однонуклеотидный полиморфизм, замена единичного нуклеотида, встречающаяся в популяции с частотой не менее 1-5% STR - short tandem repeat, короткий тандемный повтор
ВВЕДЕНИЕ
Характеристика популяционно-генетических исследований в целом
Исследования генетического полиморфизма человека необходимы для решения ряда проблем фундаментального и прикладного, медицинского характера. Это выявление генетических характеристик, ассоциированных с устойчивостью или повышенной восприимчивостью к болезням; исследование механизмов адаптации человека к различным условиям среды на генетическом и биохимическом уровне; решение вопросов этногенеза, реконструкции истории формирования отдельных популяций и человечества в целом.
Популяционно-генетические исследования человека были начаты с анализа распространенности различных групп крови, что было практически важной задачей, требовавшей быстрого решения для применения во время Первой мировой войны в связи с резко возросшей необходимостью переливания крови. Первые результаты наблюдений различия частот аллелей в популяциях были опубликованы после войны [Hirschfeld L., Hirschfeld Н., 1919], продолжены в 30-х годах супругами Уильямом и Лили Бойд, а затем обобщены для популяций мира Артуром Мурантом и др. [Mourant et al., 1954,1976].
В последующие годы были накоплены данные о частотах множества маркеров (преимущественно биохимических) в сотнях популяций. Глобальная сводка этих данных приведена в работах [Nei, Roychoudhury, 1988]. Популяционно-генетический анализ распределения более 100 генетических маркеров человека в более чем 1800 популяциях мира (преимущественно коренных народов) проведен Л.Л. Кавалли-Сфорца и др. [Cavalli-Sforza et al., 1994]. Работы Кавалли-Сфорца явились определяющими развитие данной области. Рассматривая межпопуляционные различия частот аллелей, он построил модели изменения частот аллелей в результате генетического дрейфа. На примере данных, собранных Мурантом (в то время еще не полностью опубликованных), с опорой на более ранние работы Холдейна, он рассмотрел модели для нейтральных аллелей, чьи частоты изменяются только под воздействием дрейфа, и модели, в которых изменения частот аллелей отличаются от «нейтральной» модели. Если варианса ниже ожидаемой при действии дрейфа, то следует предполагать наличие стабилизирующего фактора (например, адаптивного преимущества гетерозигот). Если же варианса выше предсказаний «нейтральной» модели, то это свидетельствует о наличии дополнительных, помимо дрейфа, факторов, которые действуют на частоты аллелей. В качестве такого случая Кавалли-Сфорца приводит распределение частот аллелей по широте, указывая, что
такое распределение может быть обсуловлено влиянием температуры [СауаШ-Зйэгга, 1966].
В России популяционно-генетические исследования проводятся более ста лет и обобщенны в фундаментальном труде Ю.Г. Рычкова и др. [Рычков и др., 2000, 2003]. В этом труде обобщены данные о разнообразии как «классических» генетических маркеров (группы крови, белки и ферменты плазмы крови, полиморфизм цветового зрения, полиморфизм восприятия вкуса фенилтиокарбамида), так и молекулярно-генетических. Эколого-генетические аспекты рассмотрены в монографии В.А.Спицина (2008).
Результаты геногеографических исследований по однородительским маркерам (У-хромосоме и митохондриальной ДНК) и их приложения к реконструкции популяционно-генетической истории человечества в целом, отдельных этнических групп и населения крупных регионов, обобщены в монографии О.П.Балановского и Е.В.Балановской [Балановская, Балановский, 2007] и диссертации О.П.Балановского [Балановский, 2012].
Исследование генетической адаптации популяций человека к локальным условиям среды, начатое с изучения адаптивных фенотипов, и проводящееся в настоящее время на геномном и эпигеномном уровне, является одним из актуальных направлений развития популяционной генетики и геномики.
АКТУАЛЬНОСТЬ ИССЛЕДОВАНИЯ
Генетическая адаптация популяций к локальным условиям среды может быть представлена как изменение частот аллелей вследствие естественного отбора признаков, ассоциированных с этими аллелями и важных для выживания и успешной репродукции человека. Помимо процессов адаптации, на изменение частот аллелей влияют генетический дрейф и миграции. Исследования генетической адаптации популяций человека занимают одно из центральных мест в биологической антропологии, генетике человека и эволюционной биологии, и уже дали значительный вклад в понимание взаимодействия средовых и генетических факторов, влияющих на здоровье человека. Такие исследования были начаты в 20-ом веке на фенотипическом уровне.
Описания различий внешних признаков представителей разных рас
(этнотерриториальных групп) были накоплены еще в 19 веке. Однако генетическую и эволюционную интерпретацию они получили лишь к середине 20 века. Обзор взглядов на причины этих различий от Чарльза Дарвина, объяснявшего различия в цвете кожи половым отбором (1871, «Происхождение человека...»), и Сэмюеля Стенхопа Смита, считавшего эти различия связанными с климатом (1787, «Эссе о причинах различий в
комплекции...)» до современных молекулярно-генетических исследований, дан в обзоре антропологов Нины Яблонски и Джорджа Чаплина [Jablonski, Chaplin, 2010]. В выявлении связи между весом тела с температурой и цвета кожи с интенсивностью УФ излучения большой вклад внес Д.Ф.Робертс. Его подход был основан на сборе опубликованных соматометрических данных для десятков популяций и анализе корреляций усредненных характеристик для каждой популяции с параметрами среды [Roberts, 1953; Roberts, Kahlon, 1976]. Аналогичные подходы были использованы для маркеров, ассоциированных с заболеваниями, в классических исследованиях географического распределения аллелей бета-талассемии [Холдейн, 1949] и серповидноклеточной анемии [Эллисон, 1954], которые, как было предположено в этих исследованиях, придают устойчивость к малярии. Более поздние исследования дали прямые подтверждения «малярийной гипотезы».
Характеристики среды, сформированные в результате хозяйственно-культурной деятельности человека (называемые далее «антропогенные»), так же, как и природные факторы, могут выступать в качестве факторов отбора. Среди возникших под влиянием деятельности человека признаков наиболее известен признак персистенции лактазы, дающей возможность взрослым усваивать молочный сахар [Holden, Mace, 1997] (более детально обсуждается в разделе 4). Ген-культурные взаимодействия обсуждаются в ряде обзоров и монографий [Durham, 1991; Holden, Mace, 1997; Richerson, Boyd, 2005; Henrich, McElreath, 2007; Hawks et al., 2007; Cochran, Harpending, 2009]. Две последние работы рассматривают ускорение адаптивной эволюции человека после возникновения земледелия. Авторы опровергают идею о том, что эволюция человека остановилась с появлением культуры, и приводят свидетельства в пользу того, что из-за роста численности человечества в последние 10 000 лет эволюция ускорена. Они рассматривают взаимосвязь появления адаптивных мутаций и экспансии групп, в которых эти мутации распространились, на примере появления переносимости молока. По их предположению, при наличии молочного животноводства, позволяющего иметь «передвижной» источник пищи, группа (носители индо-европейских языков, арабы, монголы), может расселяться и быть более успешной в завоевании других групп. Авторы считают, что не только климат, но и эта особенность обусловила адаптивность аллелей персистенции лактазы [Cochran, Harpending, 2009].
Для проверки гипотез о вовлечении определенного фенотипа в процесс адаптации и выявлении факторов среды, эту адаптацию вызывающих, необходим сбор фенотипических данных, что дорого и требует значительного времени и анализа больших выборок для достижения статистически значимых показателей [Hancock et al., 2008, 2010]. Современные методы молекулярно-генетического анализа позволили проводить
исследования частот аллелей отдельных локусов во многих популяциях. «Стандартом» является панель CEPH-HGDP, включающая 52 популяц�
- Боринская, Светлана Александровна
- доктора биологических наук
- Москва, 2013
- ВАК 03.02.07
- Оценка частоты хромосомных аберраций в природных популяциях некоторых видов мелких мышевидных грызунов в естественных условиях и при антропогенном воздействии
- Закономерности генетической изменчивости в популяциях дрозофилы
- Экологические и биоморфологические закономерности пространственно-онтогенетической структуры популяций растений, динамика и мониторинг
- Динамика численности и изменчивость краевых популяций ARABIDOPSIS THALIANA (L. ) HEYNH в Предуралье
- Популяционная структура и принципы охраны вишни степной (Cerasus fruticosa Pall., Rosaceae L.) на Южном Урале