Бесплатный автореферат и диссертация по биологии на тему
Эволюционная генетика β-эстераз в подгруппе Drosophila melanogaster
ВАК РФ 03.00.15, Генетика

Автореферат диссертации по теме "Эволюционная генетика β-эстераз в подгруппе Drosophila melanogaster"

На правах рукописи

Балакирев Евгений Станиславович

Г

ЭВОЛЮЦИОННАЯ ГЕНЕТИКА /З-ЭСТЕРАЗ В ПОДГРУППЕ ОКОБОРНИА М Е1Л N ОСА 5ТЕЯ

Специальность 03.00.15 - генетика

АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора биологических наук

Владивосток 2005

Работа выполнена в Академии экологии, морской биоло! ии и биотехнологии Дальневосточного государственного университета, Институте биологии моря ДВО РАН (Владивосток, Россия) и Отделении экологии и эволюционной биологии Калифорнийского университета (Ирвайн, США).

Научный консультант:

Официальные оппоненты:

профессор, академик Национальной Академии наук США Франциско Хосе Айала

доктор биологических наук, профессор Марлен Мкртьгчевич Асланян

доктор медицинских наук, профессор,

чл.-корр. РАН,

Леонид Иванович Корочкин

доктор биологических наук, профессор Михаил Борисович Евгеньев

Ведущее учреждение:

Институт биологии развития им. Н. И. Кольцова РАН

Защита состоится "_" _ 2005 года в _ часов

на заседании Диссертационного совета Д 002.214.01 при Институте общей генетики им. Н. И. Вавилова РАН по адресу: 119991, Москва, ул. Губкина, д. 3. Факс: (095) 132-89-62.

С диссертацией можно ознакомиться в библиотеке Института общей генетики им. Н. И. Вавилова РАН.

Автореферат разослан "_" _ 2005 года.

Ученый секретарь Диссертационного совета, кандидат биологических наук

Г. Н Полухина

ВВЕДЕНИЕ

Актуальность проблемы. Проблема генетической изменчивости, механизмы ее поддержания и важность для эволюции была и остается одной из основных и далеко не разрешенных проблем эволюционной биологии (Алтухов, 1989; Lewontin, 1974; Ayala, 1976; Kimura, 1983; Nei, 1987). С одной стороны, убедительно показано, что нейтральные факторы играют значительную роль в динамике генетической изменчивости (Kimura, 1983). С другой стороны, выявлено, что потеря изменчивости или повышение ее уровня, например, в результате антропогенных воздействий, может иметь негативные последствия для вида (Алтухов, 1989, 1995; Mitton, 1998). Неясность данного вопроса во многом связана с методологией анализа генетической изменчивости. До недавнего времени исследователям были доступны методы, характеризующие генетическую изменчивость лишь частично или косвенно (аллозимы, рестрикционный анализ и др.). Результаты этих работ, хотя и показали наличие огромного резерва изменчивости на молекулярном уровне, тем не менее, не позволили с необходимой ясностью объяснить причины и механизмы, обусловливающие поддержание изменчивости в популяциях.

Разработка методов секвенирования и амплификации ДНК (Sanger et al., 1977; Maxam and Gilbert, 1980; Mullís et al., 1986) в корне изменила ситуацию. Появилась возможность исследовать изменчивость на уровне нуклеотидных последовательностей - исчерпывающем уровне организации генома. Начиная с пионерской работы Мартина Крейтмана (Kreitman, 1983), впервые применившего метод секвенирования ДНК для исследования внутривидовой нуклеотидной изменчивости гена алкогольдегидрогеназы у Drosophila melanogaster, эволюционная и популяционная генетика вышла на новые рубежи. В результате быстрого методического прогресса можно говорить о революции в эволюционной биологии, обусловленной широким использованием ДНК технологий (см., например, Алтухов и Салменкова, 2002; Cavalli-Sforza, 1998).

До настоящего времени, однако, работ по секвенированию полных нуклеотидных последовательностей генов на популяционном уровне мало. Более того, имеющиеся данные в основном ограничены анализом отдельных генов, а не мультигенных семейств, что препятствует комплексному пониманию механизмов поддержания нуклеотидного полиморфизма и эволюции дупликаций генов, особенно тех, которые имеют преждевременные стоп-кодоны и другие повреждения, позволяющие классифицировать их как псевдогены. Если наличие одной копии гена является достаточным условием для удовлетворения потребностей организма, принимается, что мутации псевдогенов (повреждающие или нет) не подвергаются действию негативного отбора, и имеют равную вероятность фиксации в популяции (Kimura, 1980; Li et al, 1981; Gojobori et al., 1982, Li, 1983; Graur and Li, 2000). Отсюда следует,

fOC. национальная

БИБЛИОТЕКА Ci о®

что вследствие быстрой аккумуляции рекуррентных мутаций псевдогены неизбежно должны подвергаться дегенеративному процессу и трансформироваться в фон окружающей их ДНК (см., например, Graur et а]., 1989). Однако даже в случае фиксации нуль-аллелей и полного превращения дуплицированной копии в псевдоген последующий процесс генетической дегенерации не очевиден. Фактически случаи значительной дегенерации описаны только для облигатных внутриклеточных паразитов как результат длительной ассоциации с эукариотическим хозяином (Andersson and Andersson, 2001; Moran, 2002).

Важны вопросы, касающиеся механизмов, определяющих не только уровень, но и характер распределения изменчивости. Понимание генома как совокупности относительно независимых генов (генетика '"мешка с бобами") было характерной чертой классического периода развития генетики. Начиная с двадцатых годов прошлого века, взаимодействие генов играет существенную роль в теории эволюции (Животовский, 1984; Wright, 1931; Dobzhansky, 1937, 1955; Schmalhausen, 1946; Mather, 1953; Waddington, 1957; Mayr, 1963). Неравновесие по сцеплению (неслучайные ассоциации) между аллелями или группами нуклеотидов может служить признаком эпистатических взаимоотношений, и на протяжении нескольких последних десятилетий большая эмпирическая работа была посвящена выяснению вопроса о степени и характере межлокусных взаимодействий. Проблема неслучайных ассоциаций генов также важна в связи с длительно продолжающейся нейтралистско-селекционистской полемикой (Алтухов, 1989; Kimura, 1968, 1983; Ayala et al., 1971; Kimura and Ohta, 1971; Lewontin, 1974). Неравновесие по сцеплению рассматривается как сильный аргумент в пользу отбора, особенно если ассоциации имеют согласующийся характер в различных популяциях (Lewontin, 1974). До сих пор, однако, исследования неравновесия по сцеплению носят спорадический характер, и, как следствие, отсутствует ясное понимание механизмов, обусловливающих возникновение существенных межлокусных взаимодействий на молекулярном уровне.

Решение очерченных выше проблем видится в анализе полиморфизма и дивергенции нуклеотидных последовательностей совместно для разных генов, а также разных функциональных регионов в пределах генов. Для этого мы подробно исследуем небольшое мультигенное семейство ß-эстераз в четырех природных популяциях D. melanogaster (Африка, Европа, Северная и Южная Америка) и у семи близких видов подгруппы melanogaster Кроме этого, мы исследуем три других гена, сцепленных с ß-э стеразами. Superoxid di miníase (Sod), tinman (tin) и bagpipe (bap), в однократной выборке из популяции Северной Америки.

I »ÍITílfclU»**

\ m к* «»

/3-эстеразное мультигенное семейство включает два гена, Est-б и Est-P (синонимы Evt-P- yEst-6 и Est-7) с одинаковой 5' —> 3' ориентацией и располагается у D. melanogaster на левом плече третьей хромосомы в позиции 68F7-69A1. Два гена обнаруживают соответственно 64 и 60% сходства на уровне ДНК и белка (Collet et al., 1990).

У D. melanogaster ген Est-6 кодирует /3-карбоксилэстеразу (EST-6) (Johnson et al., 1966; Корочкин, 1995), которая переносится в семенной жидкости от самцов к самкам в процессе копуляции (Richmond et al, 1980) и влияет на последующее поведение и склонность к спариванию у самок (Gromko et al., 1984). Est-6 является одним из наиболее интенсивно исследованных молекулярных маркеров в биохимической, популяционной и эволюционной генетике Drosophila (Корочкин, 1995; Oakeshott et al., 1989, 1993, 1995; Korochkin et al., 1990; Richmond et al., 1990). Полученные данные предполагают, что аллозимный полиморфизм EST-6 у D. melanogaster поддерживается позитивным отбором, что подтверждается, например, существенными различиями биохимических свойств основных (F и S) аллозимов, наличием клинальной изменчивости и сложной динамикой частот аллозимов в экспериментальных условиях Однако в разных лабораториях мира обнаружены парадоксальные несоответствия биохимических свойств F и S аллозимов; проблематичным оказались для интерпретации результаты исследований генетической динамики аллозимов в лабораторных экспериментах, противоречивые сведения получены и по клинальной изменчивости (см. обзоры Oakeshott et al., 1989, 1993). Как результат этих противоречивых данных, действие позитивного отбора на Est-б подвергалось сомнению, и этот ген рассматривался как нейтральный стандарт при популяционно-генетических исследованиях (Hamblin and Aquadro, 1997, стр. 1056). Таким образом, очевидна необходимость исследования изменчивости Est-6 на нуклеотидном уровне для выяснения механизма, поддерживающего изменчивость этого гена.

Информация по Est-P значительно более ограниченна, чем по Est-6. Функция этого гена не известна и аллозимная изменчивость не изучена. Коллет и ее соавторы (Collet et al., 1990), впервые обнаружившие и описавшие Est-P, предположили, что данный ген является функциональным, основываясь на ряде признаков, таких как транскрипционная активность, интактные сайты сплайсинга, отсутствие преждевременных стоп-кодонов, присутствие кодонов инициации и терминации. Однако, исследовав небольшую выборку (10 линий) D. melanogaster из Северной Америки (Калифорния), мы (Balakirev and Ayala, 1996) обнаружили преждевременные стоп-кодоны и выявили другие признаки, указывающие на то, что Est-P может являться псевдогеном, который мы обозначили как ^ Est-б. Думанцик и ее соавторы (Dumancic et al., 1997) показали, что некоторые аллели Est-P продуцируют

каталитически активную эстеразу, соответствующую ранее идентифицированному изоферменту EST-7 (Healy et al, 1991), и в соответствии с этим переименовали ген в Est-7. В настоящей работе для обозначения дупликации гена Esi-б мы используем символ \\iEst-6, предложенный нами ранее (Balakirev and Ayala, 1996) Сложившаяся ситуация поставила вопрос о природе у Est-6 и стимулировала его дальнейшее исследование.

Гены tin и bap являются членами NK семейства гомеобокс-содержащих генов, расположенных на правом плече третьей хромосомы у Drosophila melanogaster (позиция 93DE). Выявлено иерархическое взаимоотношение между генами tin и bap (Azpiazu and Frasch, 1993; Bodmer, 1993). До настоящего времени информация по изменчивости нуклеотидных последовательностей гомеобокс-содержащих генов чрезвычайно ограничена, хотя показано глобальное влияние этих генов на процесс индивидуального развития организмов (Корочкин, 2002)

Ген Sod расположен на левом плече третьей хромосомы у Drosophila melanogaster (позиция 68А7) и кодирует фермент, защищающий клетки от повреждающих воздействий свободных радикалов кислорода (Fridovich, 1986) При исследовании природных и лабораторных популяций D melanogaster обнаружено неравновесие по сцеплению между аллозимным полиморфизмом Est-б и Sod (Smit-McBride et al., 1988). Механизм неравновесия между генами остался невыясненным, что диктует необходимость исследования межлокусных ассоциаций на уровне нуклеотидных последовательностей Исходные данные по полиморфизму гена Sod взяты из литературы (Hudson et al, 1994, 1997).

Таким образом, Р-жтеразный кластер генов представляется нам удобной модельной системой, включающей функциональный ген {Est-б) и предполагаемый псевдоген (\yEst-6), для исследования механизмов поддержания генетической изменчивости и эволюции дупликаций в мультигенном семействе. Исследование генов Sod, tin и bap мотивировано тем, что эти гены, также как и fi-эстеразы, располагаются у D. melanogaster на третьей хромосоме. Их исследование (наряду с самостоятельной значимостью) позволит учесть возможное влияние регионального хромосомного эффекта и таким образом обеспечит более обоснованную интерпретацию данных, полученных для fi-эстеразных генов.

Цель и задачи исследования. Основная цель работы -исследование изменчивости нуклеотидных последовательностей jв-эстеразпых генов Est-6 и i\iEst-6, а также сцепленных с ними генов Sod, bap и tin у близких видов подгруппы Drosophila melanogaster для выяснения механизмов поддержания генетической изменчивости, межлокусных взаимодействий и эволюции дупликаций. Для достижения цели поставлены следующие задачи:

1. Клонировать и секвенировать гены Est-б и цiEst-б, а также сцепленные с ними гены tin и bap у близких видов подгруппы Drosophila melanogaster.

2 Провести детальный анализ полиморфизма, дивергенции и других характеристик изменчивости полных нуклеотидных последовательностей генов Est-б и \|sEst-в и фланкирующих областей в четырех выборках D melanogaster из природных популяций Африки, Европы, Северной и Южной Америки, а также у близких видов, входящих в подгруппу melanogaster.

3. Исследовать полиморфизм нуклеотидных последовательностей генов Sod, tin и bap в выборке из североамериканской популяции D. melanogaster и у близких видов подгруппы Drosophila melanogaster.

4. Определить эволюционные факторы, формирующие и поддерживающие паттерны изменчивости последовательностей Est-6, yEst-6, Sod, bap и /ш; установить механизмы, обеспечивающие межлокусные взаимодействия и определяющие эволюцию дупликаций в исследованных мультигенных семействах.

Научная новизна и практическая значимость работы. Впервые проведен анализ изменчивости полных последовательностей Est-б и is/Est-6 в четырех природных популяциях Drosophila melanogaster и у семи видов подгруппы D. melanogaster. Впервые исследован нуклеотидный полиморфизм гомеобокс-содержщих генов tin и bap Результаты работы ясно показывают существенную роль различных типов позитивного отбора (направленного и балансирующего) при формировании паттернов нуклеотидной изменчивости Показано, что межлокусные взаимодействия играют существенную роль в распределении изменчивости исследованных генов Позитивный отбор рассматривается как наиболее вероятная причина межлокусных ассоциаций. Впервые проведено сравнительное исследование структурной энтропии гена Est-б и предполагаемого псевдогена \|iEst-б. Обнаружено, что структурная энтропия является нуклеотид-зависимой и связана с ГЦ составом генов Увеличение уровня энтропии не является совершенно случайным процессом. Делается вывод, что псевдогены являются важной частью генома, которая обеспечивает набор последовательностей, участвующих в его функционировании и эволюции. Результаты работы важны для более глубокого понимания структуры, функции и эволюции генома, проблем соотношения селективных и нейтральных популяционно-генетических факторов микроэволюции

Апробация работы. Основные результаты диссертации докладывались на семинаре Института Хормеля (США. Остин, 26 июня 2000 г ); симпозиуме "Естественный отбор и нейтральная теория", Искья (Италия, Неаполь, 28-30 октября 2001 г.); семинаре Отделения экологии и эволюционной биологии Калифорнийского университета (США, Ирвайн, 6

июня 2003); семинаре зоологической станции Антон Дорн (Италия, Неаполь, 4 ноября 2003); семинарах Лаборатории Ф. X. Айалы (США, Ирвайн, Отделение экологии и эволюционной биологии, Калифорнийский университет, 1993, 1995 - 2004); заседании Ученого совета Академии экологии, морской биологии и биотехнологии ДВГУ (Владивосток, 4 ноября 2004); семинаре Института общей генетики им. Н. И. Вавилова (Москва, 11 ноября 2004).

Объем и структура работы. Диссертация изложена на 240 страницах; содержит 31 рисунок и 15 таблиц По теме диссертации опубликовано 14 работ в российских и международных рецензируемых журналах В генном банке (GenBank) размещены 228 нуклеотидных последовательностей генов Est-6, \\tEst-6, bap и tin под инвентарными номерами: AF147095 - 147102; AF150809 - AF150815; AF217624 -AF217645; AF526538 - AF526559; AY247664 - AY247713, AY247987 -AY248036; AY368077 - AY368109; AY369088 - AY369115; AY695919 -AY695924.

Экспериментальная работа по амплификации, клонированию, секвенированию генов, а также анализу данных выполнена автором лично в Лаборатории Франциско X Айала (Отделение экологии и эволюционной биологии, Калифорнийский университет, Ирвайн, США). Данные по структурной энтропии получены в результате плодотворного сотрудничества с В Р Чечеткиным и В В. Лобзиным, которым автор приносит искреннюю благодарность. Автор выражает благодарность Г. П Манченко, А. И. Пудовкину, В. А. Брыкову, Iria Blanco Barco, В Я. Федосееву, В. Л. Касьянову, А И Карпенко, А. Д. Кухлевскому и В В. Михайлову за поддержку и многочисленные конструктивные замечания при оформлении работы Я благодарен Walter M. Fitch, Brandon Gaut, Richard R. Hudson, Anthony Long и Narelle Dryden, которые читали отдельные главы работы и высказали детальные и ценные комментарии Я искренне признателен Е. И. Балакиревой за неоценимую моральную поддержку, плодотворное сотрудничество и обсуждение работы. Я глубоко благодарен Франциско X. Айала, оказавшему серьезное влияние на мой путь в науке; он ознакомился с данной работой полностью и внес ряд ценных замечаний и поправок. Работа частично выполнена при поддержке Американского фонда гражданских исследований и развития (CRDF), грант VL-003.

МАТЕРИАЛЫ И МЕТОДЫ

Линии D melanogaster, гомозиготные по третьей хромосоме (Seager and Ayala, 1982), происходят от диких мух, собранных в Африке (Zinr Зимбабве), Европе (Ваг' Барселона, Испания), Северной Америке (ER' Эл Рио, Калифорния, США) и Южной Америке (Ven- Каракас, Венесуэла). Линии обозначены в соответствии с электрофоретическими

аллелями по локусам эстеразы-6 (буква до дефиса) и супероксиддисмутазы (буква после номера линии): ультра-медленный (US), медленный (S) и быстрый (F). Африканские линии мух (из национальных парков Сешва и Хараре) получены из лаборатории C.-I. Wu. Линии Drosophila s ее he Ilia, Drosophila mauritiana, Drosophila erecta, Drosophila teissieri и Drosophila orena получены из Центра Видов Drosophila (Боулинг Грин, Огайо, США).

Процедуры экстракции ДНК, рестрикционного картирования, ( клонирования, амплификации и секвенирования приводятся в

соответствующих работах (Балакирев, 1995; Balakirev et al., 1999, 2002, 2003, 2004а). Для каждой линии определялись последовательности обеих , цепей ДНК с использованием 24 перекрывающихся внутренних

праймеров, расположенных на расстоянии (в среднем) 350 нуклеотидов. Две независимые амплификации были проведены и секвенированы в обоих направлениях для каждого полиморфного сайта, чтобы предотвратить возможные ошибки, возникающие при амплификации или секвенировании. В работе использованы последовательности эстеразных генов, исследованных другими авторами у следующих видов: D pseudoobscura (Brady et al., 1990), D. persuadís and D. miranda (King, 1998), D. melanogaver (Collet et al., 1990), D. yakuba (Oakeshott et al., 2001), D. smtulans и D. mauritiana (Karotam et al., 1993).

Ассемблинг нуклеотидных последовательностей осуществлялся с использованием программы SeqMan (Lasergene, DNASTAR, Inc., 19941997). Множественное выравнивание последовательностей выполнялось при помощи программы CLUSTAL W (Thompson et al., 1994) и уточнялось вручную с использованием программы PROSEQ, версия 2,4 (Filatov and Charlesworth, 1999). Компьютерные программы DnaSP, версия 3,4 (Rozas and Rozas, 1999) и PROSEQ использовались для большей части анализов внутривидовой изменчивости. Отклонения от нейтральных ожиданий оценивались с использованием тестов Хадсона и соавторов (Hudson et al., 1987, 1994), Таджимы (Tajima, 1989), Келли (Kelly, 1997), Депаулиса и Веулле (Depaulis and Veuille, 1998) и Волла (Wall, 1999). Гетерогенность распределения изменчивости и степень соответствия между уровнем полиморфизма и дивергенции оценены с ипользованием тестов Госса-• Левонтина (Goss and Lewontin, 1996) и МакДональда (McDonald, 1996,

1998). Моделирование коалесцентного процесса (Hudson, 1983, 1990) выполнялось при помощи программ DnaSP и PROSEQ для оценки вероятностей наблюдаемых значений статистик D (Tajima, 1989), ZnS (Kelly, 1997), В и Q (Wall, 1999), а также для оценки доверительных интервалов значений нуклеотидного разнообразия. Для обнаружения внутри- и межгенных конверсионных событий использовался метод Сойера (Sawyer, 1989, 1999) Популяционная рекомбинационная частота анализировалась при помощи пермутационного метода Мак-Вина и

соавторов (McVean et al., 2002), основанного на коалесцентном подходе Хадсона (Hudson, 2001) Для филогенетических построений использовали программу MEGA2 (Kumar et al , 2001).

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

В работе клонированы и секвенированы /З-эстератые гены, Est-6 и \¡¡Est-6, у семи видов Drosophila, принадлежащих к подгруппе melanogaster (после названий видов приведены их сокращенные обозначения). D simulans (SIM), D mauritiana (MAU), D. sechellia (SEC), D melanogaster (MEL), D. teissieri (TEI), D. erecta (ERE) и D. orena (ORE), Полная длина последовательности составляет 5394 нуклеотида и включает 5'-фланкирующий регион (1183 нуклеотида), ген Est-6 (1686 нуклеотидов), межгенный регион (193 нуклеотида), предполагаемый псевдоген ¡Est-6 (1700 нуклеотидов) и 3'-фланкирующий регион (641 нуклеотид) (рис 1)

Est-6 ¡y Est-6

1387 248 1387 j j 248

-! -О—I__HZ3-

1133 51 193 56 641

1П IE

Рис I Схема fi-эстеразного кластера генов y D melanogaster Экзоны показаны в виде прямоутльников и обозначены римскими цифрами (I и II) 5'- и 3'-фланкирующие последоватсчьностн интроны и межгенная область представлены тонкими линиями Длины функциональных обпастей покаганы над рисунком (для жзонов) и под рисунком (для фланкирующих областей, интронов и межгенной области) Две вертикальные стрелки обозначают позиции преждевременных стоп-колонов

Клонированы и секвенированы гомеобокс-содержащие гены tin и bap у D. melanogaster (североамериканская популяция), а также у D. simulans и D. sechellia. Секвенированный участок составляет 3818 нуклеотидов и включает 5'-фланкирующую область гена tin (767 нуклеотидов), неполный ген tin (экзон I, 186 нуклеотидов, интрон I, 905 нуклеотидов и неполный экзон II, 570 нуклеотидов), 5'- фланкирующую область гена bap (64 нуклеотида), полный ген bap (экзон I, 444 нуклеотида, интрон, 121 нуклеотид и экзон II, 705 нуклеотидов) и 3'-фланкирующую область гена bap (56 нуклеотидов) (рис. 2).

tin hap

186 609 453 444 705

-□-1 I-1 H '-I Кб 4 HIZZ h

767 9 0 5 4 3 0 64 121 56

I п ш in

Рис 2 Схематическое изображение генов tinman (tin) и bagpipe (bap) у D melanogaster Г'ем tin имеет три экзона и два интрона, тогда как ген bap состоит из двух экзонов и одного интрона Расстояние между генами составляет 7,1 тысяч нуклеотидов (кб) Оба гена имеют одинаковое направление транскрипции Пояснения см рис 1

Филогенетические взаимоотношения исследованных видов, построенные на основании нуклеотидных последовательностей Еи-6 и \yEst-6 (рис. 3) хорошо согласуется с результатами, полученными на основании других генов этой подгруппы Огоьоркйа (Ка1ап1г1-Макп е!: а!., 1999; АуесЙБОУ е!: а1„ 2001; РагБсЬ е1 а!., 2001; Ко а1„ 2003; Р^ио 2003).

Est-6

64

4>Est-6

100

0 05

62 I

D. mauntiana

100

99 f— D. simulans

100 1

100

100

98 53

1— D. sechelha D. melanogaster

D. teissien - D erecta

D. arena

- D. orena

- D. erecta

С

D. teissieri — D. melanogaster D sechelha D. simulans D mauntiana

Рис 3 Филогенетические взаимоотношения видов в подгруппе Drosophila inelanogastei Дерево построено на базе кодирующих последовательностей (экзон I + экзон II) fi-эстеразных генов по методу присоединения ближайшего соседа (Saitou and Nei, 1987) с исполыованием двухпараметрических дистанций Кимуры (Kimura, 1980) Бутстрэп значения попучены па базе 10000 репликаций

1. Полиморфизм и дивергенция Ея^б и \fEst-6. При исследовании 78 последовательностей ¡3-эстеразных генов суммарно для четырех популяций обнаружено 236 полиморфных сайтов. Полиморфизм длины последовательностей включает семь делеций и четыре инсерции; из них шесть делеций и три инсерции локализуются в промоторной области В пределах Е^-б не выявлено полиморфизма длины последовательности, в пределах \\iEsi-6 выявлена одна делеция (ЕЯ, экюн I) и одна инсерция (ЕЙ и Ваг, экзон I) (обозначение выборок см. в разделе МАТЕРИАЛЫ И МЕТОДЫ). В кодирующей области Е^-б имеется 20 несинонимичных и 34 синонимичных полиморфных сайтов. Для кодирующей области \yEst-6 обнаружено 54 несинонимичных и 45 синонимичных полиморфных сайтов. Таким образом, отношение несинонимичного к синонимичному полиморфизму составляет 0,588 для Еи-б и 1,2, для )Е.п-б. Мы обнаружили 17 преждевременных стоп-кодонов (все ТвА) в пределах

кодирующей области (экзон 1) \yEst-6 (11 в североамериканской выборке и 6 в европейской выборке). Стоп-кодоны генерируются как единичными мутациями, так и короткой инсерцией ACATTTGAT Вставка ретропозона mdg-3 (5,2 тысячи нуклеотидов) выявлена в пределах интрона \\fEit-6 для линии ER-S-438S (выборка из Северной Америки). Эта же инсерция обнаружена для линии 121-11.2 D melanogaster, имеющей нуль-аллель по \\sEst-6 (Game and Oakeshott, 1990)

Основные показатели нуклеотидного разнообразия ß-эстеразного кластера приведены в табл 1 Для полной последовательности л = 0,0083, что находится в пределах диапазона значений, характерного для других генных областей с высокой рекомбинацией у D melanogaster (Moriyama and Powell, 1996). Значения л для 5'-фланкирующей области (я = 0,0060) и для Est-б (л = 0,0057) очень близки, однако изменчивость ц/Est-ö значительно выше (л = 0,0115). Синонимичная изменчивость составляет 0.0160 для кодирующей области Est-б, но в 1,5 раз выше (0,0244) для \\iEst-6. Различие более отчетливо выражено для несинонимичной изменчивости: 0,0024 для Est-б и в 3,2 раза выше, 0,0076, для \\iEu-6. Для полной длины ß-эстеразного кластера уровень нуклеотидного разнообразия наиболее высок в африканской выборке (л = 0,0113), наиболее низок в южноамериканской выборке (л = 0,0052); промежуточные значения наблюдаются в европейской (я = 0,0073) и североамериканской (л = 0,0085) выборках. Наиболее заметное различие п между популяциями выявлено в 5'-фланкирующей области: 0,0043 (в среднем) в неафриканских выборках по сравнению с 0,0126 в африканской выборке. Уровень дивергенции между D. melanogaster и D simulans близок для 5'-фланкирущей области (К = 0,0514), Est-б (К = 0,0495) и \\sEst-6 (К = 0,0540).

tin и bap. Всего выявлено 69 полиморфных сайтов в калифорнийской выборке (ER, Калифорния, США), включающей 27 последовательностей генов tin и bap. Обнаружено пять вариантов длины последовательностей, четыре в интроне I гена tin и один в экзоне II гена bap. Значение л для полной последовательности, а также, отдельно для генов tin и bap, составило, соответственно, 0,0056, 0,0050 и 0,0065, что находится в пределах размаха значений, наблюдаемых в областях генома D melanogaster, характеризующихся высоким уровнем рекомбинации (Moriyama and Powell, 1996; Powell, 1997). Значение л для синонимичных и некодирующих сайтов ("молчащих" сайтов) составило 0,0063 для гена tin, однако существенно выше, 0,0140 для гена bap. Уровень синонимичной изменчивости составил 0,0052 для tin, но в три раза выше (0,0167) для кодирующей области bap (различие является статистически существенным даже без рекомбинации, Р = 0,01). Различие менее выражено для несинонимичной изменчивости, которая составила 0,0011 для гена tin, но в

N а5'-фл регион 619 Е.и-6 Син Нсин £ 379 1253 1686 М Р 193 \\lEst-6 Син Нсин £ 378 1248 1700 "З'-фл. регион 248 "Полная длина Син Нсин X 757 2501 4198

X 78

л 0,0060 0.0160 0.0024 0,0057 0,0094 0,0244 0,0076 0,0115 в 0,0202 0,0050 0.0083

к 0,0514 0,1474 0.0213 0,0495 0,0707 0,1388 0,0307 0,0540 - 0,1431 0,0260 0.0530

2ш\ 12

л 0,0126 0,0194 0,0035 0,0073 0,0148 0,0296 0,0097 0,0145 0,0184 0,0245 0,0066 0.0113

К 0,0539 0,1454 0,0224 0.0499 0,0722 0,1360 0,0297 0,0530 0,0693 0,1407 0,0260 0.0529

Ва1 18

л 0,0043 0,0169 0,0023 0.0058 0,0062 0,0208 0,0068 0,0101 0,0134 0,0189 0,0046 0.0073

К 0,0504 0,1476 0.0213 0,0494 0,0709 0.1442 0,0314 0,0556 0,0667 0,1459 0,0263 0,0532

Е11 28

п 0,0044 0,0152 0.0026 0.0057 0,0141 0,0268 0,0076 0,0122 0,0123 0,0210 0,0051 0,0085

К 0,0500 0,1469 0.0215 0,0495 0,0716 0,1393 0,0311 0,0546 0,0673 0,1431 0,0263 0.0528

Уеп 20

л 0.0044 0.0108 0,0013 0,0035 0 0,0171 0,0053 0,0078 0,0139 0,0033 0,0052

К 0,0501 0.1493 0,0206 0,0495 - 0.1419 0,0302 0,0541 - 0,1456 0.0254 0,0525

N - число сайтов, л - среднее число нуклеотидных различий на сайт для всех пар последовательностей (N61, 1987, р 256) К - среднее число нуклеотидных различий между О melanogasler и О. х'тийапх Син, Нсин - соответственно, синонимичные и несинонимичные сайты X - данные по всем типам сайтов или всем выборкам. а5'- и 3'- фланкирующие регионы ограничены соответственно 619 и 248 нуклеотидами, для получения сопоставимых значений длины этих регионов в исследованных популяциях бПолная последовательность включает 619 нуклеотидов 5'-фланкирующей области, ген Еи-6. межгенный регион и ген \\iEst-6 "3'-фланкирующая область выборки из Венесуэлы не анализировалась, эта выборка также не включена в анализ 3'-фланкирующей области по всем популяциям М Р - межгенный регион. Обозначение выборок см МАТЕРИАЛЫ И МЕТОДЫ

два раза выше (0,0021) для гена bap (Р > 0,05) Уровень молчащей изменчивости гена bap в три раза выше в экзоне II (л = 0,0224), чем в экзоне I (л = 0,0073); различие является статистически существенным даже без рекомбинации (Р 0,01). Повышенный уровень нуклеотидной изменчивости в пределах экзона II гена bap не может быть обусловлен ослаблением функциональных ограничений, поскольку этот экзон содержит функционально важный гомеодомен, являющийся высоко консервативной последовательностью ДНК (Duboule, 1994) Обнаружено четыре полиморфных сайта в пределах гомеодоменной области гена bap. Значение п в этой области составило 0,0051, что лишь незначительно ниже изменчивости, выявленной для всего экзона II гена bap (п = 0,0063).

Уровень молчащей изменчивости гена bap (ti = 0,0140) сопоставим с уровнем изменчивости Est-б (я = 0,0156) - одного из наиболее полиморфных локусов у D melanogaster Более того, уровень молчащей изменчивости в пределах экзона II гена bap (п = 0,0224) очень близок к значению изменчивости, полученному для гена \)¡Est-б (л = 0,0253), который почти в два раза более изменчив, чем Est-б. Уровень нуклеотидной изменчивости, обнаруженный для гена tin находится в хорошем соответствии со значениями, полученными для многих других регуляторных генов, эволюционирующих под влиянием негативного отбора (Moriyama and Powell, 1996; Pugugganan, 2000, Riley et al , 2003) Различия в уровне изменчивости между генами tin и bap могут быть обусловлены действием позитивного отбора (см. разделы 4 и 6).

Уровень дивергенции (К) между D melanogaster и D simulan s близок для генов tin и bap. Однако отношение К/п заметно выше для гена tin как в кодирующих (код), так и некодирующих (нкод) peí ионах' АГК01/71КОД = 10,67 для tin, но 5,29 для bap и КнKOJnHKO„ = 9,28 для tin, но 3,85 для bap. Эги различия говорят о том, что давление негативного (очищающего) отбора выше для гена tin, чем для гена bap. Молчащая дивергенция имеет сходное значение для экзона I (К = 0,0988) и экзона II (К - 0,1012) гена bap, не смотря на тот факт, что уровень молчащей изменчивости, как отмечено выше, существенно отличается в этих кодирующих областях Несогласованность между уровнем полиморфизма и дивергенции может офажать действие позитивного отбора (см. раздел 4).

2. Рекомбинация и генная конверсия

Рекомбинация. Частота рекомбинации (р, McVean et al., 2002) для генов Est-6 и \|¡Est-б наиболее высока в африканской выборке (р = 0,0198), значительно ниже в европейской (р = 0,0035) и североамериканской (р = 0,0016) выборках, и наиболее низка в южноамериканской выборке (р = 0,0002). Возможно, это объясняется возрастом этих популяций, поскольку, как предполагается (Lachaise et al., 1988), африканская популяция является исходной, а значит более древней, тогда как европейская и американские -

14

производными (David and Сару, 1988), которые возникли в результате относительно недавнего расселения вида (10-15 тысяч лет назад, David and Сару, 1988; Singh and Long, 1992). Во всех производных (неафриканских) популяциях частота рекомбинации выше для Est-6, чем для \|iEst-6. Суммарные значения р составили 0,0214 для Est-6, но в 2,6 раз ниже, 0,0082, для \|¡Est-6. Это различие, возможно, является следствием потери функциональности wfEst-6, что приводит к повреждению специфических сайтов узнавания, которые способствуют рекомбинации. Различие частот рекомбинации между предковой и производными популяциями может быть также обусловлено совместным действием демографических факторов и естественного отбора (аналогичное предположение для популяций человека высказано в работе Fnsse et al., 2001).

Для генов tin и bap выявлены заметно различающиеся значения частот рекомбинации. Величина р составила 0,0008 для гена tin, но в 33 раза больше (0,0264) для гена bap. Значения р близки для полной последовательности ß-эстеразных и гомеобокс-содержащих генов и, соответственно, составили 0,0082 и 0,0072.

Исследованные гены расположены в хромосомной области с высоким уровнем рекомбинации. Для области 68F7-69A1 (Est-6 и \|s Est-6) лабораторная оценка частоты рекомбинации (Clafl; Comeron et al., 1999), базирующаяся на физической и генетической картах D. melanogaster составляет 0,0664; для хромосомной области 93DE (tin и bap) частота рекомбинации составляет 0,0744. Значения рекомбинации, полученные на базе нуклеотидных последовательностей, оказались существенно ниже. Значительное различие значений частоты рекомбинации, рассчитанных на базе лабораторной оценки и нуклеотидных последовательностей может быть следствием эффекта недавнего бутылочного горлышка (Wall, 2001). Однако существенное различие частоты рекомбинации для тесно сцепленных генов, находится в противоречии с демографическим объяснением наблюдаемого несоответствия (Andolfatto and Przeworski, 2000; Wall, 2001).

Генная конверсия. Внутригенная конверсия обнаружена как для Est-6, так и для \yEst-6 (за исключением южноамериканской выборки, где конверсия несущественна). Для Est-6 число существенных фрагментов варьируе!ся от одного (Африка, Р = 0,0057) до 14 (Северная Америка, Р = 0,0097); средняя длина фрагментов составляет 630 нуклеошдов (от 314 до 1183 нуклеотидов). Для \yE4t-6 число существенных фрагментов варьируется от 20 (Африка, Р = 0,0000) до 85 (Северная Америка, Р = 0,0000); средняя длина фрагментов составляет 642 нуклеотидов (от 144 до 1515 нуклеотидов). Значительно большее число существенных фрагментов, выявленное для yEst-6, может быть обусловлено инвазией ретропозонов (таких как nidg-3, см. выше), которые способны стимулировать генную конверсию при их эксцизии (Engels, 1989; Athma

15

and Peterson, 1991 ; Lowe et al., 1992; Preston and Engels, 1996; Svoboda et al , 1996) и/или за счет ослабления негативного отбора, препятствующего интенсивной внутригенной конверсии в пределах Est-6. Между Est-б и \\iEst-6 события генной конверсии обнаруживаются только в североамериканской популяции и только с использованием аминокислотного выравнивания (существенный фрагмент локализуется между 41 и 55 аминокислотами), что может объясняться синонимичными мутациями, которые появились после события генной конверсии. Низкий уровень межгенной конверсии может быть обусловлен значительной нуклеотидной дивергенцией между Est-6 и Est-6.

Внутригенная конверсия обнаружена также в пределах генов tin (Р = 0,0097) и bap (Р = 0,0029). Выявлено семь существенных фрагментов для гена tin. Длина фрагментов варьирует от 1149 до 1581 нуклеотидов и в среднем составляет 1396 нуклеотидов. В пределах гена bap конверсия заметно интенсивней (49 существенных фрагментов), однако длина фрагментов существенно меньше: от 323 до 1135 нуклеотидов - в среднем 665 нуклеотидов. Межгенная конверсия не обнаружена, что возможно, обусловлено низким сходством нуклеотидных последовательностей tin и bap (42,7%), не достаточным для удовлетворения требований гомологии при осуществлении эффективной межгенной конверсии.

3. Структура гаплотипов и дифференциация популяций

Для гена Est-6 исследована структура гаплотипов промотора и кодирующей области. Рассмотрим кратко некоторые литературные данные, необходимые для понимания полученных результатов и их интерпретации.

Райт (Wright, 1961; 1963) обнаружил два главных аллозима (Fast, или F и Slow, или S) EST-6 у D. melanogaster, показал их менделевское наследование, выявил дифференциальный ответ на органо-фосфатный ингибитор и поставил вопрос об адаптивной важности этого полиморфизма. F/S аллозимы демонстрируют широкомасштабные повторяющиеся широтные клины (Oakeshott et al., 1981; Munjal et al., 1996; Parkash et al., 1998; Bubliy et al., 1999), при этом частота S аллозима увеличивается в популяциях высоких широт (см., однако, Bubli et al., 1996). Данное наблюдение и результаты лабораторных экспериментов предполагают, что F/S аллозимный полиморфизм EST-6 у D. melanogaster поддерживается некоторой формой позитивного отбора (Алтухов и др., 1979; Алтухов и Победоносцева, 1979; Алтухов и Бернашевская, 1981, Тоцкий и др., 1994). Кук и Окшот (Cooke and Oakeshott, 1989) секвенировали полную кодирующую область Est-6 и выдвинули гипотезу о том, что F/S аллозимы отличатся двумя аминокислотами (Асн/Асп в позиции 237 и Тре/Ала в позиции 247) и что эти два аминокислотных

полиморфизма являются наиболее вероятными целями отбора, обусловливающими широтные клины.

Несколько независимо действующих с/у-регуляторных промоторных элементов, которые контролируют экспрессию Est-6 в различных тканях, были идентифицированы в пределах 1,2 тысяч нуклеотидов 5'-фланкирующей области (Ludwig et al., 1993; Healy et al , 1996) Обнаружено также, что полиморфизм Rsa 1 сайта в промоторе Est-6 проявляет существенную ассоциацию с количеством и активностью EST-6 у самцов D. melanogaster (Game and Oakeshott, 1990). Учитывая данные о том. что различие в активности EST-6 у самцов влияет на репродуктивный успех их спариваний (Richmond et al., 1990), Гейм и Окшот высказали предположение, что c/.s-регуляторный полиморфизм может быть важным фактором адаптивной изменчивости (Game and Oakeshott, 1990) Действительно, существенные ассоциации обнаружены между некоторыми компонентами приспособленное! й (жизнеспособность, время развития, возраст спаривания, частота повторного спаривания, продукция яиц и плодовитость) и уровнем активности EST-6 (Oakeshott et al., 1994; Saad et al, 1994). Секвенирование 974 нуклеотидов промотора Est-6 позволило идентифицировать нуклеотидное замещение, обусловливающее Rsa\ полиморфизм (Т —> G в позиции -531), а также выявить пик полиморфизма вокруг этого сайта (Odgers et al., 1995, 2002). При сопоставлении генетических и биохимических данных установлено, что взрослые самцы, носители Rsa\+ гаплотипов, продуцируют приблизительно на 25% больше фермента EST-6, чем носители Rsal-гаплотипов (Odgers et al., 1995).

Est-6 и \|iEst-6. Дивергентные группы гаплотипов обнаружены как для Est-6 (включая 5'-фланкирующую область), так и для \|/Est-6 во всех исследованных выборках D melanogaster. Гаплотипы обозначены в соответствии с Rsa\-IRsa\+ промоторным полиморфизмом и F/S аллозимным полиморфизмом. Частотное распределение гаплотипов в неафриканских выборках является весьма асимметричным: из 66 последовательностей 52 принадлежат к S гаплотипу и 48 - к Rsal-гаплотипу. Гаплотипный тест (Hudson et al., 1994) выявляет статистически существенный избыток (Р < 0,05) почти идентичных гаплотипов для выборок из Северной и Южной Америки (при исключении очевидно рекомбинантных последовательностей); для европейской выборки этот тест несущественен. Распределение изменчивости также асимметрично для разных групп гаплотипов. Так, в промоторной области уровень полиморфизма в шесть раз ниже для (п - 0,0011 ) гаплотипов, чем для Rsa\+ (п = 0,0067); в кодирующей области изменчивость S гаплотипов (п -0,0030) в два раза ниже, чем F гаплотипов (я = 0,0070). Популяция Венесуэлы не учитывалась, поскольку в ней отсутствуют F гаплотипы В обоих случаях различия существенны при коалесцентном моделировании

(табл. 2). Тест Таджимы (Tajima, 1989) выявил существенное отклонение от нейтральности для Rsaï- (D = -1,742, Р <■ 0,001) и S (D = -1,408; Р < 0,05) гаплотипов. Негативные значения D статистики Таджимы означают эксцесс полиморфизма, сегрегирующего при низкой частоте. В совокупности эти наблюдения позволяют предположить, что Rsa\- и S гаплотипы независимо эволюционировали под влиянием направленного отбора, поскольку они гораздо менее изменчивы, но значительно чаще встречаются, чем Rsa\+ и F гаплотипы. Направленный отбор, однако, не приводит к фиксации Rsal- и S гаплотипов в неафриканских популяциях, так как балансирующий отбор поддерживает обе группы дивергентных гаплотипов (Rsa\-IRsa\+ и F/S) в промоторе и кодирующей области.

Если благоприятные мутации располагаются в одном и том же сегменте ДНК, включающем промоторную и кодирующую области, тогда соответствующий гаплотип будет эволюционировать под действием отбора, направленного на две независимы мишени. Соответственно, данные гаплотипы будут испытывать двойной эффект селективного свипа (гаплотипы "двойного свипа"). Эффект селективного свипа (от английского "sweep" - выметание, чистка) заключается в том, что происходит снижение изменчивости в области, непосредственно окружающей мутацию, на которую воздействует направленный отбор Как ожидается, гаплотипы "двойного свипа" имеют наименьшую изменчивость (за исключением южноамериканской выборки) на протяжении всей длины исследованного сегмента ДНК (табл. 2). Выборка из Венесуэлы является уникальной в том смысле, что в ней отсутствуют F гаплотипы. Интересно, что эта выборка также не имеет S аллеля по локусу Sod (Hudson et al., 1994). Остальные гаплотипы (объединенные в группу "Другие", см. табл. 2), имеющие лишь одну мутацию, на которую воздействует направленный отбор, расположенную в промоторе или в кодирующей области, либо не имеющие таковых мутаций, проявляют более высокий уровень изменчивости, чем гаплотипы "двойного свипа".

Мы показали, что направленный отбор действует независимо на промоторную и кодирующую область Est-6. Тем не менее, эти селективные процессы взаимосвязаны. На рис. 4 приведена одношаговая сеть гаплотипов, построенная на базе промотора и экзона I Est-6. Видно, что концентрация F гаплотипов поддерживается отбором в промоторной области (компартмент Rsal-fF), тогда как концентрация Rsal+ гаплотипов (компартмент Rsa\+/S) поддерживается отбором в кодирующей области Данное наблюдение противоречит выводу Одгерса и соавторов (Odgers et al., 1995), которые отвергают возможность формирования широтного клина аллозимов Est-6 за счет эффекта "попутного транспорта" (hitchhiking cffect), обусловленного отбором на промоторную область. Из полученных результатов видно, что широтные клины могут генерироваться за счет взаимодействия селективных процессов в промоторе и кодирующей

Габтица 2 Изменчивость н\клсогидны\ последовательностей аллельных лииий гена Е$1-6 \ Р те1апода51ег

«ло 1+ Б И Двойной свип Другие

Zlm N = 4 N = 8 N = 7 N = 5 N = 3 N = 9

л = 0,0033*** л = 0.0123*** л = 0.0053 л = 0.0077 л = 0,0043** л = 0,0099***

Ва1 N=14 N =4 N=13 N = 5 N=12 N = 6

л = 0,0022 л = 0,0048 л = 0,0027 л = 0,0036 л = 0,0020***** л = 0,0060*

N = 19 N = 9 N=19 N = 9 N=13 N=15

л = 0.0012 л = 0,0050** л = 0,0021**** л = 0.0070* л = 0,0013***** л = 0,0079*****

\'еп N=15 N = 5 N = 20 N = 0 \= 15 N = 5

л = 0.0016**** л = 0.0004**** л = 0.0035 л = 0,0009** л = 0.0002

Ва1 + ЕЯ N = 33 N = 13 N = 32 N=14 N = 25 N = 21

л = 0,0017 л = 0.0046* л = 0,0024* л = 0,0059* л = 0,0017*****' п = 0,0075*****

2т + Ваг N = 37 N = 21 N = 39 N=19 N = 28 N = 30

+ ЕИ л = 0,001 Г" л = 0,0067***** л = 0.0030 л = 0,0070* л =0.0020***** л = 0,0086*****

N - число гаплотинов Расчеты для 5'-фланкирующей последовательности выполнены на основании 1183 н\клео1идов. за исключением африканской выборки и группы, включающей эту выборк> ^итн-Ват+ЕИ) Длина 5'-фланкирующей последовательности в этих сл\чая\ составила 619 нуклеотидов. Значения я существенно ниже или выше в сравниваемых 1руппа\ при использовании суммарного значения рскомбинационной частоты, иотхченной для всех популяций (*Р < 0,05, Р < 0,01; Р < 0,001), или без рекомбинации ( Р < 0.05: ' Р < 0.01. ***Р < 0.001) Обозначение аллельных линий см. текст (раздел 3) Пояснения см габл 1.

области, а также частотой рекомбинации между ними Это обусловлено тем, что 8 гаплотипы эволюционируют под влиянием как двойного (компартмент Иъа 1-/5), так и одинарного свипа (компартмент /??а1+/Я), тогда как И гаплотипы эволюционируют пол влиянием только одинарного свипа (компартмент /?ш1-/Р) (рис 4) Следовательно, соотношение аллозимных вариантов Ри5 будет определяться отбором не только на кодирующую, но и на регуляторную область £Ч/-6

Рис 4 Одмошаговая сеть гаплотипов См 6 (промотор + экзон I) Наблюдаемые гаплотипы помещены в круги Черные чатснькие кружки представляют гипотетические промежуточные ип южны Идентичные гагшошны размещены в пределах одних и тех же кругов Сплошные соединения между гаплотипами показывают точно выраженные связи Пунктирные линии обозначают гипотетические связи Число мутационных огличий покашно цифрами, расположенными вдоль линии Зашфиховаиные круги содержат И гаптотипы Жирным шрифтом выдстсны 1+ гаптотипы Имеется четыре компартмента обозначенные /?™1+Л>, Н<,а 1+/Р 1-/4 и Ч^а^!?, раздетенные жирными пунктирными линиями Пояснения см текст (раадел 3)

Бескорневое дерево, включающие все исследованные популяции и построенные на базе полного (З-эстеразного кластера представлено на рис 5. Деление между гаплотипами не полностью соответствует аллозимной изменчивости Е<,г-6 Верхний кластер (от линии Е11-8-581Р до линии 44Р), состоящий из 42 очень сходных последовательностей, включает только 8 гаплогипы (за исключением трех Р гаплотипов, Ваг-Р-77Р, ЕК-Р-611Р и 7лт-Р-Н31), но остальные 36 последовательностей включают как Р, так и 8 гаплотипы (рис. 5).

Рис 5 Бескорневое дерево гаплотипов Р-эстеразного кластера (полная длина) у й тектпцамег Пояснения см рис 3

Если мы ограничим анализ только кодирующими областями, то соответствие несколько лучше для £5/-6, чем для \\)Ем-6. Дерево, построенное на базе промоторной области, содержит два кластера, полностью ассоциированные с Яза\ полиморфизмом, но не соответствующие ЕЛ8 аллозимной изменчивости Е51-6. Следует отметить также отсутствие географической структуры: гаплотипы распределены безотносительно к их географическому происхождению. Таким образом, деревья, построенные на базе последовательностей (З-эстеразпых генов, отражают в большей степени их гаплотипную структуру, а не филогенетические взаимоотношения исследованных популяций.

На рис 6 представлены взаимоотношения гаплотипов Еп-6 для каждой исследованной популяции.

А

."Г-

¿лп-Р-НЗ 1

- 7м £ <

Ей Э 438: ЕР 5 ЭТ ЕВ Э 56 ЗР ЕР 2

ЕЕ г 965Р

— ЕЕ Ь 5Ыг ЕЕ 3 5213

- ЕЯ 5

ЕЙ Ь 3} | ЕЕ. Э 5102 —! ЕЕ 5 501$ ЕК 5 5Г ЕЕ 5 94?

, ЕР г 174" "1*4 ЕЕР Е1 Р 61

_98_| РУ 2 1142

¡Ы'Ь Ь

Чгг, <• V? \геа г ЮР У-г, С Уеп $ 7Р у'ег, 5 ¿иг Уеп % 'Л Уел г 22? V«! С '4г N 1"*

/ег ^ 1 ¡Р Уи С 1Р

- ЕЕ 7 %$ — ЕР Р 274 Р

ЕР в ЧТ ЕЕ Р-5Г2

Рис 6 Бескорневые деревья гаплотипов Ем-б у £) те1апо^а\1ег для выборок из Африки (А), Европы (Ь), Северной (В) и Южной (Г) Америки Усювные обозначения линий объясняются в разделе МАТЕРИАЛЫ И МЕТОДЫ Пояснения см рис 3

Видно, что дивергентные последовательности Est-6 находятся в разной степени ассоциации с F/S аллозимным диморфизмом в разных популяциях В африканской выборке диморфная структура гаплотипов не выражена (рис 6,

A), однако S и F гаплотипы почти не смешиваются (за исключением линии Zim-S-S10, кластеризующейся с F линиями) В европейской выборке поляризация последовательностей выражена более отчетливо, чем в выборке из Африки, и наблюдается полная ассоциация дивергентных групп с аллозимным полиморфизмом (рис 6, Б). В выборке из Северной Америки также отчетливо прослеживается диморфность последовательностей (рис. 6,

B), однако деление между гаплотипами не во всех случаях согласуется с аллозимными вариантами: F линии ER-F-531F и ER-F-611F кластеризуются с S гаплотипами, и, наоборот, S линии ER-S-114S и ER-S-549S кластеризуются с F гаплотипами. В южноамериканской выборке S гаплотипы отсутствуют и, тем не менее, отчетливо представлены две группы значительно дивергированных гаплотипов (рис. 6, Г) Среднее число нуклеотидных различий между двумя группами южноамериканских гаплотипов составляет 11,286 (Est-6) и 28,643 (\\iEst-6), что соизмеримо со значениями между F/S аллельными линиями для Est-6 (к = 11,809) и I)s Est-6 (к = 20,534), обнаруженными в калифорнийской выборке (Balakirev et al., 2002, 2003). Пермутационный тест (Hudson et al, 1992a, b) существенен для южноамериканских гаплотипов: Kst* = 0,5867, Р = 0,0000, Est-6 и К«* = 0,5921, Р = 0,0000, \|íEst-6. Таким образом, дивергентные нуклеотидные последовательности не соответствуют аллозимной изменчивости Est-6.

Показатели популяционной дифференциации (Fst, Hudson et al., 1992a), рассчитанные на базе полной длины /3-эстеразного кластера, имеют сходные значения при сравнении следующих пар популяций: Zim - Bar (Fst = 0,1037), Zim - ER (Fsl = 0,0758), Bar - Ven (Fí{ = 0,0702) и ER - Ven (Fsl = 0,0903). Максимальные и минимальные значения Fst получены, соответственно, для пар Zim - Ven (Fsi = 0,1504) и Bar - ER (Fsl - - 0,0143). Пермутационный метод Хадсона и соавторов (Hudson et al., 1992b) выявляет существенную дифференциацию между африканской и всеми остальными популяциями - результат, согласующийся с другими данными (Begun and Aquadro, 1993, 1995). Различия между европейской и американскими популяциями не существенны (Р > 0,05).

tin и bap. Выявлена отчетливая гаплотипная структура для генов tin и bap (рис. 7 и 8). Для гена tin обнаружено две группы гаплотипов, полностью ассоциированных с двумя делециями в пределах интрона 1. Две группы гаплотипов, ассоциированные с несинонимичным полиморфизмом, обнаружены также для гена bap.

Хотя две группы гаплотипов выявлены для обоих генов, тем не менее структура гаплотипов различна. Первая группа tin гаплотипов (рис 7) включает 18 сходных последовательностей (от S-114S до F-96S); вторая группа представлена девятью последовательностями (от S-565F до US-255F) Различие между двумя группами статистически существенно (^st* = 0,4692;

= 0,1580, Р < 0,001; Hudson et al., 1992). Однако уровень изменчивости существенно не отличается между двумя группами tin гаплотипов.

tin-F 1461$

-tin-в -52 IF

t.n-F-S17F tin« 377F

• UrvS 174F 60 I tin-S 1224F tin-S 2S06S

_tin F 357F

tin-f flIIF Ur-F 274F 1m-F-517S tirvf-531F — tin S 5018

nltn-S-SOIF

-tin-f-9US

-tm-S-SeSF

I .I»v6-2SF lln-S-SlOS

— tn-F 775F Ы .tin-S-5213

I tin-S-&49S ~lttn-S-438S t n-S 969F lm-US-256F

bjp-F-517S bap-F 1461S Ьар-S 174F Ьар-F 531F bap-S 501S bap-S-581 F bap-S 255S bap-S 2588S bap F 357F bap-F-517F bap-S 114S bap-S ^01F

-I»»p-F-611F

bap-S-521S bap-5 96SF Ьар-US 255F bosses

.bap S 1224F «1 bep-F 77S5

J" >b>

top« 377F

bap F MS

■ OO'b.pS-SIOS

Рис 7 Бсскорневое дерево i аплотипов гена tm у D melanogastei Пояснения см рис 3 и 6

Рис 8 Бескорневое дерево i ап.кпипов гена bap у D melanogaster Пояснения см рис 3 и 6

Таким образом, для гена tin выявлена диморфная структура гаплотипов и симметричное распределение мутаций в пределах групп гаплотипов.

Для гена bap обнаружена более сложная структура гаплотипов, включающая гомогенную группу очень схожих и низкоизменчивых последовательностей, а также, гетерогенную группу последовательностей, имеющую существенно более высокий уровень изменчивости (рис. 8). Гомогенная группа гаплотипов включает 13 почти идентичных последовательностей (от F-517S до F-611F, рис. 8). Гетерогенная группа iаплотипов включает 14 дивергированных последовательностей (от S-521S до S-438S) и существенно отличается от гомогенной группы (Kst* = 0,2852; Kb*ow = 0,1002, Р < 0,001; Hudson et al., 1992). Уровень изменчивости гетерогенной группы значительно выше (я = 0,0089), чем гомогенной группы (л = 0,0001) Различие уровня изменчивости между двумя группами bap гаплотипов статистически существенно (Р < 0,0001). Таким образом, для гена

bap выявлена диморфная структура гаплотипов и асимметричное распределение мутаций в пределах групп гаплотипов, гетерогенная группа существенно более изменчива, чем гомогенная группа гаплотипов.

4. Распределение изменчивости и дивергенции Est-6 и \yEst-6. На рис. 9 показано распределение полиморфизма и дивергенции в пределах групп и между группами гаплотипов на протяжении всей исследованной области ß-эстеразного кластера, полученное в результате использования метода "скользящего окна" (Hudson and Kaplan, 1988). Нуклеотидные последовательности разделены на Rsal+IRsal- (А) или F/S (Б) группы гаплотипов. Оба распределения обнаруживают заметные пики изменчивости, которые, как неоднократно показано, могут отражать действие балансирующего отбора (Strobeck, 1983; Hudson and Kaplan, 1988; Kaplan et al., 1988; Nordborg, 1997). При делении гаплотипов на /?sal+ и Rsal- (рис. 9, А) выявляется отчетливый пик в промоторной области (в координатах 329-690); пик обусловлен в основном различиями между Rsa\+ и RmI- гаплотипами, а не изменчивостью в их пределах (значения л чрезвычайно малы в сравнении с К). Повышенный уровень изменчивости в данной области промотора выявлен ранее в австралийской популяции (Odgers et al., 1995). Имеются также пики в структурной части кластера, включая область F/S полиморфизма (координаты 1800-2200). Однако во всех случаях структурные пики обусловлены полиморфизмом гаплотипов, а не различиями между ними (значения п сопоставимы с К\ рис 9, А). При делении гаплотипов на F и S (рис. 9, Б) обнаруживается иное соотношение между полиморфизмом и дивергенцией гаплотипных семейств. Хотя для данной группировки также выявляются заметные пики как в промоторной, так и в кодирующей области (рис 9, Б), тем не менее, лишь в кодирующей области пики обусловлены в основном различиями между F и S гаплотипами, включая пик, центрированный на F/S полиморфный сайт Est-6 (координаты 1800-2200) Схожие пики в гене Est-6 мы обнаружили также для данных, полученных другими авторами (рисунок не приводится) (Cooke and Oakeshott, 1989; Hasson and Eanes, 1996). Это наблюдение, наряду с тем, что пики Est-6, центрированные на Rsal+IRsal- и F/S полиморфизм, регулярно выявляются во всех исследованных популяциях, а также совпадают с пиками статистик тестов на нейтральность и неравновесия по сцеплению (данные не приводятся), подтверждают гипотезу о действии балансирующего отбора, влияющего независимо на промотор и кодирующую область Est-6. Вдоль последовательности ^ Est-6 обнаруживаются несколько пиков (рис. 9), которые повторяются с некоторой регулярностью (с интервалом в 200-300 нуклеотидов), без какой бы то ни было согласованной взаимосвязи с несинонимичным полиморфизмом Обращает на себя внимание большая выраженность пиков изменчивости у Est-6, в сравнении с Est-6 (рис. 9).

0,04

0 03 0,0/ О 01 ООО

0 04

0.03 0 02 0 01 0,00

О 1000 2000 3000 4000 5000

Est-6 VEsl-6

—,—i j нн-

BsalHBsal- F/S

Рис 9 Распределение нуклсотидного разнообразия (я) и дивер1енции (К) в пределах и между i руинами 1аплотипов Р-эстеразного кластера Нуклеотидные постедоватстыюсти разделены на Rsal+/Rsal- (А) и F/S (Б) группы гашкмипов Дивергенция рассчитана как среднее число нуклеотидных замещений на сайт между группами Схема Р-эстеразного KJiaciepa представлена под графиками Короткие вертикальные линии на схеме отмечают позиции RsaWRsal- и F/S полиморфных сайтов Размер окна составляет 100 нуклеотидов, инкремент составляе! 10 нуклеотидов Пояснения см рис 1

На протяжении Est-б отчетливо выявляются долинные области пониженной нуклеотидной изменчивости, обусловленные, вероятно, действием негативного отбора (рис. 9). Имеется также ряд явно выраженных долинных областей в пределах \|iEst-б Этот факт говорит о том, что последовательность \\tEst-6 также находится под селективным ограничением, и подтверждает наше предположение о наличии функциональной роли этого предполагаемого псевдогена (см ниже).

На рис 10 приведены графики распределения нуклеотидного полиморфизма и дивергенции для полной длины /3-эстеразного кластера Значения уровня дивергенции (К) существенно снижаются в конце 5' фланкирующей области, в начале а также в начале и в конце \)/£лг 6

Нуклеотидная позиция

-Г Н ->П-

Est-6 ifiEst-6

Рис 10 Распределение молчащей нуклеотидиой изменчивости (л, юнкая линия) и дивер/енции (К, жирная линия) на протяжении Р-эстеразного кластера D melanogaster Размер окна составляет 100 нуклеотидов, инкремент составляет 1 нуклеотид Остальные пояснения см рис 1

Эти снижения могут быть обусловлены функциональными ограничениями (конец 5'-фланкирующей области и 3'-фланкирующая область) и генной конверсией (начало \|fEst-б, 1де выявлены признаки межлокусной конверсии между Est-б и \\iEst-6, см. выше). Показано (Healy et al., 1996), что 3' последовательности, которые располагаются в пределах транскрипционной единицы xyEst-б, содержат элементы, модулирующие экспрессию Est-б, что I подразумевает определенную регуляторную функцию для \\tEst-6 Бопее того,

обнаружено (Brady and Richmond, 1992) некоторое сходство последовательности в 3'-фланкирующей области между \|iEst-6 (D. I melanogaster) и его ортологом Est-5A (D. pseudoobscura). В частности,

сегмент длиной 110 нуклеотидов в пределах этой области имеет 76% сходства последовательностей между двумя видами, что резко контрастирует с уровнем сходства, составляющим 20% или ниже в 5'области либо между \\lEsi-6 и Est-5A, либо между ортологами Est-б и E<;t-5B (Brady and Richmond, 1992).

tin и bap. На рис. 11 приведены графики распределения нуклеотидного полиморфизма у D. melanogaster (рис. 11, А), дивергенции между этим видом и D simulans (рис. 11, Б) и отношения полиморфизма к

0,04 0,03 0,02

0 01 о

0.6 04 02

о

1 о

0.2 06 0,4

02 0

о 500 1000 1500 2000 2500 3000 3500 4000 5' нитрон I 5' янтрон 3'

-□-1 Н Н к-

экзон I экзон П экзон I экзон Д

Un I bap

Рис 11 Графики распределения значений (А) нуклеотидного разнообразия, (Б) молчащего нуклеотидного рамообразия (тонкая линия) и дивергенции (К, жирная шния), (В) отношения полиморфизма к дивергенции для генов tin и bap у D melanngaster Размеры окон составляют 100 нуклеотидов с 1-нуклеотидным инкрементом для (А) 50 нуклеотидов с 1-нуклеотидным инкрементом для (Б) и 10 вариабельных замещений для (В) Схема исследованной обчаыи приведена ниже графиков Остальные пояснения см рис 1 и 9

дивергенции (рис 11, В) Для гена tin обнаружено два пика повышенной нуклеотидной изменчивости (рис. 11, А) в 5'-фланкирующей области (позиция 271-280) и интроне (позиция 992-1027). Эти пики совпадают с пиками дивергенции (рис. 1 1, Б). Наивысший пик отношения полиморфизма к

дивергенции в пределах гена tin, однако, не совпадает с пиками изменчивости и дивергенции; этот пик центрирован на экзон I гена tin (рис 11, В). Для гена bap выявлен отчетливый пик повышенной изменчивости (рис. 11, А) в интронной области (в координатах 2969-3003), не сопровождаемый, однако, пиком дивергенции (рис. 11, Б) Напротив, имеется очевидное снижение дивергенции в интронной области гена bap, что приводит к появлению пика отношения молчащей дивергенции к полиморфизму (в координатах 27002900, рис. 11, В). Интронный пик совпадает с пиком неравновесия по сцеплению (рис. 11, Г). Наивысший пик отношения молчащей дивергенции к полиморфизму центрирован на экзон II гена bap (позиция 3200, рис. 11, В). Минимальные значения отношения полиморфизма к дивергенции в пределах U гена bap отмечаются в начале экзона I и центрируются на два

несинонимичных полиморфных сайта (позиции 2676 и 2677, рис. II, В). Наименьшие и наивысшие значения отношения полиморфизма к дивергенции сопровождаются наибольшими значениями статистик теста МакДональда (McDonald, 1996, 1998).

Варианты в пределах интронов обоих генов сегрегируют как единые гаплотипные блоки. Для гена tin интронный пик нуклеотидной изменчивости соответствует выраженному пику дивергенции, однако, для гена bap обнаружена обратная тенденция' пик изменчивости соответствует наиболее низкому значению дивергенции (рис. 11, А и Б). Сходная тенденция обнаружена для экзона II гена bap: уровни изменчивости и дивергенции близки в этой области (рис. 11, Б). Таким образом, для гена tin величина дивергенции между видами находится в соответствии с величиной внутривидового полиморфизма, однако для гена bap выявлено несоответствие между уровнем дивергенции и полиморфизма. В интроне и экзоне II гена bap отмечается снижение дивергенции и параллельное повышение полиморфизма, что может быть обусловлено влиянием позитивного отбора (см. ниже).

Гетерогенность распределения полиморфных сайтов и степень соответствия между уровнем полиморфизма и дивергенции (melanogaster-simulans или melanogaster-sechellia) оценены с использованием тестов Госса -И Левонтина (Goss and Lewontin, 1996) и МакДональда (McDonald, 1996, 1998)

При всех использованных значениях параметра рекомбинации (от 1 до 64) тесты оказались несущественными для гена tin. Однако тесты существенны Я для гена bap (Gmax = 18,467, Р = 0,020; runs = 20, Р = 0,007; Var = 0,0021, Р =

0,003; Varmod = 0,0046; Р = 0,006). Выявлено две области в пределах гена bap с наиболее высокими значениями G статистики теста МакДональда (McDonald, 1996, 1998) Первая (и наиболее выраженная) область располагается в начале экзона I гена bap и совпадает с регионом низкого отношения полиморфизма к дивергенции (см. рис. 11). Вторая область представлена в экзоне II и совпадает с регионом высокого отношения полиморфизма к дивергенции. Регион низкого отношения полиморфизма к дивергенции центрируется на два несинонимичных замещения Регион высокого отношения полиморфизма к

t

дивергенции локализуется в пределах экзона II (рис. 11, В). Область низкого отношения полиморфизма к дивергенции может быть результатом направленного отбора, тогда как область высокого отношения полиморфизма к дивергенции, вероятно, обусловлена действием балансирующего отбора (McDonald, 1996, 1998), что подтверждается тестами на нейтральность (см. раздел 6). Мы показали, что оба вышеназванных типа отбора определяют эволюцию гена Est-б у D. melanogaster. Полученные данные для гомеобокс-содержащих генов позволяют предположить, что как направленный, так и балансирующий отбор также вовлечены в эволюцию гена bap. Чтобы проверить это предположение необходимо исследовать отношение полиморфизма к дивергенции отдельно в регионах с низким и высоким уровнем полиморфизма, которые приблизительно соответствуют экзону I и экзону II гена bap, используя тест МакДональда - Крейтмана (McDonald and Kreitman, 1991) и/или тест Хадсона и соавторов (Hudson et al, 1987) Данные тесты, однако, вряд ли применимы в этом случае, поскольку имеется только два синонимичных сайта в пределах экзона I гена bap. Таким образом, сопоставление паттернов полиморфизма относительно дивергенции в обоих экзонах невозможно. Тем не менее, для экзона II гена bap тест Хадсона и соавторов (Hudson et al., 1987) выявляет существенно более высокое значение отношения полиморфизма к дивергенции в сравнении с полной последовательностью гена tin: = 4,484, Р = 0,034 (если D. simulans используется как аутгруппа) и = 4,813, Р = 0,028 (если D. sechellia используется как аутгруппа), что находится в соответствии с гипотезой о возможном действии позитивного отбора на данный регион.

5. Межлокусные взаимодействия

Est-6 - Sod. Гены Est-6 и Sod сцеплены, расстояние между ними составляет около 938 кб. В анализ включена полная последовательность гена Est-б и 3'-фланкирующий регион (суммарно 1879 нуклеотидов). Для гена Sod использован сегмент, включающий два экзона и интрон, а также 3'-фланкирующий регион (суммарно 1408 нуклеотидов, Hudson et al., 1994, 1997). Нуклеотидный полиморфизм исследован совместно в Est-б и Sod в г руппе из 15 линий D. melanogaster (калифорнийская популяция).

В пределах Est-б статистически существенное неравновесие выявлено для 262 из 351 (74,6%) попарных сравнений. С поправкой Бонферрони на множественные сравнения число существенных ассоциаций составило 192 (54,7%). Значительное неравновесие обнаружено также для гена Sod: 211 из 325 попарных сравнений (64,9%) оказались статистически существенными (с поправкой Бонферрони число ассоциаций снижается до 191 (58,8%)) Однако между генами, как точный тест Фишера, так и %2 тест, не выявили существенных межлокусных ассоциаций, что может объясняться асимметричным распределением часют аллелей (Lewontin, 1995).

Показано (Lewontin, 1995), что точный тест Фишера не достаточно чувствителен в случае асимметричного распределения частот аллелей, что, в частности, обнаружено для генов Est-6 (см. раздел 4) и Sod (Hudson et al., 1994, 1997). В такой ситуации вследствие численных причин имеется очень низкая вероятность получения существенных тестов при использовании обычных четырехклеточных таблиц сопряженности признаков. Для преодоления этой проблемы Левонтин (Lewontin, 1995) разработал тест, основанный на распределении знака неравновесия ("знаковый" тест), который позволяет анализировать данные с асимметричным распределением частот аллелей и делать выводы по общему уровню неравновесия по сцеплению. Процедура включает анализ числа позитивных и негативных значений неравновесия по сцеплению (выраженных в D) для каждого полиморфного сайта в пределах и между всеми типами попарных сравнений (синглетоны с с инглетонами, дублеты с дублетами и так далее; Lewontin, 1995). Наблюдаемое значение, суммированное для конкретного типа попарного сравнения, сопоставляется с ожидаемым значением, используя G-критерий (Sokal and Rohlf, 1981, с. 695-707).

Мы рассчитали значения D для всех попарных сравнений между сайтами генов Est-6 и Sod Общее число наблюдаемых негативных ассоциаций составило 1551, тогда как ожидаемое значение существенно меньше и составило 1248,27 (G = 459,60, Р < 0,00001). Данный результат доказывает наличие существенного эксцесса негативных ассоциаций между Est-6 и Sod. Менее частые аллели по этим локусам находятся в основном в фазе отталкивания. Для более точной локализации неслучайных ассоциаций мы применили тест Левонтина отдельно для различных регионов генов. Наиболее существенные ассоциации обнаружены между кодирующей областью Est-6 и интроном Sod (G = 277,36, Р < 0,00001), а также между кодирующей областью Est-6 и 3'-фланкирующим регионом Sod (G = 53,11, Р < 0,001). Выявлены также существенные ассоциации между кодирующими областями обоих генов, которые, однако, заметно менее выражены, хотя и статистически существенны (G = 6,12, Р < 0,05). Интересно, что в последнем анализе существенное неравновесие (G = 6,52, Р < 0,05) обнаружено между регионами Est-6 и Sod, которые включают сайты, ответственные за F/S полиморфизм по каждому локусу (экзон I гена Est-6 и экзон II гена Sod). Выраженность неравновесия, однако, в данном случае невелика, что, возможно, обусловлено эффектом селективного свипа, существенно снижающим изменчивость в гене Sod, и, как следствие, удаляющим большую часть межлокусных ассоциаций При исключении синглетонов характер неравновесия по сцеплению между двумя генами не меняется.

Действие направленного отбора выявлено ранее для гена Sod (Hudson et al., 1994, 1997) Мы также показали влияние направленного отбора на формирование паттернов нуклеотидной изменчивости Est-6 (см. раздел 3) Существенная ассоциация между Est-6 и Sod может быть следствием

селективных процессов, обнаруженных в каждом из этих генов, а именно, за счет действия отбора, направленного на мутации, инкорпорированные в определенные гаплотипы, не совпадающие по двум генам. Это предположение объясняет специфическое распределение дивергентных гаплотипов, приводящее к появлению статистически существенного неравновесия по сцеплению между генами.

Ев^б: промотор - кодирующая область. На рис 12 показаны результаты анализа неравновесия по сцеплению между несинглетонными

0,01 < Р < 0,05 0,001 < Р< 0,01 Р < 0,001

Рис 12 Точный тест Фишера неслучайных ассоциаций между парами полиморфных сайтов у О теШю^пУег Каждый квадрат

матрикса представляет сравнение двух полиморфных сайтов Позиции сегрегирующих сайтов приведены на диагонали

парами полиморфных сайтов. Существенность неравновесия оценивалась с использованием точного теста Фишера. Из 1225 попарных сравнений 445 (36,3%) демонстрируют существенное неравновесие С поправкой Бонферрони число существенных ассоциаций снижается до 114 (9,3%). Выявлено две области существенных ассоциаций: первая включает промоторный регион, а вторая соответствует кодирующей области гена В пределах этих регионов соответственно выявлено 52,9% и 55,2%

существенных ассоциаций (33,3% и 11 5% с поправкой Бонферрони). Неравновесие по сцеплению значительно менее выражено между промоторным и кодирующим регионами, 15,1% (или 1,0% с поправкой Бонферрони). Таким образом, данные по межлокусным ассоциациям подтверждают наше предположение о независимом действии позитивного отбора на промотор и кодирующую область Est-6.

Est-6 и iEst-6. Для всего исследованного региона выявлено значительное неравновесие по сцеплению между полиморфными сайтами: из 8646 попарных сравнений 4092 (47,33%) являются существенными С учетом поправки Бонферрони остается 15,07% существенных ассоциаций (Бонферрони-корректированные значения отсюда и далее даются курсивом). Неравновесие явно выражено и в пределах отдельных функциональных областей кластера: 32,05% (23,08%), 41,48% (23,11%) и 62,65% (32,43%) ассоциаций существенны соответственно для 5'-фланкирующей области, Est-6 и у Est-6. Межгенное неравновесие выражено столь же явно, как и внутригенное: 46,44% (5,86%) тестов существенны между Est-6 и V|iEst-6. Полагаем, что межгенный эпистатический отбор может играть существенную роль в эволюции Р-эстеразного генного кластера, предохраняя \\iEst-6 от дегенеративной деструкции и отражая возможные функциональные взаимодействия между Est-6 и \)iEst-6 (например, регуляторное взаимодействие, см., Healy et al., 1996).

В африканской выборке выявлена незначительная степень неравновесия (2,62% существенных ассоциаций), что контрастирует с выраженным неравновесием в европейской, северо- и южноамериканской выборках, составляющим соответственно 21,91%, 37,34%, и 48,97%. Ярко выраженная гаплотипная структура и ассоциированный с ней высокий уровень неравновесия по сцеплению подтверждает предположение, что южноамериканская популяция возникла в результате относительно недавнего смешивания генетически дифференцированных популяций

Распределение уровня неравновесия по сцеплению (выраженного в значениях D) вдоль всей исследованной области (3-эстеразного генного кластера неоднородно Имеется отчетливые пики высоких значений D вокруг Rsal+IRsa\- и F/S сайтов в пределах Est-6 и несколько пиков на протяжении yEst-6. Наличие повышенного уровня неравновесия по сцеплению, центрированного на функционально важные сайты Est-6, подтверждает действие балансирующего отбора, предполагаемого на основании повышенного уровня полиморфизма в данных областях (см выше).

tin и bap. Для всего исследованного региона осуществлено 1378 попарных сравнений и 514 (37,30%) из них оказались существенными. С поправкой Бонферрони, 156 (11,32%) сравнений остаются существенными Значительный уровень неравновесия по сцеплению выявлен в пределах гена tin: 83,69 % (272 из 325) попарных сравнений являются существенными (55,69

%, 181с поправкой Бонферрони) Существенные ассоциации обусловлены в основном полиморфными сайтами, локализованными в пределах некодирующих областей гена tin (5'-фланкирующая область и интрон); только три экзонных сайта (позиции 1884, 2245 и 2284) вовлечены в существенные ассоциации В пределах гена bap 48,43 % попарных сравнений (170 из 351) обнаруживают статистически существенное неравновесие по сцеплению (9,69 %. с поправкой Бонферрони). Распределение существенных ассоциаций в пределах гена bap не равномерно более чем половина сайтов, вовлеченных в существенные ассоциации, располагаются в пределах экзона II Между генами tin и bap выявлено только 5,22 % (72 из 1378) существенных тестов; с поправкой Бонферрони межгенного неравновесия не выявляется.

В пределах обоих генов обнаружена высокая степень ассоциации между интронными сайтами. Кластеры статистически существенного неравновесия по сцеплению, локализующиеся преимущественно в интронах были неоднократно обнаружены у Drosophila (Miyashita and Langley, 1988; Miyashita et al , 1993; Schaeffer and Miller, 1993). Кирби и соавторы (Kirby et a!, 1995) показали, что кластеризованные блоки неравновесия, располагающиеся в пределах интронов локуса Adh у D. pseudoobscura, обусловлены действием эпистатического отбора, сохраняющего вторичную структуру предшественника мРНК Лежащий в основе механизм действия эпистатического отбора основывается на модели компенсаторных приспособительных взаимодействий (Kimura, 1985). В соответствии с этой моделью предполагается, что мутации, возникающие в спиралях РНК. индивидуально являются повреждающими, но становятся нейтральными в определенных комбинациях. С1сфан (Stephan, 1996) показал, что скорость компенсаторной эволюции существенно снижается на расстоянии более чем 100 нуклеотидов, что находится в соответствии с нашими результатами. Действительно, расстояние между интронными сайтами составляет менее чем 100 нуклеотидов как для гена tin (позиции 975, 982, 1010, 1011, 1016, 1019, 1022, 1037 и 1045), так и для гена bap (позиции 2954, 2999, 3001, 3005, 3011 и 3019) Таким образом, эволюция интронных последовательностей генов tin и bap может подвергаться ограничениям, связанным с поддержанием вторичной структуры предшественника мРНК.

6. Тесты на нейтральность

Est-б и \\iEst-6. ZnS тест (Kelly, 1997) (базирующийся на неравновесии по сцеплению между сегрегирующими сайтами) выявляет существенное отклонение от нейтральности для всех популяций (объединенные данные), для всей исследованной области, так же как и для отдельных регионов ß-эстеразного кластера генов (табл. 3).

> «Ам-*к*ИчН.1Я» " ' I 34 1 iff ! i » п. ** «©

Таблица з Тест Келли (Kelly. 1977) на нейтральность для ß-эстеразнорп генного кластера у D melanogaster

Промоюр Est-6 i|itst-6 Полная длина

Z„4 0,01 Z„i 0,01 Z„s 0,01 Z„ç 0,01

X 0,106 HC 0,079 0,035 0,158 0,010 0,092 0,010

Zim 0,138 HC 0,115 H.C 0,176 HC. 0,119 H.C

Bar 0,540 0,030 0,285 0,015 0,384 0,005 0,276 0,005

ER 0,458 0,020 0,204 0,015 0,422 0,005 0,286 0,005

Yen 0,453 0,025 0,386 0,010 0,564 0,005 0,482 0,005

Таблица представляет значения Z„s (Kelly, 1997) и частоты рекомбинации при которых выявляется существенное отклонение от нейтральности на 1% (колонка 0,01) уровне значимости НС - несущественное значение Z„i с лабораторной оценкой частоты рекомбинации (0,0664) X - суммарные данные для всех выборок Пояснения см табл 1

В и Q тесты Волла (Wall, 1999) выявляют сходные результаты. Все неафриканские выборки обнаруживают существенные значения ZnS с частотой рекомбинации > 0,005 (Р = 0,01). Z„5 тест также существенен для различных составных частей ß-эстеразпого кластера (5'-фланкирующий регион, Est-6 и Est-6) в этих выборках. Однако в африканской выборке значения ZnS несущественны для любой составной части, так же как и для полной области, даже с лабораторной оценкой частоты рекомбинации (0,0664), базирующейся на сопоставлении физической и генетической карт D. melanogaster (Comeron et al., 1999). Мы полагаем, что существенность тестов в промоторной области и Est-6 отражает действие естественного отбора и демографических факторов, связанных с колонизационной историей D. melanogaster Известно, что этот вид возник в Африке (Lachaise et al., 1988), откуда, по некоторым сведениям. 10-15 тысяч лет назад мигрировал на Евразийский континент (David and Сару, 1988; Singh and Long, 1992). Гомес и Хассон (Gomez and Hasson, 2003) выдвинули предположение о действии балансирующего отбора на ген Est-A у D. buzzatii, который, вероятно, является гомологом Est-6 (East et al., 1990) Существенность тестов для \\s Est-6 может отражать специфический характер эволюции (редкая рекомбинация) этого предполагаемого псевдогена, а также особенности демографической истории D. melanogaster. В пределах \|rEst-6 выявляются отчетливые пики повышенного уровня полиморфизма (рис. 9) и пониженного уровня дивергенции для 5'- и 3'-фланкирующих областей (рис 10), что может отмечать регионы, находящиеся под воздействием позитивного отбора.

tin и bap. Z„s тест Келли (Kelly, 1997) выявляет существенное отклонение от нейтральности (Р = 0,01) для полной области с частотой рекомбинации 0,0072 (значение частоты рекомбинации, полученное при помощи метода МакВина и соавторов (McVean et al, 2002). В и Q тесты Волла (Wall, 1999) существенны даже без рекомбинации (Р = 0,01) Области

существенных значений статистик Келли и Волла совпадают с пиками неравновесия по сцеплению для обоих генов. Для гена tin тесты выявляют отклонения от нейтральности с менее строгими условиями оценки существенности (меньшие значения рекомбинации). В целом тесты на нейтральность существенны для полной области, а также для каждого гена в отдельности, с частотой рекомбинации значительно ниже, чем значение, полученное при сопоставлении физической и генетической карты D. melanogaster, Сшц = 0,0744 (лабораторная оценка рекомбинации, Сошегоп et al., 1999) Мы полагаем, что существенность тестов на нейтральность может отражать действие отбора в совокупности с демографической историей D. melanogaster. Более высокие значения ZnS, В и Q статистик, обнаруженные для гена tin, могут быть обусловлены специфическим характером эволюции этого гена (низкая частота рекомбинации), наряду с особенностями демографической истории D. melanogaster:

Как для гена tin, так и bap обнаружено две группы дивергентных гаплотипов (рис. 7, 8). Более того, группы гаплотипов заметно различаются по численности и уровню изменчивости (см. раздел 3) В таком случае целесообразно использовать гаплотипный тест Хадсона и соавторов (Hudson et al., 1994), чтобы выяснить, за счет каких эволюционных факторов (направленный отбор или эффект "бутылочного горлышка") произошло увеличение частоты некоторых гаплотипов. Для гена tin суммарно обнаружено 37 полиморфных сайтов, и гомогенная подгруппа из 18 последовательностей содержит 13 сайтов (линии от S-114S до F-96S, рис. 7). Гаплотипный тест не существенен (Р = 0,103) даже при использовании лабораторной оценки частоты рекомбинации (0,0744, см. выше). Для гена bap суммарно обнаружено 32 полиморфных сайта, но группа из 13 гомогенных линий (S-114S, F-517S, F-517F, F-531F, F-1461S, S-2588S, S-581F, S-255S, F-357F, F-611F, S-174F, S-501F и S-501S, рис. 8) включает только один полиморфный сайт. Вероятность такой конфигурации, полученной при помощи гаплотипного теста, составила 0,002, даже без учета рекомбинации. Возможным кандидатом в качестве мишени для направленного отбора может быть регион в начале экзона I гена bap, содержащий межвидовое несинонимичное замещение (рис. 11).

Для анализа распределения гаплотипов мы также использовали тесты на нейтральность, разработанные Депаулисом и Веулле (Depaulis and Veuille, 1998). Эти тесты не выявили отклонения от нейтральности для гена tin, так же как и тесты Хадсона с соавторами (Hudson et al., 1994) и МакДональда (McDonald, 1996, 1998). Однако данные тесты выявили существенное отклонение от нейтральности для гена bap, когда они были применены отдельно для гомогенной и гетерогенной группы гаплотипов. В частности, для гомогенной группы последовательностей наблюдаемое разнообразие гаплотипов составило 0,167, тогда как ожидаемое разнообразие существенно выше и составило 0,640 (Р < 0,05), что совместимо с гипотезой о действии

направленного отбора Для гетерогенной группы последовательностей тесты Депаулиса и Веулле выявили существенный избыток изменчивости: наблюдаемое разнообразие гаплотипов составило 0,952, но ожидаемое разнообразие (0,850) оказалось существенно ниже (Р ^ 0,05), что совместимо с гипотезой о действии балансирующего отбора Мы также применили тесты Депаулиса и Веулле для различных функциональных областей генов tin и bap. Для всех исследованных областей гена tin (5'-фланкирующая область, интрон I и экзон II) не выявлено существенных отклонений от нейтральности (экзон I исключен из этого анализа, поскольку его длина составляет лишь 186 нуклеотидов). Для гена bap тесты существенны при отдельном анализе экзона I и экзона 11, но эта существенность обусловлена противоположными паттернами. Для экзона I тест выявляет существенный избыток различных гаплотипов: наблюдаемое число гаплотипов составляет 7,0, при ожидаемом значении 4,9 (Р < 0,05). Для экзона II тест выявляет существенный дефицит гаплотипов: наблюдаемое разнообразие составляет 0,604, тогда как ожидаемое разнообразие гаплотипов существенно выше (0,820, Р < 0,05). Результаты этих тестов подтверждают наше предположение, что ген bap эволюционирует под комплексным влиянием позитивного отбора (см. выше).

7. Энтропия и нуклеотидный состав

Анализ энтропии. Если \yEst-6 является псевдогеном или несущественным геном, то правомерно ожидать более низкую структурную регулярность и более высокую структурную дивергенцию у этого предполагаемого псевдогена в сравнении с Est-б - функциональным паралогом \|iEst-б. Структурную регулярность и дивергенцию можно количественно охарактеризовать при помощи структурного анализа спектральной энтропии нуклеотидных последовательностей. Мы использовали подход, разработанный в работах В Р. Чечеткина и соавторов (Chechetkin et al., 1994; Chechetkin and Turygin, 1994, 1996, Chcchetkin and Lobzin, 1996, 1998). Общий обзор методов, математический анализ структурной энтропии и дальнейшие ссылки приведены в работе В. В. Лобзина и В Р. Чечеткина (Лобзин и Чечеткин, 2000) Данный подход позволяет оценить сравнительную скорость и позиционное распределение мутаций, а также их влияние на регулярность нуклеотидных последовательностей Est-б и \|iEst-6.

В результате анализа спектральной энтропии (табл. 4) обнаружена существенно более высокая упорядоченность последовательностей Est-б в сравнении с \\iEst-6 у всех исследованных видов, несмотря на значительный размах значений энтропии между геномами у различных видов.

Таблица 4 Относи 1ельные нормированные отклонения энтропии для Р-эстеразных генов у видов подгруппы Р те1апо^а\1ег_

Вид Нуклеотиды

А Г | T Ц £

Est-6

MEL -0,21 2,66 0,36 1,37 2,09

S1M -0,48 2,70 -0,12 0,83 1,46

SEC -0,11 3,56 0,56 0,21 2.11

MAU -0,23 2,42 -0,18 1,14 1,58

TFI 1,16 3,24 1.00 1,04 3,22

ORE 1.86 2,82 1,66 0,75 3.55

ERE 2,57 3,28 1,67 1,44 4,48

Ср зн 0,65 ± 0,46 2,95 ±0,16 0,71 +0,29 0,97 ±0.16 2,64 ± 0,43

4lEst-6

MEL -1,10 0,33 -0,13 -1,40 1,15

SIM -0,08 0,94 0,43 -1,35 0,02

SEC -0,38 0,78 0,44 -1,69 0,43

MAU -0,00 -0,71 -0,11 -1,59 1,21

TEI 1,53 0.41 1,38 -2,03 0,64

ORE 1,23 1,54 -0,45 -0,07 1,13

ERE 1,21 2,27 0,16 -0,60 1,53

Ср зн 0,34 ± 0,37 0,79 ± 0,36 0.25 ± 0,22 -1,25 ±0,26 0,87 ± 0,20

MaiewdiHHecKHÍí анализ структурной энтропии см Лобзин и Чечеткин (2000) X - суммарные значения отклонений Сокращенные обозначения видов см МАТЕРИАЛЫ И МЕТОДЫ

Значения энтропии по нуклеотидам А и Т близки для генов Est-6 и Est-6, однако по нуклеотидам Г и Ц (и как следствие, по общей величине структурной энтропии) значения энтропии ниже для Est-6, чем для \\iEst-6. Относительные нормированные отклонения энтропии (табл 11) оценивают степень отклонений Est-6 и Est-6 от случайных последовательностей Для Est-6 отклонения существенны по нуклеотиду Г у всех видов, наряду с тем, что по нуклеотидам А и Т обнаруживается высокая степень регулярности у D. arena и D erecta Для \\iEst-6 выявляется существенная регулярность только у D. erecta и только по нуклеошду Г. Таким образом, V|i Est-6 существенно меньше отклоняется от случайной последовательности, чем Est-6. Эти результаты ясно демонстрируют более низкую структурную упорядоченность \|iEst-6 в сравнении с Est-6, что соответствует ожиданию для псевдогенов

Нуклеоч идный состав. Распределение нуклеотидног о состава показано на табл 5. Средние ГЦ AT отношения для всех и кодирующих позиций не отличаются существенно между Est-6 и \\iEst-6, но это отношение существенно различается (Р = 0,0143, точный тест Фишера) для третьей позиции кодонов.

Таблица 5 ГЦ состав для и \yEst-6 у видов подгруппы ¡}_п}е1апо%а$1ег ____

Ген и вид ГЦ ГЦЗ ГЦк ГЦи ГЦЗ • АТЗ

/ГбМЕЬ 48,5 52,1 46,6 24,0 1,088

Ев Э1М 49,8 55,7 46,8 20,0 1,257

Е6 вЬС 49,7 54,6 47,2 24,0 1,203

Ь6 МАи 49,7 55,7 46,6 20,0 1,257

Е6 ТЕ! 50,7 58,1 47,0 22,0 1,387

Е6 (ЖЕ 49,3 53,6 47,1 26,0 1,155

Е6 ЕИЕ 50,0 55,7 47,2 24,0 1,257

Ср. зн. 49,7 55,1 46,9 22,9 1,227

Ч/бМЕЬ 45,6 44,1 46,4 32,1 0,789

М/бБШ 46,6 44,9 47,5 32,1 0,815

ц/б БЕС 46,7 45,8 47,2 32,1 0,845

\|/6 МАи 46,5 45,8 46,9 35,7 0,845

Ц/6ТЕ1 47,7 48,2 47,4 28,6 0,931

ц/6 (ЖЕ 46,7 46,4 46,9 28,6 0,866

ц/б ЕЯЕ 46,5 46,5 46,5 23,2 0,869

Ср зн 46,6 46,0 47,0 30,4 0,852

ГЦ - ГЦ сослав для всех шниций колонов ГЦЗ - ГЦ состав в третьей позиции кодонов ГЦк - ГЦ состав для кодирующих позиций кодонов ГЦи - ГЦ состав интронов Средние значения (Ср зн ) приведены жирным шрифтом Еб = Еи-6, ц/6 = \\lEsl-6 Пояснения см табл 4

В целом ГЦ состав существенно ниже для \\fEst-6, чем для £?г-6 (Р = 0,0156, тест Уилкоксона (У); Р = 0,006, тест Манна-Уитни (М-У)), в основном вследствие ГЦ состава в третьей позиции кодонов (ГЦЗ) (Р = 0,0156 (У); Р -0,006 (М-У)). Для кодирующих позиций различие ГЦ состава (ГЦк) между \yEst-6 и Ем-6 не существенно. Экзон I имеет существенно более высокий уровень ГЦ состава, чем экзон II для обоих генов (Р = 0,0156 (У); Р = 0,006 (М-У)). Различие ГЦ состава между экзоном I и экзоном II более выражено для Еп-б, чем для \\iEst-6. ГЦЗ состав не коррелирует между экзоном I и экзоном II для Ем-б (коэффициент корреляции Пирсона г = 0,5410, Р = 0,2099; коэффициент корреляции Спирмана гЬо = 0,468, Р = 0,2512; коэффициент корреляции Кендалла Таи = 0,293, Р = 0,4416), однако маргинально коррелирует для \yEst-6 (г = 0,7515, Р = 0,0515; гЬо = 0,725. Р = 0,0758; Таи = 0,616, Р = 0,0751) Интроны обоих генов имеют существенно более низкий ГЦ состав, чем экзоны (Р = 0,0156 (У); Р = 0,006 (М-У)) Для \\iEst-6 ГЦ состав интрона существенно выше, чем для £$¿-6 (Р = 0,0312 (У); Р = 0,0070 (М-У)). ГЦ состав интронов не коррелирует с ГЦ составом экзонов как по всем, так и по кодирующим позициям кодонов Ем-6 (г = -0,5437, Р = 0,2795) и \\iEst-6 (г = -0,4767, Р = 0,2795). Дисперсия значений ГЦ между регионами (экзон I, интрон и экзон II) заметно ниже для \|/£Чг-6, чем для Е<и-6 ГЦ состав у Ех-6 колеблется в пределах от 22,9% в интроне до 58,5% в третьей позиции

колонов (ГЦЗ) в экзоне I, тогда как у \|iEst-б размах варьирования заметно меньше: от 30,4% в интроне до 48,1% в экзоне I. Варьирование ГЦ состава незначительно для экзонов \\iEst-6 (40,2 - 48,1%), но заметно более выражено в экзонах Est-6 (36,1 - 58,5%). Для Est-6 выявлено значительное различие между ГЦЗ (58,5%) и ГЦк (48,6%) в экзоне I (Р = 0,0156 (У); Р = 0,006 (М-У)); для \\iEst-6 это различие значительно менее выражено: 47,0% в сравнении 48,1%, хотя и маргинально существенно (Р = 0,0469 (У); Р = 0,0379 (М-У)) Различий между ГЦЗ и ГЦк не выявлено в экзоне II как для Est-6 (Р = 0,2187 (У); Р = 0,1649 (М-У)), так и для yEst-6 (Р = 0,8125 (У); Р = 0,9015 (М-У)).

Смещения в использовании кодонов. Отклонение от равного использования синонимичных кодонов оценивается при помощи следующих показателей. S%2 (Shields et al., 1988), эффективною числа кодонов (ENC, Wright 1990) и индекса смещения кодонов (CBI, Morton 1993).

Значения S%2 составили 0,180 и 0,138 для Est-6 и \|)Est-6, указывая на то, что смещения в использовании кодонов значительнее для Est-6. Значения S%2 очень близки для экзона I (0,223) и экзона II (0,234) Est-6, однако имеется заметное различие между экзоном I (0,138) и экзоном II (0,229) Est-6, отражающее более высокое смещение для экзона II. Значение ENC составило 53,12 для Est-6, но 56,16 для V|lEst-6 Степень смещения экзона II выше, чем экзона I для обоих генов. Для Est-6 и у Est-6 значения ENC составили соответственно 51,80 и 56,51 (экзон I) и 48,35 и 50,16 (экзон И). Показатель CBI выше для Est-6, чем для i|tEst-6, а также выше для экзона II, чем для экзона I Значения CBI составляют соответственно 0,285 и 0,250 для полной длины генов Est-6 и Est-6. Для гена Est-6 значения CBI составляют 0,471 в экзоне II, но 0,322 в экзоне I; для \\iEst-6 значения CBI составляют 0,459 в экзоне II и 0,263 в экзоне I. Таким образом, степень смещения в использовании кодонов выше для Est-6, чем для \|lEst-6, а также выше для экзона II, чем экзона I.

Анализ энтропии и ГЦ состава выявил существенно различающиеся паттерны эволюции Est-6 и \|lEst-6 у семи видов подгруппы melanogaster. Существенно более низкая упорядоченность последовательностей \\iEst-6 в сравнении с Est-6 совместимо с предположением, что \|¡Est-6 может быть псевдогеном или нефункциональным геном. Интересной особенностью энтропии у Est-6 и \\iEst-6 является ее нуклеотид-зависимый характер Значения энтропии по нуклеотидам А и Т близки для Est-6 и \\iEst-6, но по нуклеотидам Г и Ц значения энтропии ниже для Est-6 Это говорит о том, что возрастание энтропии не является совершенно случайным процессом Кроме этого, данное наблюдение совместимо с другими характеристиками \yEst-6, демонстрирующими особенности функциональных и нефункциональных последовательностей (см. выше).

Нуклеотид-зависимый характер энтропии Est-6 и связан с

нуклеотидным составом этих генов Мы обнаружили, что у всех семи исследованных видов основное отличие нуклеотидного состава обусловлено варьированием доли ГЦ нуклеотидов в третьей позиции кодонов, которая существенно выше у Esi-б, чем у у Est-6. Общий AT состав и ГЦ состав в первой и второй позиции кодонов не отличается существенно для Est-6 и v)iEst-6. Для Est-6 выявлены существенные различия между средними значениями ГЦ состава по третьей позиции (ГЦЗ) и кодирующим позициям (ГЦк), тогда как для w/Est-б этих различий не обнаружено (табл 5). Индексы смещения использования кодонов имеют более высокие значения для Est-6, чем для Est-6, а также для экзона II - в сравнении с экзоном I у обоих 1енов. Таким образом, выявлено отчетливое взаимоотношение между нуклеотид-зависимой энтропией и различиями ГЦ состава. Это наблюдение также предполагает более жесткий отбор на уровне трансляции для Est-6 и экзона II обоих генов.

Данные по псевдогенам и нефункциональным последовательностям согласуются с гипотезой, в соответствии с которой сайты, эволюционирующие при низких функциональных ограничениях, имеют тенденцию к возрастанию AT состава Это AT смещение было обнаружено у псевдогенов эукариот (Gojobori et al. 1982; Li et al. 1984) и тщательно исследовано на геномном уровне (Alvarez-Valin et al. 2002; Echols et al. 2002; Zhang and Gerstein 2003). Обнаружено, что ГЦ-богатые гены имеют эксцесс GC —> AT мутаций в сравнении с AT > GC мутациями (Eyre-Walker 1999; Smith and Eyre-Walker 2001), но AT —» GC мутации имеют более высокую вероятность фиксации (Duret et al. 2002; Webster and Smith 2004). Это смещение вероятностей фиксации мутаций незначительно варьирует в геномных областях с различным ГЦ составом (Lercher and Hurst 2002; Webster and Smith 2004) и может быть обусловлено отбором (Alvarez-Valin et al. 2002), смещенной генной конверсией (Eyre-Walker 1993, Birdsell 2002; Lercher and Hurst 2002; Marais 2003; Galtier et al. 2001), или тем и другим (Smith and Eyre-Walker 2001; Lercher et al. 2002). Следовательно, функциональные гены имеют тенденцию становиться ГЦ-богатыми, поскольку негативный отбор элиминирует эксцесс GC —» AT мутаций, тогда как у псевдогенов или нефункциональных последовательностей эта элиминация не эффективна, что приводит к возрастанию AT состава. Контрастные характеристики ГЦЗ состава и значений энтропии, полученные для Est-6 и \yEst-6, предполагают, что главным детерминантом этих отличий может быть баланс между смещением вероятностей фиксации мутаций (Alvarez-Valin et al. 2002; Webster and Smith 2004) и отбором, благоприятствующим возрастанию ГЦ состава у Est-6, но не у MfEst-6. Наблюдаемые отличия для энтропии и ГЦ состава могут отражать эволюционный сдвиг, ассоциированный с процессом

псевдогенизации \\iEst-6 и последующей функциональной дивергенции \\iEst-6 и Est-6 после дупликационного события.

ЗАКЛЮЧЕНИЕ

В работе приведены результаты молекулярно-эволюционных исследований /З-эстеразных генов, Est-6 и \|iEst-6, а также сцепленных с ними генов, Sod, tm и bap, у семи видов Drosophila, принадлежащих к подгруппе melanogaster. Выявлена сложная структура гаплотипов. Дивергентные нуклеотидные последовательности находятся в разной степени ассоциации с F/S Est-6 аллозимным диморфизмом (от полного ее отсутствия в южноамериканской выборке, до полной или близкой согласованности соответственно, в европейской и североамериканской выборках). Диморфизм последовательностей не выражен в африканской выборке Отсутствие полного соответствия между аллозимным полиморфизмом и дивергентными группами гаплотипов может объяснять парадоксальные несоответствия свойств F и S аллозимов у D. melanogaster, выявленные в разных лабораториях (см. обзоры Oakeshott et al., 1989, 1993). Обнаружены существенно различающиеся характеристики нуклеотидной изменчивости изученных генов. Значения синонимичного полиморфизма и дивергенции соответственно варьируют от 0,0052 {tin) до 0,0268 {yf Est-6) и от 0,0614 {tin) до 0,1474 {Est-6). Выявленные различия могут быть обусловлены особенностями эволюционной истории и функциональными ограничениями генов. Таким образом, для получения несмещенной оценки изменчивости генома, а также для реалистичных филогенетических построений целесообразно использовать мультигенный подход, позволяющий нивелировать отклонения, обусловленные спецификой эволюции отдельных генов.

1. Сравнительная характеристика функционально связанных генов

Исследованные пары генов {Est-6 - ц/Est-6 и tin - bap) являются родственными, возникшими путем дупликации. Тем не менее, особенности их молекулярной эволюции заметно различаются.

Est-6 и у Est-6. Обнаружены существенно различающиеся характеристики нуклеотидной изменчивости у \yEst-6 и Est-6. На популяционном уровне обнаружено варьирование длины экзона I у \\fEst-6, но не у Est-6. Общий уровень изменчивости, неравновесия по сцеплению и отношения синонимичных замещений к несинонимичным существенно ниже для Est-6, чем для \\iEst-6. Популяционная частота рекомбинаций у Ц/Est-6 в 2,6 раз ниже, чем у Est-6 (последнее различие наблюдается только в неафриканских выборках). Генная конверсия обнаружена в пределах как Est-6, так и (значительно чаше) \\iEst-6, но редко происходит между генами. Структура гаплотипов сложная и представлена дивергентными наборами

сходных аллелей; дивергентные последовательности по двум генам, однако, не конгруэнтны.

Полученные данные указывают на то, что yEst-б может быть псевдогеном; 17 преждевременных стоп-кодонов на 78 исследованных последовательностей вряд ли совместимы с выводом о функциональности кодируемого белка; число аминокислотных замещений, обнаруженных у lj¡Est-б, в три раза выше, чем у Est-б, и некоторые из них являются радикальными; анализ энтропии выявил значительно более низкую структурную регулярность и более высокую структурную дивергенцию для \|iEst-б, что соответствует ожиданию для псевдогена Однако, как отмечено выше, ген экспрессируется (Collet et al., 1990), и некоторые аллели продуцируют каталитически активную эстеразу (Dumancic et al., 1997), выявляемую на стадиях поздней личинки и у взрослых особей обоих полов, тогда как транскрипты функционального гена Est-б обнаруживаются на всех стадиях жизненного цикла, но в основном у взрослых самцов (Collet et al.. 1990; Dumancic et al., 1997), что соответствует значительной роли EST-6 в репродуктивной биологии (Richmond et al., 1980; Gromko et al., 1984). Более того, у \|iEst-б скорость синонимичных замещений выше, чем скорость несинонимичных, а тесты на нейтральность являются статистически существенными. В пределах последовательности \|sEst-б выявлены области повышенной изменчивости и пониженной дивергенции, что не согласуется с нейтральной моделью. Таким образом, характеристики изменчивости, рекомбинации и неравновесия по сцеплению указывают на то, что молекулярная эволюция \\rEst-6 подвергается селективным ограничениям и, как обнаружено для многих псевдогенов у Drosophila и других организмов, \|iEst-б проявляет особенности как функциональных, так и нефункциональных генов.

tin и bap. Обнаружены существенные различия уровня и паттерна нуклеотидной изменчивости у двух тесно сцепленных гомеобокс-содержащих генов tin и bap, занимающих различные иерархические позиции во взаимодействующей сети генов. Уровень изменчивости существенно ниже, а отношение дивергенции к полиморфизму выше у гена tin, чем у bap. Также уровень молчащей дивергенции между D melanogaster и D. simulans выше в интроне, чем в экзонах гена tin. Уровень изменчивости гена tin находится в пределах значений, наблюдаемых у других регуляторных генов Drosophila (Moriyama and Powell, 1996; Powell, 1997; Baines et al., 2002; Riley et al., 2003) и некоторых других организмов (Purugganan, 2000) Уровень молчащей изменчивости гена bap существенно выше и приближается к значениям, наблюдаемым для наиболее полиморфных генов Drosophila, таких как Est-б и \|iEst-б. Частоты рекомбинации и генной конверсии также заметно выше для гена bap, чем tin.

Полученные данные говорят о том, что негативный отбор редуцируют уровень изменчивости в кодирующих областях гена tin. Паттерны нуклеотидной изменчивости tin и bap не совместим с равновесной моделью селективной нейтральности. Демографическая история D. melanogaster наряду с негативным (очищающим) отбором могут быть основными факторами, формирующими наблюдаемые паттерны нуклеотидной изменчивости гена tin. С другой стороны, имеются свидетельства в пользу того, что позитивный отбор влияет на молекулярную эволюцию гена bap: балансирующий отбор увеличивает, а направленный отбор уменьшает изменчивость в областях, непосредственно окружающих полиморфные сайты-мишени.

Гомеобокс-содержащие гены tin и bap контролируют формирование кардиобластов и висцеральных мышц из мезодермальных масс (Azpiazu and Frasch, 1993; Bodmer, 1993). Ген tin функционирует на верхней ступени генетической иерархии, определяя развитие сердца и висцеральной мезодермы. В процессе развития мезодермы первым экспрессируется ген tin, и мутации в этом гене препятствуют экспрессии гена bap. Обратного влияния, однако, не обнаружено (Azpiazu and Frasch, 1993). Более высокая иерархическая позиция гена tin ассоциируется с меньшим уровнем генетической изменчивости и негативным отбором, тогда как ген bap, являющийся функционально зависимым компонентом этого взаимодействующего комплекса, демонстрирует признаки адаптивной эволюции.

2. Соотношение нейтральных факторов и отбора

при формировании паттерна нуклеотидной изменчивости

Присутствие двух или более значительно дивергированных гаплотипов часто интерпретируется как результат позитивного отбора (см., например, Benassi et al., 1999; Hudson et al., 1994, 1997, Labate et al., 1999). Титер и соавторы (Teeter et al., 2000) исследовали однонуклеотидный полиморфизм (SNP) у D. melanogaster с использованием 66 последовательностей, располагающихся на интервалах в 5 - 20 сантиморганид, и построили карту, которая не имеет промежутков более чем в половину хромосомного плеча (Teeter et al., 2000). Две трети всех последовательностей оказались диморфными. Если этот результат экстраполировать на весь геном D. melanogaster, тогда один сайт на несколько тысяч оснований должен был бы подвергаться интенсивному позитивному отбору (исходя из предположения, что диморфизм является результатом позитивного отбора), что представляется крайне маловероятным (Teeter et al., 2000). В качестве альтернативы Титер и соавторы предлагают другое объяснение, в соответствии с которым смешивание двух дифференцированных популяций может являться причиной диморфизма (Teeter et al., 2000). Аналогичное заключение сделано на основании

нуклеотидного секвенирования, рестрикционного и аллозимного анализов природных популяций D. melanogatter (David and Сару, 1988; Singh and Long, 1992; Richter et al., 1997; Hasson et al., 1998). Наши данные, полученные для ß-э стеразпых и гомеобокс-содержащих генов, вполне сомасуются с предположением, высказанным Титер и ее коллегами (Teeter et al., 2000), а также другими авторами Более того, диморфная структура гаплотипов также характерна для гена Sod у D. melanogaster (Hudson et al., 1994, 1997), который располагается на третьей хромосоме

Несмотря на то, что демографические факторы, вероятно, являются определяющими при формировании нуклеотидных паттернов, данные для Est-6 и bap определенно говорят о том, что позитивный отбор также вносит существенный вклад в наблюдаемое распределение изменчивости Балансирующий отбор создает повышенный уровень нуклеотидной изменчивости и неравновесия по сцеплению вблизи полиморфных сайтов-мишеней, в то время как направленный отбор создает существенный избыток почти идентичных последовательностей, проявляющих очень низкий уровень изменчивости. Паттерны изменчивости у vjiEit-6 и tin более поляризованы (диморфная структура более явная), чем у Est-6 и bap. Это может быть следствием суперпозиции эффектов позитивного отбора, рекомбинации и демографической истории, комплексно воздействующих на эволюцию Est-6 и bap. У xyEst-6 и tin рекомбинация ограниченна, и паттерн изменчивости отражае г более адекватно демографическую историю вида.

3. Филогеография D. melanogaster

Структура гаплотипов и уровень изменчивости ß-шперашого кластера генов находится в соответствии с общей картиной взаимоотношения между африканской (предковой) и неафриканскими (производными) популяциями D. melanogaster (Begun and Aquadro, 1993; Andolfatto, 2001; Aquadro et al., 2001). Африканская выборка имеет наиболее высокий уровень нуклеотидного разнообразия и наиболее низкий уровень неравновесия по сцеплению; соответственно, уровень изменчивости существенно ниже, а неравновесие значительно более выражено в неафриканских выборках. Тесты на нейтральность существенны в неафриканских выборках, но несущественны в африканской выборке (табл. 3). Данный паттерн можно объяснить эффектом бутылочного горлышка, обусловленного колонизационной историей вида Тем не менее, особенности распределения и структуры гаплотипов в неафриканских выборках дают основание полагать, что генетический состав распространяющихся популяций изменялся в процессе колонизации под воздействием направленною отбора Так, уровень изменчивости Rsal- и S гаплотипов значительно более низок (значения D статистики Таджимы существенны и отрицательны), чем ожидается при условии нейтральных изменений в популяциях. Однако характер

изменчивости /?ла1+ и F гаплотипов не отклоняется от нейтральных ожиданий; для этих гаплотипов тест Таджимы несущественен Кроме этого, гаплотипный тест (Hudson et al., 1994) выявляет существенный избыток сходных, низкоизменчивых гаплотипов в производных популяциях, за исключением выборки из Барселоны (в которой, тем не менее, обнаружены более низкая изменчивость и более высокий уровень неравновесия по сцеплению, чем в африканской выборке). Таким образом, изменение генетического состава распространяющихся популяций D. melanogaster происходило, вероятно, за счет как демографических, так и селективных процессов. В африканской выборке выявлены явные пики нуклеотидной изменчивости, центрированные на функционально важные сайты в промоторе (Rsal+IRsal-) и кодирующей области (F/S) Est-6. Это наблюдение говорит о том, что африканская популяция не находится в мутационно-дрейфовом равновесии, a Rsal+IRsal-, как и F/S полиморфизмы, поддерживаются балансирующим отбором уже в Африке.

Имеющиеся в нашем распоряжении популяционные данные предполагают две различные схемы миграции D. melanogaster в течение периода распространения этого вида с африканского континента: (1) Африка —» Европа —» Северная Америка и (2) Африка —> Южная Америка. Предположение о первом пути миграции сделано на основании распределения гаплотипов всего кластера (рис. 5), а также отдельно Est-6 и \)¡Est-6. Возможность второго пути миграции подтверждается тем фактом, что выборки из восточной Африки и Южной Америки имеют общую делецию (GAT) в промоторном регионе, которая отсутствует в других выборках (Balakirev and Ayala, 2003а). Эта делеция представлена в пяти из 12 африканских линий, но отсутствует в европейской и североамериканской выборках. Известно, что инделы представляют надежный и часто более информативный источник филогенетической информации, чем единичные нуклеотидные замены (см. например, Giribet and Wheeler, 1999), и это позволяет считать миграцию D. melanogaster из Африки в Южную Америку достаточно вероятной. Предположение о том, что южноамериканская популяция не происходит из Европы или Северной Америки, также подтверждается фактом отсутствия F Est-6 аллеля (и S Sod аллеля; Hudson cl al., 1994). Южноамериканская популяция D. melanogaster может представлять смесь мигрантов из Северной Америки и Африки. Наиболее распространенный гаплотип Rsal-IS мог быть получен из Северной Америки, тогда как гаплотип Rsal+/S кластеризуется с большей частью африканских линий (рис 5). Данное смешивание должно быть недавиим, так как ярко выраженная структура гаплотипов не эродирована рекомбинацией (уровень неравновесия по сцеплению наиболее высок в этой выборке).

4. Псевдогены, потогены и интергены

Псевдогены традиционно определяются как нефункциональные последовательности генома, однако обширная и быстро пополняющаяся литература не подтверждает принципиальное различие между генами и псевдогенами и отнесение псевдогенов к классу мусорной (junk) ДНК, которая, как предполагается, не функциональна и не подвергается воздействию естественного отбора Псевдогены часто характеризуются высокой степенью эволюционной консервации и транскрипционной активностью. Имеются прямые свидетельства о том, что псевдогены могут быть функциональны, участвуя в регуляции генной экспрессии и в генерировании генетического разнообразия. Характер нуклеотидной изменчивости псевдогенов ясно показывает, что не все мутации псевдоюнов являются селективно нейтральными и, таким образом, не все имеют равную вероятность фиксации в популяции Данные по \|iEst-б соответствуют общей картине, выявленной для многих других псевдогенов, часто обнаруживающих характеристики функциональных последовательностей. Наблюдаемые особенности псевдогенов, однако, противоречат традиционной точке зрения, определяющей их как нефункциональные и свободные от действия отбора последовательности геномной ДНК. Приведенные данные позволяют заключить, что псевдогены являются важной частью генома, которая обеспечивает набор последовательностей, участвующих в его функционировании и эволюции. Это, на наш взгляд, объясняет причины, по которым эукариотические организмы содержат множество псевдогенов избежавших значительной структурной дегенерации.

Множество псевдогенов идентифицировано на основании того, что они являются дуплицированными генами, имеющими преждевременные стоп-кодоны и другие повреждающие мутации, предотвращающие полную функцию исходных генов. В подавляющем большинстве случаев, однако, остается невыясненным, поскольку это не было исследовано, могут ли псевдогены, описанные только на основе характеристики последовательностей ДНК, играть роль в генерировании генетической изменчивости, а также иметь регуляторную или другие функции. Представляется весьма вероятным, что некоторая функциональность может быть обнаружена во всех (или почти всех) случаях, если эта возможность рассматривается. Псевдогены могут терять определенные специфические функции, но сохранять другие или приобретать новые, которые не могут быть выявлены за счет простого сопоставления нуклеотидных последовательностей. Таким образом, есть достаточные основания считать, что большинство псевдогенов сохраняют или приобретают некоторую функциональность, а значит не оправданно определять псевдогены как нефункциональные последовательности геномной ДНК, или как "гены, которые более не экспрессируются, но обладают сходством последовательности с активными генами" (Hart! and Clark, 1989, с 114)

Полагаем, что псевдогены могут быть определены как последовательности ДНК, происходящие за счет дупликации или ретропозиции от функциональных генов, которые часто находятся под воздействием естественного отбора и, следовательно, сохраняют большую часть исходной последовательности и структуры, поскольку они могут служить источником генетической изменчивости, а также приобретать регуляторную или другие функции.

Многое предстоит выяснить о популяционной динамике псевдогенов. Очевидна, однако, необоснованность утверждения, что "все мутации, возникающие в псевдогенах, являются селективно нейтральными и фиксируются в популяции с равной вероятностью" (Graur and Li, 2000, с. 124) После того как псевдоген появляется в популяции, возникая за счет дупликации или ретропозиции, он может сначала следовать нейтральной популяционной динамике, исчезая или сохраняясь в популяции. Однако псевдоген (или генная дупликация) может поддерживаться отбором и сразу после возникновения, например, если он (или его фланкирующие области) содержит регуляторные элементы, которые позитивно взаимодействуют с гомологичным родительским геном. Псевдоген может быстро фиксироваться, если он тесно сцеплен с геном, испытывающим действие направленного отбора, или медленно увеличивать частоту за счет нейтрального дрейфа. Однако если даже псевдоген вначале не подвергается действию отбора, любой новый мутант, обеспечивающий функциональную роль для псевдогена, может быть поддержан естественным отбором и, таким образом, иметь более высокую вероятность фиксации, чем его нефункциональные аллели. Брозиус и Гульд (Brosius and Gould, 1992) предложили использовать термин "патоген" для обозначения псевдогенов и других продуктов дупликаций генов, принимая во внимание их потенциап для формирования новых генов или функций. Термин "потоген" кажется более удачным также потому, что такие словосочетания, как "функциональный псевдоген" или "активный псевдоген", использующиеся в литературе, являются очевидными примерами терминологического оксюморона.

Псевдогены в совокупности с исходными, родительскими генами, вероятно, могут формировать неделимые взаимодействующие единицы (межгенные комплексы или "интергены"), в которых каждый отдельный компонент не способен успешно выполнять конечную функцию. Примером интергена является комплекс Est-б и \|iEst-б у D. melanogaster. В этом комплексе ген Est-б играет структурную роль (кодируя фермент EST-6), тогда как псевдоген \yEst-6, вероятно, увеличивает генетическую изменчивость в гене Est-б и участвует в регуляции его экспрессии. Другие примеры интергенов включают комплексы Ste и [Su(Ste)] у D. melanogaster (Hardy et al., 1981; Livak, 1984, 1990; Danilevskaya et al., 1991; Balakireva et al., 1992; Kalmykova et al., 1998); nNOS и pseudo-NOS у моллюска Lymnaea stagnalis (Korneev et al., 1999); makorinl и makorinl-pl у мыши (Hirotsune et al., 2003),

cytokeratin 17 ген и cytokeratin 17 псевдоген у человека (Troyanovsky and Leube, 1994) К интергенам, вероятно, можно отнести взаимодействующие комплексы генов и псевдогенов, участвующие в генерировании генетического разнообразия антигенов и антител Можно предположить, что число обнаруженных интергенов будет увеличиваться по мере развития функциональной геномики.

ВЫВОДЫ

1. Клонированы и секвенированы ¡З-эстеразные гены, Est-б и \JiEst-6, а также сцепленные с ними гомеобокс-содержащие гены, tin и bap, у семи видов Drosophila подгруппы melanogaster. Исследованы характеристики полиморфизма, дивергенции, рекомбинации, генной конверсии, неравновесия по сцеплению, энтропии и нуклеотидного состава последовательностей данных генов. Показано, что межлокусные ассоциации (как в пределах, так и между генами) играют существенную роль в распределении изменчивости генома D. melanogaster.

2. Полиморфизм и дивергенция нуклеотидных последовательностей Eit-б и \\iEst-6 исследованы в четырех выборках D. melanngaster (суммарно 78 изохромосомных линий) из природных популяций восточной Африки (Зимбабве), Европы (Испания), Северной Америки (США, Калифорния) и Южной Америки (Венесуэла) Обнаружена сложная структура гаплотипов для обоих генов. Дивергентные последовательности не полностью соответствует аллозимной изменчивости Est-б, что обусловлено присутствием генетически близких гаплотипов, определяющих разные аллозимы.

3. Деревья, построенные на базе последовательностей (3-эстеразных генов отражают в большей степени их [аплотипную структуру, а не филогенетические взаимоотношения исследованных популяций, что объясняет парадоксальные несоответствия биохимических свойств F и S аллозимов Est-б у D melanogaster, выявленные в разных лабораториях Для получения несмещенной оценки изменчивости и сходства геномов необходимо использовать мультигенный подход, позволяющий нивелировать отклонения, обусловленные спецификой эволюции отдельных генов

4. Демографическая история вида (миграция, флуктуации численности, смешивание неоднородных популяций) является основным фактором, формирующим паттерны изменчивости нуклеотидных последовательностей исследованных генов. Закономерности распределения изменчивости свидетельствуют в пользу того, что всесветное расселение D. melanogaster сопровождалось позитивными селективными процессами, существенно изменяющими генетический состав производных популяций

5. Выявлен существенный сигнал позитивного отбора для двух (Est-6 и bap) из четырех исследованных генов Показано, что дейс1вие позитивного отбора может быть направлено на множественные сайты в пределах гена

Характер распределения изменчивости формируется посредством направленного и балансирующего типов отбора, независимо влияющих на различные гены и функциональные области в их пределах. Балансирующий отбор формирует пики повышенного уровня изменчивости нуклеотидньгх последовательностей и неравновесия по сцеплению, центрированные на полиморфные, функционально значимые сайты, а направленный отбор создает существенный избыток сходных низкоизменчивых последовательностей. Устойчивость системы определяется балансирующим отбором, препятствующим полной фиксации гаплотипов, эволюционирующих под влиянием направленного отбора

6. Показано, что селективные процессы в промоторной и кодирующей области Est-б взаимосвязаны и соотношение F и S аллозимных вариантов определяется отбором не только на кодирующую, но и на регуляторную область гена. Широтные аллозимные клины Est-6 генерируются за счет взаимодействия селективных процессов в промоторе и кодирующей области.

7 Характеристики изменчивости нуклеотидных последовательностей Д-эстерспных генов, Est-б и \\rEst-6, а также сцепленных с ними гомеобокс-содержащих генов, tin и bap, существенно различаются, что обусловлено спецификой эволюции функционально связанных и тесно сцепленных генов.

7. 1 В пределах кодирующей области \|sEst-б обнаружено 17 преждевременных стоп-кодонов в двух из четырех исследованных популяциях (хотя ранее этот ген считался функциональным). Внутригенная конверсия существенно более выражена у ц/Est-б, чем у Est-6\ обратная тенденция обнаружена для рекомбинации (последнее различие наблюдается только в неафриканских выборках) Неравновесие по сцеплению более выражено в \yEst-6, чем в Est-б. Структура гаплотипов сложная и представлена дивергентными наборами сходных аллелей; дивергентные последовательности по двум генам, однако, не конгруэнтны Анализ энтропии выявил значительно более низкую структурную регулярность и более высокую структурную дивергенцию для \yEst-6 у всех исследованных видов. Структурная энтропия является нуклеотид-зависимой.

7 2. Уровень изменчивости гена tin существенно ниже, а отношение дивергенции к полиморфизму выше, чем гена bap. Различие между синонимичной и несинонимичной дивергенцией для гена tin в два раза меньше, чем для гена bap, что указывает на значительно большее давление негативного отбора на ген tin Более высокая иерархическая позиция гена tin ассоциируется с меньшим уровнем генетической изменчивости и негативным отбором, тогда как ген bap, являющийся функционально зависимым компонентом этого взаимодействующего комплекса, демонстрирует более высокий уровень изменчивости и признаки адаптивной эволюции

8. Выявлены противоречивые характеристики эволюции \|¡Ем-6. ожидаемые как для функциональных, так и нефункциональных генов Характеристики нуклеотидной изменчивости, рекомбинации и неравновесия по сцеплению указывают на то, что эволюция \\iEst-6 подвергается селективным ограничениям Скорость синонимичных замещений выше, чем скорость несинонимичных, а тесты на нейтральность статистически существенны. С другой стороны, \yEst-6 демонстрирует ряд признаков, характерных для псевдогенов (пункт 7. ]). Аналогичная закономерность обнаружена для многих псевдогенов у других организмов.

9. На основании анализа литературы показано, что псевдогены часто характеризуются высокой степенью консервации структуры, транскрипционной активностью, а также играют существенную роль в таких процессах, как регуляция экспрессии генов и генерирование генетического разнообразия Следовательно, псевдогены являются важной составной частью геномов, представляющей набор последовательностей, доступных для функциональной эволюции, и подвергаемой ненейтральным эволюционным изменениям Предлагается рассматривать псевдогены как потогеяы, то есть последовательности ДНК, имеющие «отиенциальную возможность для формирования новых генов или функций

10 Выдвигается гипотеза, в соответствии с которой псевдогены, возникающие посредством дупликации или ретропозиции способны взаимодействовать с предковыми или окружающими генами, формируя функциональный комплекс ("интерген"), выполняющий новые функции, являющиеся производными функций предкового гена. Комплекс Ем-6/ц)Ем-6 у И. 1пе1апо$с1х1ег и близких видов является примером интергена. В этом комплексе Еи-6 выполняет структурную роль (кодируя фермент Р8Т-6), тогда как \\tEst-6 может увеличивать генетическую изменчивость в гене Ет-6, а также участвовать в регуляции его экспрессии.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Балакирев Е С. Простой метод нахождения порядка взаимною

расположения фрагментов при построении парных рестрикционных карт// Генетика. 1995. Т. 31. № 10. С. 1445-1448

2. Балакирев Е. С., Айала Ф. Дж. Нуклеотидная изменчивость fi-эстератых

генов в природных популяциях Drosophila melanogaster // Успехи современной биологии. 2004а Т. 124. № 4. С. 385-396.

3. Балакирев Е.С., Айала Ф. Дж. Псевдогены: консервация структуры,

экспрессия и функции // Журнал общей биологии. 20046. Т. 65. № 4. С. 306-321.

4. Balakirev Е. S., Ayala F. J. Is esterase-P encoded by a cryptic pseudogene in

Drosophila melanogaster^ // Genetics. 1996. V. 144. №4. P. 1511-1518.

5. Balakirev E. S., Balakirev E. I., Rodriguez-Trelles F., Ayala F. J. Molecular

evolution of two linked genes, Est-6 and Sod, in Drosophila melanogaster II Genetics. 1999. V. 153. № 3. P. 13.57-1369.

6. Balakirev E. S., Balakirev E. I., Ayala F. J. Molecular evolution of the Est-6

gene in Drosophila melanogaster: contrasting patterns of DNA variability in adjacent functional regions И Gene. 2002. V. 288. № 1-2. P. 167-177.

7. Ayala F. J., Balakirev E. S., Saez A. G. Genetic polymorphism at two linked

loci, Sod and Est-6, in Drosophila melanogaster II Gene. 2002. V. 300. № 12. P. 19-29.

8. Balakirev E. S., Chechetkin V. R., Lobzin V. V., Ayala F. J. DNA

polymorphism in the ¡i-esterase gene cluster of Drosophila melanogaster II Genetics. 2003 V.164. № 2. P 533-544.

9. Balakirev E. S., Ayala F J. Nucleotide variation of the Est-6 gene region in

natural populations of Drosophila melanogaster II Genetics. 2003a. V. 165. №4. P. 1901-1914.

10. Balakirev E S , Ayala F. J Molecular population genetics of the ¡3-esterase

gene cluster of Drosophila melanogaster И J. Genet. 2003b V. 82. № 3. 115-131.

11. Balakirev E. S., Ayala F. J. Pseudogenes- are they "junk" or functional DNA?

II Annu. Rev. Genet. 2003c. V. 37. P. 123-151.

12. Balakirev E S , Ayala F. J. Pseudogenes are not junk DNA // In: Evolutionary

Theory and Processes Modern Horizons (Wasser, S. P., editor). Kluwer Academic Publishers. The Netherlands. 2003d. P 177-193.

13. Balakirev E S , Ayala F J. The fi-esterase gene cluster of Drosophila

melanogaster Is \yEst-6 a pseudogene, a functional gene, or both? // Genetica. 2004a. V. 121. №2. P. 165-179.

14. Balakirev E. S., Ayala F J. Nucleotide variation in the tinman and bagpipe

homeobox genes of Drosophila melanogaster II Genetics. 2004b. V. 166 № 4. P. 1845-1856

Евгений Станиславович БАЛАКИРЕВ ЭВОЛЮЦИОННАЯ Г ЕНЕТИКА /V3CTEPA3 В ПОДГРУППЕ DROSOPIULA MELANOGASTER

АВТОРЕФЕРАТ

Изд. лиц ИД №05497 or 01.08.2001 1. Подписано к печаш 18 01.2005 Формат 60x90/16 Уел печ л 3,2 Уч.-изд л 3,2 Тираж 100 экз Заказ 37

Отпечатано в типографии ФГУП Издательаво «Дальнаука» ДВО РАН 690041,1 Владивосток, ул Радио, 7

i i

»-3 2 50

РНБ Русский фонд

2006-4 14148