Бесплатный автореферат и диссертация по биологии на тему
Функциональное значение базовых свойств структуры генома эукариот
ВАК РФ 03.01.03, Молекулярная биология

Автореферат диссертации по теме "Функциональное значение базовых свойств структуры генома эукариот"

На правах рукописи

Виноградов Александр Евгеньевич

Функциональное значение базовых свойств структуры генома

эукариот

03.01.03 - молекулярная биология

Автореферат диссертации на соискание ученой степени доктора биологических наук

Санкт-Петербург 2011

1 Э МАЙ 2011

4847133

Работа выполнена в Учреждении Российской академии наук Институт цитологии РАН (Санкт-Петербург).

Официальные оппоненты: доктор биологических наук, профессор,

академик РАН

Колчанов Николай Александрович Институт цитологии и генетики СО РАН, Новосибирск

доктор биологических наук, профессор

Подгорная Ольга Игоревна

Институт цитологии РАН, Санкт-Петербург

доктор физико-математических наук Тимковский Андрей Леонидович Петербургский институт ядерной физики им. Б.П.Константинова РАН

Ведущая организация: Учреждение Российской академии наук Институт молекулярной биологии им. В.А.Энгельгардта РАН, Москва

Защита состоится « 24 » июня 2011 г. в 13 часов на заседании диссертационного совета Д.002.230.01 при Институте цитологии РАН по адресу: 194964 Санкт-Петербург, Тихорецкий пр., 4

Факс (812) 297-03-41

Сайт института: http://www.cytspb.rssi.ru

Адрес электронной почты института: cellbio@mail.cytspb.rssi.ru

С диссертацией можно ознакомиться в библиотеке Института цитологии РАН

Автореферат разослан « и _» апреля 2011 г.

Ученый секретарь Диссертационного совета, кандидат биологических наук Е.В.Каминская

Общая характеристика работы

Актуальность проблемы. За короткое время цитология прошла путь от морфологических и физиологических исследований, проводимых исключительно на клеточном уровне, до клеточной биологии, имеющей дело с данными молекулярного уровня. При этом в какой-то степени потерялась целостность клетки, которая разбилась на множество частных молекулярных явлений, детально изучаемых по отдельности. В настоящее время, после появления различных "омик" (геномики, транскриптомики, протеомики, интерактомики и др.), начался обратный, интеграционный процесс. Возникла молекулярная биология систем, призванная связать "омиксные" данные вместе и представить, как функционирует клетка в целом. В последнее время возрастает также роль эволюционной биологии, которая даже становится базовой наукой для медицины (Nesse et al. 2010).

Одно из главных противоречий, которое возникает при сопоставлении молекулярного уровня с более высокими уровнями биологической организации, это явно адаптивный характер эволюции организмов и доминирование нейтралистских представлений в области молекулярной эволюции. Это является важным противоречием прежде всего потому, что естественный отбор предполагает функциональность, в то время как нейтральная эволюция в основном производит шум, затрудняющий выделение функциональных компонент. Нейтралистские интерпретаторы приходят к выводу, что даже увеличение сложности организмов и геномов (т.н. прогрессивная эволюция) происходит в результате ослабления естественного отбора и является просто следствием мутационного давления (напр., Lynch, Conery 2003; Koonin 2004). Другими словами, информация, необходимая для повышения уровня биологической организации, должна создаваться из шума без участия естественного отбора.

В нашей работе сделан поиск функциональных объяснений базовых (системных, "омиксных") свойств структуры генома. Это позволит связать данные молекулярного уровня с результатами, полученными при исследовании более высоких уровней биологической организации. Актуальным является и то, что в нашей работе значительное внимание уделяется некодирующей ДНК, которая составляет большую часть генома эукариот и функция которой во многом остается загадочной.

Цель н задачи исследования. Цель работы: на основе полученных новых данных найти возможные функциональные объяснения базовым (системным) свойствам структуры генома эукариот (с акцентом на геном человека), которые интерпретировались в литературе как результат нейтральной эволюции. Задачи:

1) Изучить вариабельность размера генома и доли ГЦ-пар у наземных позвоночных, найти возможную связь с фенотипическими параметрами, которая предполагала бы адапт ивное объяснение этой вариабельности.

2) Изучить особенности внутригеномной вариабельности количества некодирующей ДНК и доли ГЦ-пар, выяснить возможное функциональное значение этик параметров (на примере генома человека).

3) Выяснить связь размера генов (как интронной, так и кодирующей их части) и количества функциональных доменов в кодируемых ими белках с особенностями экспрессии генов (на примере генома человека).

4) Найти возможные признаки прогрессивной эволюции при сравнении транскриптомов человека и мыши.

5) Выяснить роль различных факторов, влияющих на скорость эволюции белок-кодирующей ДНК млекопитающих.

Научная новизна. Впервые показана взаимосвязь между размером генома и интенсивностью метаболизма (независимой от размера тела). На основании полученных данных предложено новое объяснение наличия большого количества избыточной (redundant) некодирующей ДНК в геномах эукариот (гипотеза "буферной ДНК").

На основе полученных данных предложено новое объяснение появления изохорной структуры (чередующихся сегментов ГЦ- и АТ-богатой ДНК) геномов теплокровных. Предполагается, что изохорная структура представляет собой один из механизмов регуляции экспрессии генов, опосредуемой конденсацией хроматина. Предложена концепция "геномного дизайна" для объяснения вариабельности размера элементов генома (генов, интронов, межгенных промежутков).

Обнаружено явление усиления клеточной дифференцировки (увеличения экспрессии тканеспецифичных генов) при прогрессивной эволюции. Показано также, что системные факторы доминируют в эволюции белков млекопитающих.

Для решения поставленных задач были разработаны некоторые новые методы и подходы. В частности, это метод проточной цитометрии для одновременного определения размера генома и доли ГЦ-пар. С помощью этого метода впервые исследовано взаимоотношение между размером генома и долей ГЦ-пар у эукариот (позвоночных и моллюсков). На основе проточной цитометрии был также разработан метод измерения степени конденсации хроматина в ядре клетки.

Теоретическая и практическая ценность работы. Полученные в работе данные важны для понимания вариабельности размера генома эукариот и роли большого количества некодирующей ДНК в нем. Они также позволяют объяснить функциональное значение изохорной структуры генома теплокровных (внутригеномной вариабельности доли ГЦ-пар). Предложенная концепция "геномного дизайна" позволяет понять причины вариабельности размера и доли ГЦ-пар внутригеномных объектов (кодирующей и интронной ДНК, межгенных промежутков). Предложено также объяснение возникновения дихотомии общеклеточных и тканеспецифичных элементов генома (генов и модулей клеточных систем, состоящих из групп генов, связанных общей функцией).

Полученные данные помогают лучше понять процесс эволюции. Так, например, обнаруженная более высокая степень специализации клеток человека по сравнению с клетками мыши проливает свет па молекулярные и клеточные механизмы прогрессивной эволюции. Выявление того факта, что системные факторы доминируют в эволюции белков млекопитающих, позволяет лучше понять процесс молекулярной эволюции и его связь с эволюцией клеточных систем.

Результаты измерения размеров генома 181 вида животных включены в Animal Genome Size Database (http://genomesize.com), со ссылками на наши статьи. Полученные в работе данные используются в Wikipedia (http://de.wikipedia.org/wiki/Genom; http://en.wikipedia.org/wiki/GC-content) и New World Encyclopedia (http://www.newworldencyclopedia.org/entry/Cytosine). Некоторые материалы работы используются в учебном процессе в СПбГУ (на кафедре цитологии и гистологии).

Положения, выносимые lia защиту

1) Вариабельность размера генома эукариот и содержания ГЦ-пар в нем имеет функциональное (адаптивное) значение. Увеличение размера генома связано со снижением интенсивности метаболизма (независимого от размера тела), что дает преимущество в экологических нишах с низкими энергетическими ресурсами. Повышение доли ГЦ-пар связано с деконденсацией хроматина и увеличением размера ядра. Птицы и рептилии, имеющие большую долю ГЦ-пар в геноме по сравнению с амфибиями и млекопитающими, имеют отдельную линию регрессии интенсивности метаболизма на размер генома.

2) Возникновение ГЦ-богатых изохор в геноме теплокровных связано с активацией транскрипции в этих участках генома в результате деконденсации хроматина, которую вызывает повышение содержания ГЦ-пар. Таким образом, внутригеномная вариабельность доли ГЦ-пар связана с регуляцией экспрессии генов, опосредуемой конденсацией хроматина.

3) Гены человека с промежуточной межтканевой широтой экспрессии (т.е. не тканеспецифичные и не общеклеточные) имеют наибольший размер (как интронной, так и кодирующей части), а кодируемые ими белки содержат наибольшее число функциональных доменов. Эти гены имеют наибольшую функциональную сложность на всех исследованных уровнях: в сетях белковых взаимодействий, биохимических путях, модулях, описываемых категориями Gene Ontology, группах генов, регулируемых определенными транскрипционными факторами, группах генов, кодирующих определенные функциональные белковые домены, группах "слов" аминокислотных последовательностей кодируемых белков и нуклеотидных последовательностей нитронов и промоторных участков. На уровне модулей клеточных систем (т.е. групп генов, связанных общей функцией) дихотомия общеклеточных и тканеспецифичных объектов выражена сильнее, чем на уровне отдельных генов. Предполагается, что именно сложность регуляции генов и функциональных модулей с промежуточной широтой экспрессии и

привела к возникновению дихотомии общеклеточных и тканеспецифичных генов и модулей.

4) Для одного и того же набора ортологичных генов и гомологичных тканей у человека больше доля тканеспецифичных генов и более высокое отношение экспрессии тканеспецифичных генов к экспрессии общеклеточных генов, чем у мыши. Гены, которые изменили межтканевую широту экспрессии, показывают также большую эволюционную дивергенцию нуклеотидной последовательности промоторных участков и аминокислотной последовательности кодируемых белков. Эти молекулярные данные показывают, что повышение уровня биологической организации связано с более высокой степенью специализации (дифференцировки) клеток.

5) Скорость эволюции ко-экспрессированных генов, белков-интерактантов и белков, принадлежащих к одному и тому же биохимическому пути, является наиболее важным фактором, определяющим скорость эволюции белков млекопитающих. Другим важным фактором является сложность регуляции кодирующего белок гена. Белки, кодируемые более сложно-регулируемыми генами, эволюционируют медленней. Эти данные показывают, что системные факторы доминируют в эволюции белок-кодирующей ДНК млекопитающих.

Апробация работы. Материалы диссертации были доложены на отчетных конференциях программы Президиума РАН "Молекулярная и клеточная биология" (Москва 2005, 2007) и заседании Ученого совета Института цитологии РАН (2005). Работа была поддержана 5 грантами РФФИ (1996-2010, руководитель) и грантом программы Президиума РАН "Молекулярная и клеточная биология" (2004-2008, руководитель).

Суммарный журнальный импакт-фактор опубликованных по материалам диссертации статей - более 160 (не считая заметки в Science), их суммарное цитирование в ISI Web of Knowledge Citation Index - более 900, в Google Scholar - более 1100. (См. также http://expeгtcoфs.ru/science/whoiswho/ci86).

Многие результаты диссертации уже подтверждены независимыми исследованиями (ссылки приведены в соответствующих местах основного текста автореферата).

Публикации. По материалам диссертации опубликовано 33 статьи в рецензируемых журналах (31 работа выполнена без соавторов, а остальные 2-е одним соавтором). Из них, 32 статьи опубликованы в международных журналах, входящих в ISI Web of Knowledge Citation Index, и 1 обзор - в российском журнале, входящем в список ВАК. Средний журнальный импакт-фактор всех статей диссертации - 5.2 (не считая Science). Среди международных - такие журналы как Genome Reseach (1 статья), Trends in Genetics (4 статьи), Current Opinion in Genetics & Development (обзор по приглашению редакции), Molecular Biology and Evolution (1 статья), Nucleic Acids Reseach (5 статей), Evolution (2 статьи), Chromosoma (1 статья), P Roy Soc B-Biol Sci (3 статьи), J Mol Evol (2 статьи), Cytometry (4 статьи). Все работы выполнены в Институте цитологии РАН. Ни одна из статей не входила в кандидатскую диссертацию.

Структура диссертации. Диссертация состоит из Введения, Обзора литературы, Материалов и методов исследования, Результатов и обсуждения (включающих четыре главы), Выводов и Списка цитируемой литературы.

Материалы и методы

Данная работа начиналась как измерение размера и ГЦ-состава генома (а также степени конденсации хроматина) методами проточной цитометрии, а затем была продолжена с помощью методов молекулярной биоинформатики (в "омиксном" масштабе данных, т.е. фактически совмещающем молекулярный и клеточный уровень).

Проточная цитомстрия. Разработанный нами вариант метода проточной цитометрии для одновременного определения размера генома и доли ГЦ-пар в нем включает в себя окрашивание ядер клеток двумя базоспецифичными флуорохромами (Vinogradov 1994, 1998а, 2000, 2005а). Использовались ГЦ-специфичный оливомицин и АТ-специфичный Хехст 33258. Для измерения брали клетки крови позвоночных (кроме млекопитающих), клетки селезенки и тимуса млекопитающих и клетки печени моллюсков. В качестве репера использовали клетки крови лягушки Rarta temporaria. Для определения размера генома и доли ГЦ-пар по результатам измерения флуоресценции двух базоспецифичных флуорохромов использовали уравнение регрессии отношения доли АТ-пар к доле ГЦ-пар на отношение интенсивностей флуоресценции Хехст/оливомицин. Доля ГЦ-пар для калибровочного уравнения регрессии была взята из литературы (для совпадающих видов животных). На основании этого уравнения (полученного аппроксимацией с помощью метода наименьших квадратов) определяли долю ГЦ-пар по отношению интенсивностей флуоресценции Хехст/оливомицип. Затем определяли размер генома тестируемого вида по отношению к размеру генома репера.

Разработанный нами вариант метода проточной цитометрии для определения степени мембрано-зависимой конденсации хроматина включает в себя фиксацию формальдегидом и окрашивание ДНК-специфичным флуорохромом (Vinogradov 1995b, 2005а). Эффект основан на том, что формальдегид фиксирует состояние хроматина. В качестве репера использовали пробы тех же клеток, но предобработанных низкой концентрацией неионного детергента (т.е. с поврежденной мембраной). Эксперименты проводили с тимоцитами млекопитающих и клетками крови других позвоночных. Отношение интенсивности флуоресценции клеток, предобработанных детергентом, к флуоресценции непредобработанных клеток использовалось как индикатор степени мембрано-зависимой конденсации хроматина.

Бионформатика. В ранних работах (Vinogradov 2001с,d) геномные последовательности были извлечены из базы GenBank (Sayers et al. 2010). В более поздних работах использовалась база RefSeq (Sayers et al. 2010). Границы генов, нитронов и экзонов были взяты из аннотаций. Транспозоны в интронах и межгенных промежутках были определены с помощью программы

RepeatMasker. При этом использовались библиотеки траспозонных последовательностей, взятые из базы Repbase (Jurka et al. 2005). Уровень дивергенции (т.е. процент нуклеотидных замен) по отношению к консенсусной последовательности каждого семейства (ретро)транспозонов также был определен с помощью программы RepeatMasker. Гомология (ортология) между генами человека и мыши была установлена с помощью базы HomoloGene (Sayers et al. 2010). В поздних работах ортология определялась с помощью тотального сравнения всех известных белок-кодирующих генов человека со всеми известными генами мыши (на уровне аминокислотной последовательности самого длинного белка, кодируемого данным геном) с помощью алгоритма Смита-Ватермана, имплементированного в пакете Fasta (программа ssearch). Отбирали пары генов с наиболее высокой статистической значимостью взаимного соответствия (reciprocal best hits).

Гибкость (bendability) и кривизна (curvature) молекулы ДНК были определены на основании таблиц этих параметров для тринуклеотидов биспирали ДНК (Gabrielian, Pongor 1996; Munteanu et al. 1998). Это консенсусные значения данных параметров, полученные на основании результатов экспериментов с перевариванием ДНКазой I и позиционированием последовательности ДНК в нуклеосомах (т.е. взаимодействием ДНК с гистонами). Гибкость была подсчитана для движущейся рамки размером 3 п.и. (с шагом в 1 п.н.) и усреднена для каждой изучаемой последовательности ДНК (экзона, интрона, межгенного промежутка, транспозона). Кривизна - это относительно макроскопический изгиб ДНК, который возникает в результате суммации локальных изгибов с учетом фазы биспирали ДНК. Ее обычно подсчитывают для сегментов ДНК различной длины, но кратной числу оборотов биспирали ДНК (Gabrielian, Pongor 1996). В нашей работе были исследованы сегменты ДНК различной длины (1-3 оборота биспирали), результаты для них существенно не различались. Поэтому основные данные представлены с использованием кратчайшего сегмента ДНК (1 оборот, 10.5 п.н.) для того, чтобы минимизировать возможные краевые эффекты для коротких последовательностей ДНК. Таким образом, кривизна была определена для движущейся рамки размером 10.5 п.н. (с шагом в 1 п.н.) и усреднена для каждой изучаемой последовательности.

Термостабильность была определена на основании консенсусной таблицы значений свободной энергии плавления биспирали ДНК (delta G) для динуклеотидов, составленной по результатам многочисленных физических экспериментов (SantaLucia 1998). Способность биспирали ДНК к B-Z переходу определялась с использованием таблицы свободной энергии B-Z перехода для динуклеотидов (Lafontaine, Lavery 2000). Термостабильность и способность к В-Z переходу были подсчитаны для движущейся рамки размером 2 п.н. (с шагом в 1 п.н.) и усреднены для каждой последовательности ДНК.

Для каждой изучаемой последовательности ДНК было также сделано по 10 рандомизаций последовательности оснований, и для них были посчитаны все изучаемые параметры (гибкость, кривизна, термостабильность и способность к B-Z переходу). Результаты подсчетов для 10 рандомизаций были усреднены. Для

каждой кодирующей последовательности, для всех синонимных позиций, которые могли быть пермутированы с сохранением того же процента ГЦ-пар (т.е. Г<->Ц и А<->Т замены), были сделаны 10 случайных пермутаций с сохранением того же среднего содержания пуринов для всего набора синонимных позиций. Изучаемые параметры, посчитанные для 10 пермутированных последовательностей, были усреднены. Относительные значения каждого изучаемого параметра физических свойств ДНК были определены для каждой последовательности как разница между значением данного параметра для исходной (геномной) последовательности и средним значением параметра для 10 ее рандомизированных или пермутированных последовательностей.

Потенциал образования нуклеосом был определен с помощью метода, разработанного в лаборатории акад. Н.А.Колчанова (Levitsky et al. 2001а, 2001b; Levitsky 2004). Потенциал образования нуклеосом был усреднен для каждой изучаемой последовательности ДНК.

Данные по уровню экспрессии генов в различных тканях человека и мыши были взяты из базы SymAtlas/Gene Expression Atlas (Su et al. 2004) и базы по экзонным микроэрреям (Xing et al. 2007). В некоторых работах использовались также библиотеки ESTs (expressed sequence tags) из базы Unigene (Sayers et al. 2010). Данные о принадлежности генов к тому или иному биохимическому пути были взяты из баз Kegg и Reactome (Croft et al. 2011; Kanehisa et al. 2008), a данные о категориях Gene Ontology - из одноименной базы (Gene Ontology Consortium 2010). Для получения данных о транскрипционных факторах и регуляторых микро-РНК была использована база Molecular Signatures Database (Subramanian et al. 2007). Данные о белковых взаимодействия были взяты из базы STRING (Jensen et al. 2009). Для получения данных о точных сайтах начала транскрипции была использована база DBTSS (Wakaguri et al. 2008). Данные о доменной архитектуре белков были взяты из баз Pfam и InterPro (Hunter et al. 2009).

Анализ количества и степени сходства эволюционно-консервативных участков в ортологичных интронах человека и мыши был сделан с использованием высокочувствительного алгоритма Хуанг-Миллера для локального выравнивания (alignment) нуклеотидных последовательностей, имплементированного в пакете Fasta (программа lalign). Перед анализом из интронов с помощью программ RepeatMasker и DateRepeats были убраны мобильные элементы, специфичные для человека или мыши. После получения всех возможных локальных выравниваний для каждой пары ортологичных интронов мы отбирали наиболее длинную цепь непересекающихся локальных выравниваний. Для контроля делались аналогичные выравнивания рандомизированных интронных последовательностей (в них суммарная доля выровненных участков не превышала 0.5%).

Эволюционные дистанции белок-кодирующей ДНК при сравнении человека и мыши были определены с помощью глобального выравнивания ортологичных аминокислотных последовательностей с помощью программы ClustalW. (Ортологичные пары белков устанавливали с помощью программы

ssearch из пакета Fasta, как сказано выше.) В дополнительных анализах эти дистанции были определены по отношению скоростей несинонимных замен к синонимным (dN/dS) с помощью программы PAML. Выравнивание нуклеотидных последовательностей, необходимое для этой программы, делалось с помощью программы RevTrans с использованием белковых выравниваний, сделанных программой ClustalW, в качестве направляющих. Определение этапа эволюционного происхождения генов было основано на сравнении групп ортологичных генов (COG/KOG/ NOG), представленных в базе STRING (Jensen et al. 2009) и филогенетического дерева из базы NCBI (Sayers et al. 2010). В соответствии с этим деревом было взято 12 эволюционных стадий (cellular organisms, Eukaryota, Fungi/Metazoa group, Bilateria, Coelomata, Chordata, Vertebrata, Tetrapoda, Amniota, Mammalia, Eutheria, Primates или Rodentia). Ген считался появившимся на той или иной стадии, если он имел ортологи в филогенетических линиях, ответвившихся от изучаемой линии на данной стадии, и не имел в ответвившихся раньше.

Обогащенность групп генов категориями Gene Ontology (отдельно для биологических процессов, молекулярных функций и клеточных компонент) и биохимическими путями устанавливали с помощью гипергеометрического распределения плотности вероятности на основании частот генов, принадлежащих к этим категориям и путям, в тестируемой группе генов и в полном наборе данных. В случае категорий Gene Ontology рассматривали все вложенные субкатегории различных иерархических уровней. С этой целью мы собирали для каждой категории все ее субкатегории (используя направленный ациклический граф, описывающий структуру данной базы). Ген относили к какой-либо категории в том случае, если он входил в любую из субкатегорий данной категории или непосредственно в данную категорию. После определения уровней статистической значимости (р) в них вводили поправку на множественность сравнений по методу Storey, Tibshirani (2003).

Результаты исследований и их обсуждение

Размер генома, доля ГЦ-пар и конденсация хроматина

Роль некодирующей ДНК, которая составляет более 98% генома человека (Venter et al. 2001), остается неясной. Нейтралистское объяснение предполагает, что мутационное давление приводит к накоплению избыточной (redundant) некодирующей ДНК в геномах эукариот, просто "терпимому" (permissive) естественным отбором (обзор: Vinogradov 2004с). Поскольку размер генома многоклеточных определяется в основном количеством некодирующей ДНК, эта часть работы была посвящена изучению вариабельности размера генома и поиску ее фенотипических коррелят.

Был разработан специальный метод проточной цитометрии для одновременного определения размера генома и доли ГЦ-пар в нем (Vinogradov 1994, 1998а, 2005). С помощью этого метода исследовано взаимоотношение между размером генома и долей ГЦ-пар у позвоночных животных (исследован

161 вид, принадлежащий к 23 отрядам, входящих в 6 классов). Обнаружено, что в целом у позвоночных наблюдается положительная корреляция между размером генома и долей ГЦ-пар. При этом, птицы и рептилии имеют относительно более высокую долю ГЦ-пар (для своих размеров генома) по сравнению с млекопитающими и амфибиями (рис. 1).

Обнаружена отрицательная

зависимость между размером генома и интенсивностью метаболизма (независимой от размера тела, т.е. после исключения эффекта размера тела) у млекопитающих и птиц (Vinogradov 1995а, 1997). В дальнейшем наши результаты были подтверждены и расширены другими авторами (Gregory 2002; Kozlowski et al. 2003; Redi et al. 2007; Gregory et al. 2009).

В результате была сформулирована концепция о независимом влиянии размера тела и размера генома на интенсивность метаболизма животных. Обнаруженный эффект указывает на возможное адаптивное (экофизиологическое) значение некодирующей ДНК. Она может

____________служить для снижения

метаболизма,

1 ю

Размер генома (2с, пкг) Рис 1. Размер генома и доля ГЦ-пар у позвоночных.

уровня позволяет

что животным

-0.9 -

1—!—т—1—I—i—^-1—' 1 I 1—1 ' 1 I 3.0 3.5 4.0 4.5 5.0 Размер генома (Ig, Mb) Рис 2. Зависимость между интенсивностью метаболизма (оцениваемой по индексу сердца) и размером генома у наземных позвоночных. Видно, что рептилии (зеленые квадратики) лежат на продолжении линии птиц (красные кружки), а амфибии (коричневые квадратики) - на продолжении линии млекопитающих (синие кружки)._

занимать экологические ниши с более низкими энергетическими ресурсами. Для этой новой области исследований нами был предложен термин "экофизиологическая цитогенетика", который (с подтверждением и дальнейшим развитием наших результатов) был принят и другими авторами

(Когтей й а1. 2003).

В дальнейшем нами была показана универсальность связи между размером генома и интенсивностью метабо-

лизма у всех наземных позвоночных (рис. 2) (Vinogradov, Anatskaya 2006). Зависимость между размером генома и интенсивностью метаболизма наблюдалась прежде только у гомойотермных. При этом были обнаружены две линии регрессии, одна для млекопитающих, другая для птиц (Vinogradov 1995а). У пойкилотермных эту связь обнаружить не удавалось, по-видимому, вследствие сильной зависимости интенсивности метаболизма от температуры и адаптированности разных видов к разным температурам (Vinogradov 1999а). Это ставило под сомнение возможность перенесения закономерности, наблюдаемой у гомойотермных, на пойкилотермных животных. В данной работе мы использовали индекс (относительный вес) сердца в качестве универсального индикатора интенсивности метаболизма для гомойотермных и пойкилотермных животных и обнаружили, что отрицательная зависимость между размером генома и интенсивностью метаболизма имеется у всех наземных позвоночных (рис. 2). (Относительный вес сердца - это признанный показатель интенсивности метаблизма; напр., Dawson et al. 2003; Bishop 2005.)

Было установлено также, что регрессия интенсивности метаболизма на размер генома у наземных позвоночных распадается на две линии: в первой (имеющей более крутой наклон) - точки для рептилий ложатся на продолжение

линии для птиц, во второй -точки для амфибий ложатся на продолжение линии для млекопитающих (рис. 2). При этом нужно отметить, что птицы и рептилии имеют относительно более высокую долю ГЦ-пар в геноме, чем млекопитающие и амфибии (рис. 1).

Мы обнаружили, что в секвенированных геномах позвоночных наблюдается отрицательная корреляция между долей ГЦ-пар и потенциалом формирования нуклеосом (рис. 3). Кроме того, было установлено, что при равном размере генома размер ядра эритроцитов больше у видов с более ГЦ-богатым геномом (Vinogradov, Anatskaya 2006). Мы предполагаем, что более рыхлая конденсация хроматина и относительно больший (для своего размера генома) размер ядер у птиц-рептилий по сравнению с млекопитающими-амфибиями и объясняют появление двух разных линий регрессии между размером генома и интенсивностью метаболизма (рис. 2).

с Содержание ГЦ-пар (%)

Рис. 3. Зависимость потенциала формирования нуклеосом от доли ГЦ-пар в геномах позвоночных, (зеленый - Homo sapiens; желтый - Mus musculus, синий - Gallus gallus, красный - Xenopus tropicalis, коричневый - Danio rerio, фиолетовый - Tetraodon nigrovidis). Для каждого вида, потенциал формиро-вания нуклеосом и доля ГЦ-пар были определены для 10000 сегментов генома длиной 10000 п.н. каждый, извлеченных из генома случайным образом._

Таким образом, эта работа позволяет объединить данные по размеру и ГЦ-составу генома, размеру ядер и интенсивности метаболизма в единую картину. Нужно также подчеркнуть, что млекопитающие, несмотря на более высокий уровень организации, сохранили связь между размером генома и интенсивностью метаболизма, сходную с амфибиями. В то же время, в филогенетической линии рептилии-птицы эта зависимость стала более сильной (линия регрессии имеет больший угол наклона). Следует отметить, что согласно палеонтологическим данным, млекопитающие произошли от самого основания филогенетической линии рептилий и поэтому не являются родственниками современных рептилий (Rubidge, Sidor 2001; Ruta et al. 2003). Птицы ближе к современным рептилиям, чем млекопитающие. Таким образом, наши результаты не противоречат филогенетическим представлениям, а скорее подтверждают их. Эти результаты уже используются и в палеонтологических работах (Organ et al. 2009).

Определен размер генома и доля ГЦ-пар у некоторых водных и наземных

моллюсков (Vinogradov 1998b, 2000). При филогенетически корректном сравнении внутри отряда легочных моллюсков Pulmonata (имеющих как водные, так и наземные виды) было обнаружено, что у наземных видов геном больше, чем у водных (рис. 4). Этот факт может служить примером эволюционного параллелизма с филогенетической линией позвоночных, у которых при выходе на сушу (амфибии и двоякодышащие рыбы) также увеличивается размер генома. Доля ГЦ-пар в геноме тоже увеличивается в обоих случаях. Полученные данные противоречат предположению о случайном характере увеличения размера генома при эволюционном выходе животных на сушу и указывают на экофизиологическую роль некодирующей ДНК.

С помощью разработанного нами варианта метода проточной цитометрии был обнаружен эффект мембрано-зависимой конденсации хроматина (Vinogradov 1995b). В частности, было показано что в течение нескольких секунд после поврежедения клеточной мембраны с помощью неионного детергента в физиологическом растворе происходит быстрая деконденсация хроматина. Дополнительно это явление было подтверждено измерением доступности ДНК к действию ДНКазы I. Экспериментально показано, что примерно половина этой мембрано-зависимой конденсации хроматина может быть объяснена более низкими внутриклеточным рН по сравнению с

2 3 4 5 6 7 8 Размер генома (2с, пкг) Рис 4. Размер генома и доля ГЦ-пар у легочных моллюсков (Ри1топа1а). Синие квадратики - водные, красные кружки - наземные._

внеклеточным. Механизм остальной части конденсации остается пока неясным. Было установлено, что влияние дивалентных катионов и низкомолекулярных анионов может быть исключено. Вскоре этот эффект был подтвержден другими авторами, применившими несколько иной вариант метода (Loborg, Rundquist 1997).

Была предложена концепция "буферной ДНК", объясняющая присутствие избыточной (redundant) некодирующей ДНК в геноме эукариот (Vinogradov 1998с). Предполагается, что некодирующая ДНК в конденсированном виде в составе гетерохроматина может предохранять структуру хроматина от изменений, вызванных колебаниями физических и химических параметров внутриклеточной среды, а в деконденсированном виде - ослаблять влияние таких колебаний на специфическое связывание ДНК-тропных белков. Экспериментальным основанием для этой гипотезы послужили два типа данных. Во-первых, известно, что у прокариот неспецифическое связывание РНК-полимеразы ослабляет действие повышенной концентрации солей и делает возможной транскрипцию даже тогда, когда внутриклеточная концентрация солей в несколько раз превышает концентрацию, при которой транскрипция прекращается in vitro (Richey et al. 1987). Во-вторых, это наши данные об изменении конденсации хроматина в клетках эукариот при изменении концентрации ионов в окружающей клетку среде (Vinogradov 1995b). Согласно гипотезе "буферной ДНК", избыточная ДНК выступает в качестве структуры, обеспечивающей пассивный (энерго-независимый) гомеостаз, снижая тем самым требования к механизмам активного гомеостаза.

В то же время, увеличение буферной емкости ДНК увеличивает инерцию генетического аппарата, замедляя все связанные с его работой процессы (в том числе, рост и развитие организмов). Накопление и сохранение больших количеств избыточной ДНК в геноме может поддерживаться отбором в экологических нишах с низкими энергетическими ресурсами или при неблагоприятных физических условиях, не позволяющих полностью использовать эти ресурсы. Так, например, размер генома увеличивается при эволюционном выходе животных на сушу (амфибии, двоякодышащие рыбы и наземные легочные моллюски), что может быть связано с необходимостью ослабления влияния резких колебаний физических параметров среды на суше (в первую очередь, влажности). У амниот эти колебания блокируются с помощью системных механизмов организменного уровня, таких как зародышевые оболочки и кожные покровы. Поэтому размер генома и его вариабельность у них уменьшаются.

Однако при быстром изменении климата и нарушении биоценозов в результате антропогенного воздействия (как это происходит в настоящее время), виды с большой инерцией генетического аппарата (и соответственно, длительным ростом и развитием) могут не успевать адаптироваться и поэтому имеют повышенную вероятность вымирания (Vinogradov 2003а, 2004b). Интересно, что связь между размером генома и вероятностью вымирания выражена в различной степени для птиц-рептилий и млекопитающих-амфибий (у первых она значительна, у вторых - практически отсутствует). Птицы и

рептилии имеют больший угол наклона линии регрессии интенсивности метаболизма на размер генома (рис. 2), что свидетельствует о том, что изменение размера генома для них более критично.

С помощью разработанного нами метода измерения степени мембрано-зависимой конденсации хроматина получены новые экспериментальные данные, подтверждающие гипотезу "буферной ДНК" (Vinogradov 2005а). Показано, что у близких видов амфибий, различающихся размером генома, конденсация хроматина в клетках с большим размером генома более устойчива к вариации концентрации солей окружающей среды. Деконденсация хроматина в этом случае имеет меньший масштаб и больший временной лаг. Интересно отметить, что способность ДНК регулировать необходимую концентрацию ДНК-тропных белков уже используется для разработки методов исследования ДНК-гистоновых взаимодействий in vitro (Poirier et al. 2008). Авторы так и называют добавляемую ими избыточную ДНК - "гистоновый буфер" (histone buffer). Понятно, что чем больше ДНК в геноме, тем больше должна быть буферная емкость генома для ДНК-тропных белков.

Размер внутригеномных элементов

Было оценено соотношение количеств меж- и внутригенной некодирующей ДНК в геномах различных организмов (Vinogradov 1999с). Показано, что в широком эволюционном диапазоне изменение этих количеств происходит скоординировано. Проведен поиск возможных взаимосвязей в эволюции кодирующей и некодирующей ДНК (Vinogradov 2001b). В качестве некодирующей ДНК была выбрана ее внутригенная форма - интроны. Обнаружена связь между размером интронов и степенью неравномерности

юнов в кодирующей ДНК данного гена (которая, как известно, часто связана с уровнем экспрессии гена, т.к. в активно экспрессируемых генах оптимальные для транскрипции кодоны используются чаще своих синонимов). У многоклеточных организмов эта корреляция отрицательна, а у одноклеточных - положительна. Наиболее сильно она выражена у дрожжей S.cerevisiae, для которых нами было также прямо показано, что размер интронов положительно коррелирует с уровнем экспрессии содержащих их генов (рис. 5).

Отрицательная корреляция между размером интронов и степенью неравномерности использования синонимных кодонов, обнаруженная у многоклеточных организмов, может

использования различных синонимных ко/1

2.0 2.5 Размер интронов (1д, Ьр) Рис. 5. Зависимость между интенсивностью транскрипции и длиной интронов в генах дрожжей £ сегеуЬше._

объясняться появлением у них новых типов регуляции генов, которая осуществляется с помощью сильной конденсации хроматина, необходимой для долговременного отключения значительной части генов. Известно, например, что в клетках млекопитающих степень конден-сации хроматина примерно в пять раз выше, чем у дрожжей (Russell, Nurse 1986). В этом случае длинные интроны могут быть необходимы для обеспечения сильной конденсации хроматина в генах с низким уровнем экспрессии.

Несколько лет назад в ведущих международных журналах почти одновременно были опубликованы три работы, в которых было показано, что активно и широко экспрессируемые гены человека короче, чем тканеспецифичные гены - как в кодирующей, так и в интронной последовательности (Castillo-Davis et al. 2002; Eisenberg, Levanon 2003; Urrutia, Hurst 2003). Поскольку транскрипция и трансляция энергетически затратны, это явление было интерпретировано как результат отбора на экономичность в активно-экспрессируемых генах и мутационного давления, увеличивающего размер слабо-экспрессируемых генов. Это объяснение подразумевает отсутствие связи между размером гена и его функциональной нагрузкой. Фактически, оно аналогично "пермиссивной" интерпретации вариабельности размера генома, т.к. предполагает, что избыточная ДНК просто "терпима" в генах с низким уровнем экспрессии. Оно противоречит нашим данным о том, что у дрожжей более интенсивно экспрессируемые гены имеют более длинные интроны (рис. 5).

Нами было показано, что в геноме человека и других многоклеточных организмов (нематоды и дрозофилы) длина межгенного спейсера снижается при увеличении уровня и межгканевой широты экспрессии гена пропорционально снижению длины интронов (Vinogradov 2004d). Это не может быть объяснено отбором на экономичность, так как межгенный спейсер не транскрибируется. Было обнаружено также, что корреляция между средним уровнем экспрессии и ее межтканевой широтой (т.е. числом тканей, где экспрессируется данный ген) очень высока (r>0.95; Vinogradov 2004d, 2005с). Кроме того, мы показали, что белки, кодируемые тканеспецифичными генами, содержат большее количество функциональных доменов (в том числе, уникальных доменов), чем белки, кодируемые общеклеточными генами. Эти факты позволяют предположить, что увеличение длины тканеспецифических генов в некодирующей их части связано с опосредованным конденсацией хроматина подавлением транскрипции в тех тканях, где эти гены не должны экспрессироваться, а в кодирующей части - с тканевой специализацией и более сложной функциональной архитектурой кодируемых белков.

Эта интерпретация, условно названная "геномным дизайном", была предложена как альтернатива концепции отбора на экономичность (Vinogradov 2004d). Уже на следующий год наши результаты были подтверждены в отношении как белков, так и некодирующей ДНК (Cohen-Gihon et al. 2005; Sironi et al. 2005). Авторами был сделан вывод, что полученные новые данные "сильно подтверждают" концепцию "геномного дизайна" (Sironi et al. 2005).

Был проведен анализ количества и степени сходства эволюционно-консервативных участков в ортологичных интронах человека и мыши с

использованием высокочувствительного локального алгоритма выравнивания нуклеотидных последовательностей (Vinogradov 2006а). Установлено, что доля консервативных участков очень высока (60-70% длины интрона, не занятой мобильными элементами, специфичными для человека или мыши). При этом она выше в более длинных интронах тканеспецифичных генов (по сравнению с общеклеточными). Это различие остается после коррекции по следующим параметрам: степени сходства консервативных участков, уровня мутационного давления (определенного с помощью сравнения мобильных элементов, расположенных в интронах, с их консенсусными, т.е. предположительно исходными, копиями) и доли ГЦ-пар. Установлено, что ни доля интронов, занятая мобильными элементами, ни баланс инсерций и делеций в них (который является оценкой уровня и направления мутационного давления, действующего на интрон) не могут объяснить увеличение длины интронов тканеспецифичных генов. Интересно отметить, что распределения длин консервативных и неконсервативных участков интронов очень широкие, но имеют максимумы, близкие к длинам нуклеосомной и динуклеосомной ДНК. Кроме того, потенциал формирования нуклеосом выше в консервативных участках.

Обнаружено также,что длина консервативных участков интронов коррелирует с числом функциональных доменов в кодируемом данным геном белке. Полученные данные позволяют предположить, что длина интронов (как и кодирующих последовательностей) определяется их функциональной нагрузкой.

В дальнейшем концепция "геномного дизайна" была дополнена и несколько модифицирована. С точки зрения теории информации, наиболее сложной должна быть регуляция генов с промежуточной широтой экспрессии, а не узко-тканеспецифичных (поскольку именно для генов с промежуточной широтой экспрессии имеется наибольшая неопределенность выбора при включении/выключении гена) (рис. 6) (Vinogradov 2006b).

При более подробном анализе (с использованием новых, более полных данных) было обнаружено, что гены человека с промежуточной широтой экспрессии имеют наибольший размер как интронной, так и кодирующей части, а кодируемые ими белки содержат наибольшее число различных функциональных доменов (рис. 7). (При этом общеклеточные гены по-прежнему оказались короче, чем тканеспецифичные, так что этот результат не противоречит предыдущим данным.) Гипотеза отбора на экономичность не предсказывает такой колоколообразной зависимости.

0.6 р

0 в 16 24 32 40 48 56 64 72

Количество тканей Рис. 6. Информация (неопределенность выбора) при включении/выключении генов, экспрессированных в различном количестве тканей, согласно формуле Шеннона (-р*1о&р). Вероятность (р) определена как отношение числа тканей, где экспрессируется данный ген, к общему числу тканей._

Был также разработан метод оценки шенноновской информации внутригеномных объектов в геномном контексте (Vinogradov 2006b). С помощью данного метода было установлено, что гены с промежуточной широтой экспрессии имеют наибольшую функциональную сложность на всех исследованных уровнях: в сетях межгенных взаимодействий,

биохимических путях, модулях клеточных сетей, описываемых категориями Gene Ontology, группах генов, регулируемых определенными транскрипционными факторами, группах генов, кодирующих определенные функциональные белковые домены, группах "слов" аминокислотных последовательностей кодируемых белков и нуклеотидных последовательностей интронов и промоторных участков генов (полного и редуцированного алфавитов) (рис. 8). Показано также, что на модулярном уровне (т.е. в группах генов, связанных общей функцией) дихотомия общеклеточных и тканеспецифичных внутригеномных объектов выражена еще сильнее, чем на генном уровне (рис. 9).

Рис. 8. Распределение частот 6-нуклеотидных "слов" 2-бук-венного (пурин/пиримидин) алфавита в нитронах генов человека, экспрессированых в различном количестве тканей (0-72). Относительные частоты "слов" отложены в виде лучей (star plot) в одном и том же порядке для групп генов, различающихся межтканевой широтой экспрессии. Видно, что у генов, экспрессированных в промежуточном числе тканей (38-71), наибольшее разнообразие "слов". В генах, экспрессированных в крайних числах тканей (т.е. тканеспецифичных или общеклеточных), некоторых слов нет вообще (пустые сектора в графиках). Пурин-пиримидиновый алфавит выявляет более эволюционно-консервативные особенности последовательности ДНК (по сравнению с полным 4-буквенным). В частности, убран эффект вариабельности доли ГЦ-пар (который рассмотрен в

следующем разделе)._

Мы предполагаем, что именно сложность регуляции генов и генных модулей с промежуточной широтой экспрессии и привела к возникновению дихотомии общеклеточных и тканеспецифичных генов и модулей клеточных сетей. Известно, что именно сложность регуляции является основным ограничителем увеличения количества генов в геноме (Mattick, Gagen 2005).

0-5 6-18 19-37 38-54 55-66 67-71 72 Количество тканей

Рис 7. Длина интронной последовательности генов человека, экспрессированых в различном количестве тканей (0-72)._

£ Q.

а во

ф

га ¡2

О 60

о

о

0-5 6-18 19-37 38-54 55-66 67-71 72 Количество тканей

Рис. 9. Число "избыточных" категорий Gene Ontology (GO) в группах генов человека, экспрессированых в различном количестве тканей (0-72). Число генов примерно одинаково в каждой группе. "Избыточные" (overrepresented) - это категории, представленные выше уровня, ожидаемого на основании случайного распределения. Видно, что "избыточные" GO категории представлены в основном в тканеспецифичных (0-5) и общеклеточных генах (72). Красный -Biological Processes, синий - Molecular Functions, зеленый - Cellular Components.

Доля ГЦ-пар, физические свойства ДНК и конденсация хроматина: внутригеномная вариабельность

Геномы теплокровных состоят из изохор, т.е. участков ДНК размером >300 kb, имеющих сходный ГЦ-состав (отличающийся от ГЦ-состава соседних изохор), которые определяют характерный хромосомный бэндинг (напр., Bernardi 2000, 2004; Eyre-Walker, Hurst 2001). В литературе имелись две основные интерпретации этого явления. Нейтралистская интерпретация объясняла появление изохор внутригеномной вариацией мутационного давления, а селекционистская гипотеза связывала появление более термоустойчивых ГЦ-богатых изохор с повышенной температурой тела теплокровных. Для того чтобы понять, каким образом возникает сходство ГЦ-состава интронов и экзонов в генах изохор, была изучена корреляция между ГЦ-составом интронов и соседних экзонов в широком эволюционном диапазоне (Vinogradov 2001с).

Установлено, что в геномах с изохорной структурой концы интронов коррелируют с соседними экзонами гораздо сильнее, чем середины интронов (оценивались участки интронов длиной 50 нуклеотидов). В геномах без изохорной структуры такой закономерности не наблюдалось. В то же время, там была обнаружена повышенная локальная гетерогенность - более высокий контраст между средним ГЦ-составом интронов и соседних экзонов. Эти данные свидетельствуют против нейтралистской гипотезы о мутационном формировании изохор, поскольку маловероятно, чтобы спектр мутаций менялся на коротком сегменте ДНК вдоль длины интрона. Был сделан вывод о том, что локальная гомогенность ГЦ-состава внутри изохоры может возникать для того, чтобы минимизировать контраст в доле ГЦ-пар между соседними участками молекулы ДНК внутри изохоры.

В ходе этой работы для нескольких наиболее изученных геномов была также исследована плотность распределения мобильных элементов в различных участках интрона. Это необходимо было сделать в связи с тем, что, согласно литературным данным, различия ГЦ-состава середины интрона и его краев могли объясняться более высокой вероятностью интеграции мобильных элементов в середину интрона. Оказалось, однако, что лишь небольшая часть

обнаруженного эффекта может быть объяснена неодинаковой частотой интеграции мобильных элементов. При этом было обнаружено, что дивергенция мобильных элементов от их консенсусных последовательностей в геноме человека идет быстрее на краю интрона, чем в его середине. Это также согласуется с предположением о селективном характере эволюции интронов и подстройке их ГЦ-состава под ГЦ-состав соседних экзонов (степень которой зависит от отдаленности данного участка интрона от экзона).

Полученные данные, а также предположение о том, что интроны могут быть необходимы для правильной структуры хроматина, послужили толчком к началу исследований физических свойств молекулы ДНК (гибкости, кривизны, термостабильности и способности к B-Z переходу) в геномах различных организмов (Vinogradov 2001d, 2003b). Оказалось, что во всех исследованных последовательностях ДНК гибкость и способность к B-Z переходу увеличиваются с увеличением содержания ГЦ-пар, в то время как кривизна -снижается (рис. 10). Возрастает также и термостабильность (что, как известно, обусловлено наличием третьей водородной связи и более высокой полярностью

ГЦ-пары). Все эти зависимости очень сильны (г>0.95). Гибкость и способность к B-Z переходу показывают очень сильную положительную корреляцию между собой, причем значительная часть этой корреляции сохраняется даже при фиксированной доле ГЦ-пар. Возможно, оба параметра определяются одними и теми же фундаментальными свойствами биспирали ДНК.

При сравнении с рандомизированными последовательностями было обнаружено, что в геномах теплокровных при увеличении доли ГЦ-пар гибкость и способность к B-Z переходу возрастает относительно быстрее, чем в рандомизированных последовательностях, а термостабильность и кривизна - относительно медленнее. Эта закономерность наблюдалась как в некодирующей ДНК (интронах и межгенных промежутках), так и в экзонах, но сильнее всего она выражена в интронах. Обнаруженная закономерность распространяется также и на дивергенцию ретротранспозонов Alu, использованных в качестве маркеров эволюционных изменений. При дивергенции от консенсусной последовательности (которая аппроксимирует исходную активную копию ретротранспозона) относительная гибкость и способность к B-Z переходу увеличиваются, а кривизна и термостабильность молекулы ДНК снижаются.

Известно, что гибкость и способность к B-Z переходу молекулы ДНК связаны с активной транскрипцией и деконденсированным хроматином, в то время как повышенная кривизна молекулы ДНК характерна для конденсированного хроматина (Herbert, Rich 1996, 1999; Anselmi et al. 1999,

Содержание ГЦ-пар (%) Рис. 10. Зависимость способности ДНК к В-Ъ переходу от доли ГЦ-пар в интронах человека.

2000). Например, антитела к Z-форме ДНК связываются преимущественно с активно-транскрибируемыми генами, а волна Z-формы движется вслед за РНК-полимеразой (Herbert, Rich 1996, 1999). Поэтому наши данные позволяют отвергнуть имеющееся в литературе представление о том, что тяжелые (ГЦ-богатые) изохоры возникли в геноме теплокровных для обеспечения термостабильности дуплекса ДНК, и подтверждают нашу гипотезу о том, что их возникновение связано с активацией транскрипции в этих участках генома. Мы предположили, что возникновение изохорной структуры в геномах теплокровных связано с необходимостью более сложной регуляции генов (по сравнению с низшими организмами), опосредуемой структурой хроматина (Vinogradov 2001 d, 2003b).

Рис. 11. Двухмерная гистограмма межтканевой широты экспрессии (количества тканей где экспрессируется данный ген) и доли ГЦ-пар третьей позиции кодона (GC3), характеризующей изохорную принадлежность гена, для генов человека (слева) и мыши (справа). Видна дихотомия тханеспецифичных и общеклеточных генов. Видно также, что у человека относительно больше тканеспецифичных генов и более сложное их распределение по изохорам._

Широко используемая в литературе концепция разделения генов на тканеспецифичные и общеклеточные (housekeeping) была подтверждена с помощью анализа большого материала (Vinogradov 2003с). Показано, что большинство генов действительно распадается на два типа - работающие в очень небольшом количестве тканей и работающие во всех тканях. Эти два типа генов видны как пики на гистограмме распределения плотности генов по количеству тканей, в которых они экспрессированы (рис. 11). Однако между этими двумя основными типами имеется также переходная группа генов (плато на гистограмме распределения генов), экспрессированных в промежуточном количестве тканей.

Было показано что в тяжелых (ГЦ-богатых) изохорах генома человека расположены преимущественно гены с широкой межтканевой экспрессией (общеклеточные), а в легких (АТ-богатых) - наоборот, тканеспецифичные гены (рис. 12). Обнаружена корреляция между уровнем экспрессии гена (усредненном

по всем изученным тканям) и содержанием ГЦ-пар в кодирующей последовательности (причем, отдельно это показано для синонимных позиций) и интронах данного гена. Эти результаты подтверждают нашу гипотезу о том, что тяжелые изохоры оптимизированы в ходе эволюции для генов, которые активно транскрибируются (т.е., во всех тканях), а легкие - для генов, которые в большинстве тканей находятся в репрессированном состоянии.

Исследованы также видовые отличия в количестве общеклеточных и

тканеспецифичных генов у человека и мыши. Оказалось, что у мыши относительно меньше доля

тканеспецифичных генов (рис. 11). При этом снижение доли тканеспецифичных генов у мыши коррелирует с ослаблением изохорной структуры ее генома. Например, гены, которые у человека экспрессированы в большем количестве исследованных тканей, чем у мыши, имеют у человека более высокую долю ГЦ-пар.

На большой базе данных генов человека было показано, что потенциал формирования нуклеосом отрицательно коррелирует с долей ГЦ-пар (Vinogradov 2005b). Установлено также, что потенциал формирования нуклеосом выше в некодирующей ДНК (интронах и межгенных спейсерах) по сравнению с кодирующей, что подтвердило и расширило более ранние данные (Levitsky et al. 2001b). Интересно, что отрицательная корреляция между долей ГЦ-пар и потенциалом формирования нуклеосом сильнее выражена в некодирующей ДНК, чем в кодирующей, что подтверждает особую роль некодирующей ДНК в организации хроматина и изохорной структуре генома теплокровных (Vinogradov, Anatskaya 2006). Кроме того, используя данные по экпрессии генов, мы показали, что потенциал формирования нуклеосом выше в тканеспецифичных генах по сравнению с общеклеточными генами (как в

0-1 2-11 12-21 22-31 32 Количество тканей Рис. 12. Доля ГЦ-пар в интронах генов человека, экспрессированных в различном количестве тканей. (32 - максимальное число тканей в этой базе данных.)_

0-1 2-11 12-21 22-31 32 Количество тканей

Рис. 13. Потенциал формирования нуклеосом в генах человека, экспрессированных в различном количестве тканей. Зеленый -интроны, красный - экзоны (данные для межгенных промежутков перекрываются с данными для интронов, поэтому не показаны). Видно, что в ткане-специфичных генах (0-1) потенциал формирования нуклеосом выше, чем в общеклеточных (32), и что во всех типах генов он выше в некодирующей ДНК, чем в кодирующей.

интронах и межгенных промежутках, так и в экзонах) (рис. 13).

Таким образом, можно сделать вывод, что вариация доли ГЦ-пар в геноме человека имеет значение для регуляции экспрессии генов, опосредуемой конденсацией хроматина. Это находится в соответствии с концепцией "геномного дизайна", выдвинутой ранее (Vinogradov 2004d).

Известно, что в геноме теплокровных часто встречаются островки повышенного содержания ЦфГ-динуклеотидов (в основном, в промоторной области генов и интронах), которые обычно имеют и более высокую долю ГЦ-пар. В следующей работе (Vinogradov 2005с) было определено влияние как непрерывного параметра (доли ГЦ-пар), так и дискретного (наличие/отсутствие островка повышенного содержания ЦфГ-динуклеотидов) на особенности экспрессии генов человека. Было показано, что доля ГЦ-пар сильнее связана с максимальной интенсивностью экспрессии генов, а уровень ЦфГ-динуклеотидов - с межтканевой широтой экспрессии. При этом были протестированы различные локализации островков повышенного содержания ЦфГ-динуклеотидов. Обнаружено, что наибольшее влияние имеет наличие такого островка именно в месте начала транскрипции (±100 bp). Оба параметра (доля ГЦ-пар и уровень ЦфГ-динуклеотидов) отрицательно коррелируют с потенциалом формирования нуклеосом (независимо друг от друга, т.е. даже при исключении эффекта другого параметра) и положительно - со способностью к B-Z переходу. Полученные данные свидетельствуют о том, что вариация как доли ГЦ-пар, так и уровня ЦфГ-динуклеотидов в геноме имеет значение для модуляции различных параметров экспрессии генов, опосредуемой конденсацией хроматина.

Интересно, что в половых клетках корреляция между долей ГЦ-пар и интенсивностью экспрессии генов не обнаружена. Поскольку мутации в соматических клетках не наследуются, можно отвергнуть нейтралистское объяснение, предполагающее, что эта корреляция (наблюдаемая в соматических клетках) является побочным следствием мутационного давления, связанного с активной транскрипцией. (Поскольку в этом случае корреляция наблюдалась бы в первую очередь в половых клетках.) Кроме того, установлено, что сила корреляции уменьшается в ряду: доля ГЦ-пар интронов -> доля ГЦ-пар третьей позиции кодона -> доля ГЦ-пар всей кодирующей последовательности -> доля ГЦ-пар межгенных промежутков. Это позволяет отвергнуть предположение о том, что корреляция связана только с кодирующей ДНК, а также позволяет предположить, что помимо регионального (изохорного) эффекта есть гено-специфический эффект.

В отличие от доли ГЦ-пар, уровень ЦфГ-динуклеотидов коррелирует с интенсивностью экспрессии генов и в половых клетках, что позволяет выдвинуть довольно интригующую гипотезу (Vinogradov 2005с). Известно, что метилирование цитозина в процессе онтогенеза приводит к выключению генов, предположительно за счет усиления конденсации хроматина (Turker 2002; Yates et al. 2003). Известно также, что метилированный цитозин мутирует преимущественно в тимин (Fazzari, Greally 2004). В совокупности с нашими данными, это предполагает механизм наследуемого перевода эпигеномных

изменений экспрессии генов (конденсация хроматина за счет метилирования цитозииа) в геномные (конденсация хроматина за счет снижения доли ГЦ-пар).

Концепцию "геномного дизайна" можно рассматривать как развитие и расширение на внутригеномный уровень гипотезы "буферной ДНК", сформулированной при исследованиях на клеточном и организменном уровнях. В последнее время становится ясно, что именно локальная концентрация макромолекул в ядре является основным фактором, формирующим безмембранные внутриядерные компартменты, различающиеся степенью конденсации хроматина (Bancaud et al. 2009). Это очень динамичная структура, с быстрым обменом между связанными и свободными белками даже в случае гетерохроматина (хотя скорость обмена и снижается в гетерохроматине) несмотря на то, что морфологически он выглядит инертным (Bancaud et al. 2009; Poirier et al. 2009). При этом белки, локализованные в гетерохроматиновых компартментах, постоянно посещают ближайшие сайты связывания, т.е. оказываются динамически "пойманными" (trapped) внутри своего компартмента за счет большого количества мест связывания, расположенных поблизости (Bancaud et al. 2009). Другими словами, ДНК в составе гетерохроматина локально регулирует (забуферивает) концентрацию ДНК-тропных белков. Поэтому увеличение вокруг (и внутри) данного гена количества некодирующей ДНК, имеющей повышенный потенциал образования нуклеосом ("gene nest"; Vinogradov 2004d), может обеспечивать более стабильную инактивацию тканеспецифичного гена за счет того, что большее количество гистонов удерживается в динамическом равновесии в области хроматина вокруг гена.

Таким образом, внутригеномная вариация доли ГЦ-пар и размера сегментов некодирующей ДНК создает опосредуемый структурой хроматина "эпигеномный ландшафт" (Vinogradov 2003с), участвующий в регуляции генной экспрессии совместно с ДНК-специфичными сайтами связывания транскрипционных факторов. Ведь известно, что у экариот транскрипционные факторы сами по себе не обладают достаточной специфичностью для однозначного узнавания регуляторного (функционального) места связывания (Wunderlich, Mirny 2009).

Совсем недавно наша гипотеза о том, что возникновение ГЦ-богатых изохор в геномах теплокровных связано с активацией транскрипции в этих участках генома, опосредованной деконденсацией хроматина (Vinogradov 200Id, 2003b,с, 2005b,с), получила сильное экспериментальное подтверждение (Jia et al. 2010). Было показано, что внедрение ГЦ-богатого сегмента некодирующей ДНК в 5'- и/или 3'-фланкирующие районы различных генов культивируемых клеток млекопитающих приводит к деконденсации хроматина и резкой активации экспрессии этих генов (выше уровня, достигаемого другими методами). В результате был сделан вывод о том, что ГЦ-богатый сегмент ДНК является сильным хроматин-открывающим элементом ("super chromatin opening element") и что данный подход может служить промышленным методом активации экспрессии гена для массового получения кодируемого геном белка (Jia et al. 2010). Авторы также делают вывод о том, что основанная на конденсации хроматина регуляция генной экспрессии включена (по крайней мере, частично) в

первичную структуру ДНК, а именно в долю ГЦ-пар. Следует отметить, что ни из нейтралистского (мутационного) объяснения появления изохор, ни из гипотезы термоустойчивости этот экспериментальный результат не следовал.

Эволюция транскриптома и протеома

Помимо расхождения в объяснении свойств общей структуры генома (размера генов, сегментов некодирующей ДНК и доли ГЦ-пар), различие между нейтралистскими и адаптационистскими концепциями проявляется и в более глубоком, мировоззренческом аспекте - при выявлении причин увеличения сложности организмов (т.н. прогрессивной эволюции). Нейтралистские интерпретаторы приходят к выводу, что это увеличение происходит в результате ослабления отбора и является просто следствием мутационного давления (напр., Lynch, Conery 2003; Koonin 2004). Другими словами, информация, необходимая для повышения уровня биологической организации, должна создаваться из шума без участия отбора ("демона Максвелла"), что противоречит второму закону термодинамики. Дело доходит до курьезов: например, авторы одного транскриптомного анализа пришли к выводу, что различия в паттернах генной экспрессии между гомологичными тканями человека и мыши - случайные (Yanai et al. 2004). Из этого должно следовать, что и различия в фенотипе между человеком и мышью - случайные.

Сравнение человек-мышь представляет собой идеальную модель для поиска молекулярных и клеточных механизмов, обеспечивающих различие в уровне организации, поскольку оба вида принадлежат к одному и тому же классу животных, т.е. имеют гомологичные ткани и много ортологичных генов. Мышь имеет более низкий уровень организации вследствие r-отбора (т.е. отбора на скорость размножения, а не на сложность организации, являющуюся результатом К-отбора; Larke, Crews 2006). Геномы обоих модельных видов хорошо изучены, для них имеются обширные данные по транскриптомам, полученные с помощью схожих микроэррэйных платформ. Кроме того, мышь является важной биомедицинской моделью, и полученные на ней данные часто переносятся на человека. В нашей предыдущей работе уже было обнаружено, что по сравнению с мышью у человека относительно больше число тканеспецифичных генов (рис. 11). Это указывает на более высокую специализацию (дифференцировку) клеток. Увеличение степени специализации элементов системы ("разделения труда") давно признано в качестве основной черты прогрессивной эволюции социальных и биологических систем (Smith 1776; McShea 1996; Gould 2002). Однако, этот эффект не был показан на молекулярном ("омиксном") уровне.

В следующей работе мы провели более подробный анализ, используя новые, более обширные данные для большего числа генов и тканей (Vinogradov, Anatskaya 2007). Мы определили долю тканеспецифичных генов и отношение суммарной экспрессии тканеспецифичных генов к суммарной экспрессии общеклеточных (housekeeping) генов у человека и мыши. При этом было применено много различных индикаторов степени тканеспецифичности генов.

Было обнаружено, что для одного и того же набора ортологичных генов и гомологичных тканей у человека наблюдается большая доля тканеспецифичных генов и более высокое отношение экспрессии тканеспецифичных генов к экспрессии общеклеточных генов (рис. 14).

Данный феномен сильнее выражен в тех тканях, которые сильнее вовлечены в повышение уровня организации, продолжительности жизни и размера тела, т.е. этот молекулярный и клеточный феномен отражен также и на организменном уровне (в вариабельности степени его выраженности между различными тканями). Это различные части нервной системы (за исключением обонятельной луковицы - olfactory bulb), скелетные мышцы, сердце, почки.

Особый интерес представляют тригеминальный ганглий (trigeminal ganglion - TGG) и спинной ганглий (dorsal root ganglion - DRG), где эффект выражен даже сильнее, чем в других частях нервной системы. Известно, что TGG конролирует лицевые и ротовые (речь) движения, столь необходимые для социальной организации человека. TGG вовлечен и в анализ визуальной информации, так как в нем конвергирует глазной нерв. DRG содержит клеточные тела сенсорных клеток, собирающих сенсорную информацию с остальных частей тела. В частности, точные движения пальцев, столь важные для человека, зависят от DRG. Таким образом, сильное различие между человеком и мышью в этих двух тканях может отражать не только увеличение биологической сложности, но и переход к ее новому уровню - социальной организации (TGG) и изготовлению орудий труда (DRG).

Ситуация с обонятельной луковицей, в которой эффект был слабее медианы для всех тканей и особенно слаб по сравнению с другими частями нервной системы, представляет особый интерес. Известно, что для приматов основным каналом информации является зрение, в то время как для грызунов — обоняние. Таким образом, обонятельная луковица - хороший пример исключения, которое только подтверждает правило.

Гены, которые изменили межтканевую широту экспрессии на эволюционном расстоянии между человеком и мышью, показывают также большую эволюционную дивергенцию нуклеотидной последовательности промоторных участков и аминокислотной последовательности кодируемых белков. Таким образом, данные функциональной геномики подтверждаются структурным анализом.

У человека также более сильно выражена экспрессия генов, относящихся к трансляционному аппарату. На структурном уровне мы обнаружили, что начальные нетранслируемые участки ортологичных мРНК (5'UTRs) у человека длиннее, чем у мыши (даже после коррекции на разницу в размере геномов). Они также содержат больше AUG кодонов. Это указывает на более сложную регуляцию на уровне трансляции (Gebauer, Hentze 2004; Churbanov et al. 2005) и хорошо согласуется с увеличением экспрессии генов трансляционного аппарата и усилением клеточной специализации. Регуляция на уровне трансляции более важна именно для сильно специализированных клеток, так как обеспечивает более быстрый и экономичный ответ, но в более узком диапазоне, ограниченном имеющимся транскриптомом (Kindler et al. 2005).

5.0 4.5 4.0 3.5

2 30

СП

ГО

О- 2.5

2.0 1.5 1.0 0.5

Рис. 14. Отношение суммарной экспрессии тканеспецифичных генов к суммарной экспрессии общеклеточных (housekeeping) генов у человека (синие квадратики) и мыши (зеленые ромбики), а также отношение первой величины ко второй (красные кружки) в 32 парах гомологичных тканях. Данные получены на основании анализа 11534 пар ортологичных генов. Видно, что все синие точки выше, чем соответствующие зеленые, и как следствие, все красные точки выше единицы. (Красная штриховая линия показывает медиану красных кружков для всех 32 тканей.)_

■г

• •

•. ■ ■ ■.

...........................................................................................•V. ' . " ,......................

♦♦♦♦ ♦ ♦ ♦ ♦♦ »

«шимш rlrlPifPII 1Щ ifЧ8 f Н 1 if "Is II

г

Ткани

Полученные данные позволяют предположить, что повышение уровня биологической организации связано с усилением экспрессии тканеспецифичных генов и, соответственно, более высокой степенью специализации (дифференцировки) клеток. Каким образом клетки гомологичных тканей двух представителей одного и того же класса млекопитающих (имеющих одинаковый набор органов) могут отличаться по степени специализации? Биохимическая диверсификация (специализация) клеток одного и того же клеточного типа (гепатоцитов) внутри органа была продемонстрирована даже для такого относительно гомогенного органа, как печень (ВегЛатоисЬе et а1. 2006; Вгаеитп§ е1 а1. 2006). По-видимому, степень такой специализации выше в клетках человека. Другими словами, у человека может быть большее число биохимических типов клеток (определяемых уникальными паттернами генной экспрессии) внутри одного и того же морфологического клеточного типа.

С биомедицинской точки зрения, следует сделать вывод ,что эволюционные различия необходимо учитывать при перенесении результатов,

полученных на более простых моделях, на человека. Известно, например, что клетки человека более устойчивы к малигнизации, чем мышиные (Rangarajan, Weinberg 2003; Rangarajan et al. 2004). Таким образом, различие в продолжительности жизни организмов отражается и на клеточном уровне.

В следующей работе были проанализированы факторы, влияющие на скорость эволюции белков млекопитающих (Vinogradov 2010а). Это важная проблема в области молекулярной эволюции потому, что выявление факторов, определяющих скорость эволюции, позволяет судить о том, какие факторы вообще влияют на эволюцию белков. По этому вопросу существуют противоречивые мнения. В последнее время возобладала нейтралистская точка зрения, согласно которой главным детерминантом скорости эволюции белка является уровень его экспрессии. Предполагается, что негативная связь между этими параметрами возникает в результате стабилизирующего (purifying) отбора против токсичности неправильно свертывающихся мутантных белков, который должен быть более сильным в случае интенсивно экспрессирующихся генов (Koonin, Wolf 2006; Drummond, Wilke 2008; Powers, Balch 2008). Другими словами, предполагается, что эволюция белка определяется индивидуальным (по-генным) эффектом. Полагают, что остальные факторы играют второстепенную роль или даже что их эффект объясняется корреляцией с уровнем экспрессии (Drummond et al. 2006; Hakes et al. 2007).

Однако, мы показали, что скорость эволюции ко-экспрессированных генов, белков-интерактантов и генов, принадлежащих к тому же биохимическому пути, является наиболее важным фактором, определяющим скорость эволюции данного белка (Табл. 1) (Vinogradov 2010а). Другим важным фактором является сложность регуляции кодирующего белок гена (оцениваемая по числу мишеней транскрипционных факторов и регуляторных микро-РНК в регуляторных участках гена). Белки, кодируемые более сложно-регулируемыми генами, эволюционируют медленней (Табл. 1). Длина интронов и отношение длины интронной ДНК к кодирующей также негативно коррелируют со скоростью эволюции кодируемого белка (Табл. 1). Это перекликается с нашими предыдущими данными о том, что интроны несут регуляторную нагрузку и что большее количество интронной ДНК означает более сложную регуляцию (Vinogradov 2004d, 2006а). Эволюционный возраст гена - еще один важный фактор (Табл. 1). Более новые гены эволюционируют быстрее, особенно гены, появившиеся на этапе многоклеточное™. (Эволюционный возраст гена можно считать системным фактором, поскольку новый ген и кодируемый им белок должны встроиться в уже существующие клеточные системы.) Таким образом, эти данные противоречат нейтралистской концепции о том, что один индивидуальный фактор в основном определяет скорость эволюции белка, и показывают, что системные факторы доминируют в эволюции белков млекопитающих. Этот результат уже подтвержден и детализирован для ряда биохимических путей другими авторами (Ainali et al. 2011).

Табл. 1. Значения F-value (отношение дисперсии, объясняемой предиктором, к остаточной дисперсии) различных предикторов скорости эволюции белков млекопитающих при сравнении ортологичных генов человека и мыши. Анализ общей линейной модели (OJ1M) был сделан с III типом суммы квадратов, при котором эффект каждого тестируемого параметра не зависит от порядка, в котором он вводится в модель. Знак показывает направление зависимости. Последние четыре параметра были протестированы отдельно друг от друга (из-за различного числа имеющихся генов), но вместе с первыми шестью. (Уровни значимости различных F-value при п>5000: 7,/К 10"-; 11,/XlO"5; 16,р<104; 24,/КЮ 6; 42,р<1010; 68,р<10").

Параметр п=7754 п=5526 п=12630 п=12630 Знак

Уровень экспрессии данного гена 5.7 9.9 48.5 41.3 -

Средний уровень экспрессии ко-экспрессированных генов 14.6 7.3 14.4 17.8 +

Число ко-экспрессированных генов 1.1 0.5 5.9 6.8 -

Среднее число ко-экспрессированных генов у ко-экспрессированных генов 0.2 2.5 28.2 27.1 +

Скорость эволюции ко-экспрессированных генов 863.5 286.6 1670.0 1713.5 +

Эволюционное происхождение данного гена 823.1 335.9 945.9 1049.4 +

Число транскрипционных факторов 725.2 — — — -

Число регуляторных микро-РНК — 331.9 — — -

Длина интронной ДНК — — 180.0 — -

Отношение длины интронной ДНК к длине кодирующей — — — 235.6 -

Выводы

1) У наземных позвоночных существует негативная зависимость между размером генома и интенсивностью метаболизма (независимого от размера тела), предполагающая функциональное (адаптивное) качение некодирующей ДНК. У них обнаружены две линии регрессии интенсивности метаболизма на размер генома. Одна линия представлена млекопитающими и амфибиями, вторая (с более крутым наклоном) - птицами и рептилиями. У наземных позвоночных существуют также зависимости между размером генома и долей ГЦ-пар и между долей ГЦ-пар, потенциалом образования нуклеосом и размером клеточного ядра (т.е. конденсацией хроматина).

2) Гибкость и способность к В-2 переходу дуплекса ДНК увеличиваются при увеличении содержания ГЦ-пар быстрее, чем в рандомизированных последовательностях, а термостабильность - медленнее. Доля ГЦ-пар

негативно коррелирует с потенциалом образования нуклеосом. Эти данные позволяют отвергнуть имеющееся в литературе представление о том, что "тяжелые" (ГЦ-богатые) изохоры возникли в геноме теплокровных для обеспечения термостабильности молекулы ДНК, и предположить, что их возникновение связано с активацией транскрипции в этих участках генома.

3) Гены человека с промежуточной межтканевой широтой экспрессии (т.е. не тканеспецифичные и не общеклеточные) имеют наибольший размер (как интронной, так и кодирующей части), а кодируемые ими белки содержат наибольшее число функциональных доменов. Эти гены имеют наибольшую функциональную сложность на всех исследованных уровнях: в сетях белковых взаимодействий, биохимических путях, модулях, описываемых категориями Gene Ontology, группах генов, регулируемых определенными транскрипционными факторами, группах генов, кодирующих определенные функциональные белковые домены, группах "слов" аминокислотных последовательностей кодируемых белков и нуклеотидных последовательностей интронов и промоторных участков. На модулярном уровне (т.е. на уровне групп генов, связанных общей функцией) дихотомия общеклеточных и тканеспецифичных объектов выражена сильнее, чем на уровне отдельных генов. Предполагается, что именно сложность регуляции генов и генных модулей с промежуточной широтой экспрессии и привела к возникновению дихотомии общеклеточных и тканеспецифичных генов и модулей.

4) Для одного и того же набора гомологичных (ортологичных) генов и гомологичных тканей у человека больше доля тканеспецифичных генов и более высокое отношение экспрессии тканеспецифичных генов к экспрессии общеклеточных генов, чем у мыши. Гены, которые изменили межтканевую широту экспрессии, показывают также большую эволюционную дивергенцию нуклеотидной последовательности промоторных участков и аминокислотной последовательности кодируемых белков. Эти молекулярные данные показывают, что повышение уровня биологической организации связано с более высокой степенью специализации (дифференцировки) клеток.

5) Скорость эволюции ко-экспрессированных генов, белков-интерактантов и белков, принадлежащих к одному и тому же биохимическому пути, является наиболее важным фактором, определяющим скорость эволюции белков млекопитающих. Другим важным фактором является сложность регуляции кодирующего белок гена. Белки, кодируемые более сложно-регулируемыми генами, эволюционируют медленней. Эти данные показывают, что системные факторы доминируют в эволюции белок-кодирующей ДНК млекопитающих.

6) Подводя общий итог, можно сделать вывод, что все исследованные в данной работе свойства генома (перечисленные в пунктах 1-5) имеют функциональное значение.

Список публикаций по теме диссертации

1. Виноградов А.Е. 1999. Парадокс размера генома и проблема избыточной ДНК. Цитология 41: 5-13.

2. Vinogradov А.Е. 1994. Measurement by flow cytometry of genomic AT/GC ratio and genome size. Cytometry 16: 34-40.

3. Vinogradov A.E. 1995a. Nucleotypic effect in homeotherms: body mass-

corrected basal metabolic rate of mammals is related to genome size. Evolution 49: 1249-1259.

4. Vinogradov A.E. 1995b. Cell membrane-dependent chromatin condensation. Cytometry 19: 183-188.

5. Vinogradov A.E. 1997. Nucleotypic effect in homeotherms: body mass-independent resting metabolic rate of passerine birds is related to genome size. Evolution 51: 220-225.

6. Vinogradov A.E. 1998a. Genome size and GC-percent in vertebrates as determined

by flow cytometry: the triangular relationship. Cytometry 31: 100-109.

7. Vinogradov A.E. 1998b. Variation in ligand-accessible genome size and its ecomorphological correlates in a pond snail. Hereditas 128: 59-65.

8. Vinogradov A.E. 1998c. Buffering: a possible passive-homeostasis role for redundant DNA. J. Theor. Biol. 193: 197-199.

9. Vinogradov A.E. 1999a. Genome in toto. Genome 42: 361-362.

10. Vinogradov A.E. 1999b. Chromatin signal in genome size measurement. Cytometry 37: 243-245.

11. Vinogradov A.E. 1999c. Intron-genome size relationship on a large evolutionary scale. J. Mol. EvoL 49: 376-384.

12. Vinogradov A.E. 2000. Larger genomes for molluskan land pioneers. Genome 43: 211-212.

13. Vinogradov A.E. 2001a. Mirrored genome size distributions in monocot and dicot plants. Acta Biotheoretica 49: 43-51.

14. Vinogradov A.E. 2001b. Intron length and codon usage. J. Mol. EvoL 52: 2-5.

15. Vinogradov A.E. 2001c. Within-intron correlation with base composition of adjacent exons in different genomes. Gene 276: 143-151.

16. Vinogradov A.E. 2001d. Bendable genes of warm-blooded vertebrates. MoL Biol. EvoL 18:2195-2200.

17. Vinogradov A.E. 2002. Growth and decline of introns. Trends Genet. 18: 232-236.

18. Vinogradov A.E. 2003a. Selfish DNA is maladaptive: evidence from the plant Red List. Trends Genet. 19: 609-614.

19. Vinogradov A.E. 2003b. DNA helix: the importance of being GC-rich. Nucleic Acids Res. 31: 1838-1844.

20. Vinogradov A.E. 2003c. Isochores and tissue-specificity. Nucleic Acids Res. 31: 5212-5220.

21. Vinogradov A.E. 2003d. Silent DNA: speaking RNA language? Bioinformatics 9: 2167-2170.

22. Vinogradov A.E. 2004a. Testing genome complexity. Science 304: 389-390.

23. Vinogradov A.E. 2004b. Genome size and extinction risk in vertebrates. Proc. Roy.Soc.B21h 1701-1705.

24. Vinogradov A.E. 2004c. Evolution of genome size: multi-level selection, mutation bias or dynamical chaos? Curr. Opitt. Genet. DeveL 14: 620-626.

25. Vinogradov A.E. 2004d. Compactness of human housekeeping genes: selection for economy or genomic design? Trends Genet 20: 248-253.

26. Vinogradov A.E. 2005a. Genome size and chromatin condensation in vertebrates. Chromosoma 113: 362-369.

27. Vinogradov A.E. 2005b. Noncoding DNA, isochores and gene expression: nucleosome formation potential. Nucleic Acids Res. 33: 559-563.

28. Vinogradov A.E. 2005c. Dualism of gene GC content and CpG pattern in regard to expression in the human genome: magnitude versus breadth. Trends Genet. 21: 639-643.

29. Vinogradov A.E. 2006a. "Genome design" model: evidence from conserved intronic sequence in human-mouse comparison. Genome Res. 16: 347-354.

30. Vinogradov A.E. 2006b. 'Genome design' model and multicellular complexity: golden middle. Nucleic Acids Res. 34: 5906-5914.

31. Vinogradov A.E., Anatskaya O.V. 2006. Genome size and metabolic intensity in tetrapods: a tale of two lines. Proc. Roy. Soc. B 273: 27-32.

32. Vinogradov A.E., Anatskaya O.V. 2007. Organismal complexity, cell differentiation and gene expression: human over mouse. Nucleic Acids Res. 35: 6350-6356.

33. Vinogradov A.E. 2010. Systemic factors dominate mammal protein evolution. Proc. Roy. Soc. B 277: 1403-1408.

Список цитируемой литературы

Ainali С. et al. 2011. Protein coalitions in a core mammalian biochemical network linked by rapidly evolving proteins. Mol. Biol. Evol. (in press).

Anselmi C. et al. 1999. Dual role of DNA intrinsic curvature and flexibility in determining nucleosome stability. J. Mol Biol. 286: 1293-1301.

Anselmi C. et al. 2000. A theoretical model for the prediction of sequence-dependent nucleosome thermodynamic stability. Biophys. J. 79: 601-613.

Bancaud A. et al. 2009. Molecular crowding affects diffusion and binding of nuclear proteins in heterochromatin and reveals the fractal organization of chromatin. EMBO J. 28: 37853798.

Benhamouche S. et al. 2006. Ape tumor suppressor gene is the "zonation-keeper" of mouse liver. Dev. Cell 10: 759-770.

Bernardi G. 2000. Isochores and the evolutionary genomics of vertebrates. Gene 241: 3-17.

Bernardi G. 2004. Structural and Evolutionary Genomics. Natural Selection in Genome Evolution. Elsevier, Amsterdam.

Bishop C.M. 2005. Circulatory variables and the flight performance of birds. J. Exp. Biol. 208: 1695-1708.

Braeuning A. et al. 2006. Differential gene expression in periportal and perivenous mouse hepatocytes. FEBSJ. 273: 5051-5061.

Castillo-Davis C.I. et al. 2002. Selection for short introns in highly expressed genes. Nature Genet. 31:415-418.

Churbanov A. et al. 2005. Evolutionary conservation suggests a regulatory function of AUG triplets in 5'-UTRs of eukaryotic genes. Nucleic Acids Res. 33: 5512-5520.

Cohen-Gihon I. et al. 2005. Modular genes with metazoan-specific domains have increased tissue specificity. Trends Genet. 21:210-213.

Croft D. et al. 2011. Reactome: a database of reactions, pathways and biological processes. Nucleic Acids Res. 39: D691- D697.

Dawson T.J. et al. 2003. Functional capacities of marsupial hearts: size and mitochondrial parameters indicate higher aerobic capabilities than generally seen in placental mammals. J. Comp. Physiol. B. 173: 583-590.

Drummond D.A. et al. 2006. A single determinant dominates the rate of yeast protein evolution. Mol. Biol. Evol. 23: 327-337.

Drummond D.A., Wilke C.O. 2008. Mistranslation-induced protein misfolding as a dominant constraint on coding-sequence evolution. Cell 134: 341-352.

Eisenberg E., Levanon E.Y. 2003. Human housekeeping genes are compact. Trends Genet. 19: 362-365.

Eyre-Walker A., Hurst L.D. 2001. The evolution of isochores. Nat. Rev. Genet. 2: 549-555.

Fazzari M.J., Greally J.M. 2004. Epigenomics: beyond CpG islands. Nat. Rev. Genet. 5: 446455.

Gabrielian A., Pongor S. 1996. Correlation of intrinsic DNA curvature with DNA property periodicity. FEBS Let. 393: 65-68.

Gebauer F., Hentze M.W. 2004. Molecular mechanisms of translational control. Nat. Rev. Mol. Cell Biol. 5: 827-835.

Gene Ontology Consortium. 2010. The Gene Ontology in 2010: extensions and refinements. Nucleic Acids Res. 38: D331-D335.

Gould S.J. 2002. The Structure of Evolutionary Theory. Harvard University Press, Cambridge, Massachusetts.

Gregory T.R. 2002. A bird's-eye view of the C-value enigma: genome size, cell size, and metabolic rate in the class Aves. Evolution 56: 121-130.

Gregory T.R. et al. 2009. The smallest avian genomes are found in hummingbirds. Proc. Roy. Soc. B. 276: 3753-3757.

Hakes L. et al. 2007. Specificity in protein interactions and its relationship with sequence diversity and coevolution. Proc. Natl. Acad. Sci. USA 104: 7999-8004.

Herbert A., Rich A. 1996. The biology of left-handed Z-DNA. J. Biol. Chem. 271: 1159511598.

Herbert A., Rich A. 1999. Left-handed Z-DNA, structure and function. Genetica 106: 37-47.

Hunter S. et al. 2009. InterPro: the integrative protein signature database. Nucleic Acids Res. 37: D211-D215.

Jensen L.J. et al. 2009. STRING 8 - a global view on proteins and their functional interactions in 630 organisms. Nucleic Acids Res. 37: D412-D416.

Jia Q. et al. (43 authors). 2010. A "GC-rich" method for mammalian gene expression: a dominant role of non-coding DNA GC content in regulation of mammalian gene expression. Science China Life Sci. 53: 94-100.

Jurka J. et al. 2005. Repbase Update, a database of eukaryotic repetitive elements. Cytogenet Genome Res. 110: 462-467.

Kanehisa M. et al. 2008. KEGG for linking genomes to life and the environment. Nucleic Acids Res. 36: D480- D484.

Kindler S. et al. 20Q5. RNA transport and local control of translation. Annu. Rev. Cell Dev. Biol. 21: 223-245.

Koonin E.V. 2004. A non-adaptationist perspective on evolution of genomic complexity or the continued dethroning of man. Cell Cycle 3: 280-285.

Koonin E.V., Wolf Y.I. 2006. Evolutionary systems biology: links between gene evolution and function. Curr. Opin. Biotechnol. 17: 481-487.

Kozlowski J. et al. 2003. Cell size as a link between noncoding DNA and metabolic rate scaling. PNAS USA 100: 14080-14085.

Lafontaine I., Lavery R. 2000. Optimization of nucleic acid sequences. Biophys. J. 79: 680685.

Larke A., Crews D.E. 2006. Parental investment, late reproduction, and increased reserve capacity are associated with longevity in humans. J. Physiol. Anthropol. 25: 119-131.

Levitsky V.G. 2004. RECON: a program for prediction of nucleosome formation potential. Nucleic Acids Res. 32: W346- W349.

Levitsky V.G., Podkolodnaya O.A., Kolchanov N.A., Podkolodny N.L. 2001a. Nucleosome formation potential of eukaryotic DNA: calculation and promoters analysis. Bioinformatics 17: 998-1010.

Levitsky V.G., Podkolodnaya O.A., Kolchanov N.A., Podkolodny N.L. 2001b. Nucleosome formation potential of exons, introns, and AIu repeats. Bioinformatics 17: 1062-1064.

Loborg H., Rundquist I. 1997. DNA binding fluorochromes as probes for histone Hl-chromatin interactions in situ. Cytometry 28:212-219.

Lynch M., Conery J.S. 2003. The origins of genome complexity. Science 302: 1401-1404.

Mattick J.S., Gagen M.J. 2005. Accelerating networks. Science 307: 856-858.

McShea D.W. 1996. Metazoan complexity and evolution: Is there a trend? Evolution 50: 477492.

Munteanu M.G. et al. 1998. Rod models of DNA, sequence-dependent anisotropic elastic modelling of local bending phenomena. TIBS 23: 341-347.

Nesse R.M. et al. 2010. Making evolutionary biology a basic science for medicine. PNAS USA 107 Suppl 1: 1800-1807 (а также другие статьи коллоквиума NAS USA "Evolution in Health and Medicine" в том же номере PNAS).

Organ C.L. et al. 2009. Sauropod dinosaurs evolved moderately sized genomes unrelated to body size. Proc. Roy. Soc. B. 276: 4303-4308.

Poirier M.G. et al. 2008. Spontaneous access to DNA target sites in folded chromatin fibers. J. Mol. Biol. 379: 772-786.

Poirier M.G. et al. 2009. Dynamics and function of compact nucleosome arrays. Nat. Struct. Mol. Biol. 16: 938-944.

Powers E.T., Balch W.E. 2008. Costly mistakes: translational infidelity and protein homeostasis. Cell 134: 204-206.

Rangarajan A. et al. 2004. Species- and cell type-specific requirements for cellular transformation. Cancer Cell 6: 171-183.

Rangarajan A., Weinberg R.A. 2003. Comparative biology of mouse versus human cells: modelling human cancer in mice. Nat. Rev. Cancer 3: 952-959.

Redi C.A. et al. 2007. Genome size: a novel genomic signature in support of Afrotheria. J. Mol. Evol. 64: 484-748.

Richey B. et al. 1987. Variability of the intracellular ionic environment of Escherichia coli. Differences between in vitro and in vivo effects of ion concentrations on protein-DNA interactions and gene expression. J. Biol. Chem. 262: 7157-7164.

Rubidge B.S., Sidor C.A. 2001. Evolutionary patterns among Permo-Triassic therapsids. Ann. Rev. Ecol. Syst. 32: 449-480.

Russell P., Nurse P. 1986. Schizosaccharomyces pombe and Saccharomyces cerevisiae: a

look at yeasts divided. Cell 45: 781-782. Ruta M. et al. 2003. Early tetrapod relationships revisited. Biol. Rev. Camb. Philos. Soc. 78: 251-345.

SantaLucia J.Jr. 1998. A unified view of polymer, dumbbell, and oligonucleotide DNA

nearest-neighbor thermodynamics. Proc. Natl. Acad. Sci. USA. 95: 1460-1465. Sayers E.W. et al. 2010. Database resources of the National Center for Biotechnology

Information. Nucleic Acids Res. 38: D5-D16. Sironi M. et al. 2005. Analysis of intronic conserved elements indicates that functional complexity might represent a major source of negative selection on non-coding sequences. Hum. Mol. Genet. 14: 2533-2546. Smith A. 1776. The Wealth of Nations. Edinburgh.

Storey J.D., Tibshirani R. 2003. Statistical significance for genomewide studies. Proc. Natl.

Acad. Sci. USA 100: 9440-9445. Su A.I. et al. 2004. A gene atlas of the mouse and human protein-encoding transcriptomes.

Proc. Natl. Acad. Sci. USA 101: 6062-6067. Subramanian et al. 2007. GSEA-P: a desktop application for Gene Set Enrichment Analysis.

Bioinformatics 23: 3251-3253. Turker M.S. 2002. Gene silencing in mammalian cells and the spread of DNA methylation.

Oncogene 21: 5388-5393. Urrutia A.O., Hurst L.D. 2003. The signature of selection mediated by expression on human

genes. Genome Res. 13: 2260-2264. Venter J.C. et al. (274 authors). 2001. The sequence of the human genome. Science 291: 1304-1351.

Wakaguri H. et al. 2008. DBTSS: database oftranscription start sites, progress report 2008. Nucleic Acids Res. 36: D97-D101.

Wunderlich Z., Mirny L.A. 2009. Different gene regulation strategies revealed by analysis of

binding motifs. Trends Genet. 25: 434-440. Xing Y. et al. 2007. Assessing the conservation of mammalian gene expression using high-

density exon arrays. Mol. Biol. Evol. 24: 1283-1285. Yanai I. et al. 2004. Incongruent expression profiles between human and mouse orthologous

genes suggest widespread neutral evolution of transcription control. OMICS 8: 15-24. Yates P.A. et al. 2003. Silencing of mouse Aprt is a gradual process in differentiated cells. Mol. Cell Biol. 23: 4461-4470.

Автор выражает искреннюю признательность за помощь и моральную поддержку следующим коллегам: О.В.Анацкая, Л.Я.Боркин, С.Н.Литвинчук, В.Н.Парфенов, Е.Д.Петрова, Ю.М.Розанов, А.Л.Юдин, J.Bogart, Б.Огееп, Е.Б.НиШ, УХХапопоу, 1.8.МаН1ск, Б.А.Рейот, С.А.КеШ, Я.Тпуеге.

Лицензия ЛР № 020593 от 07.08.97

Подписано в печать 05.04.2011. Формат 60x84/16. Печать цифровая. Усл. печ. л. 2,2. Уч.-изд. л. 2,2. Тираж 100. Заказ 7481Ь.

Отпечатано с готового оригинал-макета, предоставленного автором, в Цифровом типографском центре Издательства Политехнического университета 195251, Санкт-Петербург, Политехническая ул., 29. Тел.: (812) 550-40-14 Тел./факс: (812) 297-57-76

Содержание диссертации, доктора биологических наук, Виноградов, Александр Евгеньевич

Введение.

Литературный обзор

Размер генома, конденсация хроматина и размер внутригеномных элементов.

Доля ГЦ-пар. физические свойства ДНК и конденсация хроматина: внутригеномная вариабельность.

Прогрессивная эволюция.

Факторы эволюции кодирующей ДНК.

Материалы и методы

1. Размер генома, доля ГЦ-пар и конденсация хроматина

Проточная цитометрия: размер генома и доля ГЦ-пар.

Проточная цитометрия: конденсация хроматина.

Интенсивность метаболизма

Другие данные.

2. Размер внутригеномных элементов.

3. Доля ГЦ-пар, физические свойства ДНК и конденсация хроматина: внутригеномная вариабельность.

4. Эволюция транскриптома и протеома.

Результаты и обсуждение

1. Размер генома, доля ГЦ-пар и конденсация хроматина

Размер генома и интенсивность метаболизма.

Размер генома и доля ГЦ-пар.

Другие работы по размеру генома.:.::.

Мембрано-зависимая конденсация хроматина.

Введение Диссертация по биологии, на тему "Функциональное значение базовых свойств структуры генома эукариот"

Формулировка проблемы. За короткое время цитология прошла путь от морфологических и физиологических исследований, проводимых исключительно на клеточном уровне, до клеточной биологии, имеющей дело с данными молекулярного уровня. При этом в какой-то степени потерялась целостность клетки, которая разбилась на множество частных молекулярных явлений, детально изучаемых по отдельности. В настоящее время, после появления различных "омик" (геномики, транскриптомики, протеомики, интерактомики и др.), начался обратный, интеграционный процесс. Возникла молекулярная биология систем, призванная связать "омиксные" данные вместе и представить, как функционирует клетка в целом. В последнее время возрастает также роль эволюционной биологии, которая даже становится базовой наукой для медицины (Nesse et al. 2010).

Одно из главных противоречий, которое возникает при сопоставлении молекулярного уровня с более высокими уровнями биологической организации, это явно адаптивный характер эволюции организмов и доминирование нейтралистских представлений в области молекулярной эволюции. (Возможно, это произошло в результате инерции тренда, возникшего при появлении нейтралистской точки зрения, а также потому, что легче увидеть шум, чем сигнал.)

Это противоречие является важным прежде всего потому, что естественный отбор предполагает функциональность, в то время как нейтральная эволюция в основном производит шум, затрудняющий выделение функциональных компонент. Нейтралистские интерпретаторы приходят к выводу, что даже увеличение сложности организмов и геномов (т.н. прогрессивная эволюция) происходит в результате ослабления естественного отбора и является просто следствием мутационного давления (напр., Lynch, Conery 2003; Koonin 2004). Другими словами, информация, необходимая для повышения уровня биологической организации, должна создаваться из шума без участия естественного отбора.1

В нашей работе сделан поиск функциональных объяснений базовых (системных, "омиксных") свойств структуры генома. Это позволит связать данные молекулярного уровня с результатами, полученными при исследовании более высоких уровней биологической организации. Актуальным является и то, что в нашей работе значительное внимание уделяется некодирующей ДНК, которая составляет большую часть генома эукариот и функция которой во многом остается загадочной.

Цель и задачи исследования. Цель работы: на основе полученных новых данных найти возможные функциональные объяснения базовым (системным) свойствам структуры генома эукариот (с акцентом на геном человека), которые интерпретировались в литературе как результат нейтральной эволюции. Задачи:

1) Изучить вариабельность размера генома и доли ГЦ-пар у наземных позвоночных, найти возможную связь с фенотипическими параметрами, которая предполагала бы адаптивное объяснение этой вариабельности.

2) Изучить особенности внутригеномной вариабельности количества некодирующей ДНК и доли ГЦ-пар, выяснить возможное функциональное значение этих параметров (на примере генома человека).

3) Выяснить связь размера генов (как интронной, так и кодирующей их части) и количества функциональных доменов в кодируемых ими белках с особенностями экспрессии генов (на примере генома человека).

4) Найти возможные признаки прогрессивной эволюции при сравнении транскриптомов человека и мыши. • ! ■

5) Выяснить роль различных факторов, влияющих на скорость эволюции белок- 1 кодирующей ДНК млекопитающих.

Литературный обзор

Размер генома, конденсация хроматина и размер внутригеномных элементов

Размер генома возрастает на основных этапах прогрессивной эволюции (увеличения сложности организмов): у бактерий количество ДНК" на клетку составляет 0.001-0.008 пкг, у дрожжей - 0.02-0.04 пкг, у беспозвоночных животных - 0.1-12 пкг, у позвоночных - 0.8-280 пкг (Rees, Jones 1972; Olmo 1983; Shuter et al. 1983). В другой эволюционной ветви, у высших растений содержание ДНК в клетке находится в пределах 0.4-180 пкг (Bennett, Leicht 1995). У вирусов размер генома снижается до 0.000001-0.00003 пкг ДНК (Rees, Jones 1972).

Однако после достижения определенного уровня организации (позвоночные, насекомые, сосудистые растения) размер генома перестает коррелировать со сложностью организма. Так, например, среди позвоночных наибольший размер генома наблюдается у хвостатых амфибий и двоякодышащих рыб (Olmo 1983; Gregory et al. 2007). Даже у бесхвостых амфибий геном в среднем больше, чем у амниот, а средний геном рептилий больше генома птиц (Olmo 1983). У дрозофилы, представителя одного из наиболее современных отрядов насекомых (двукрылых), размер генома намного меньше, чем у сверчка, принадлежащего к древнему отряду прямокрылых, и даже меньше, чем у некоторых кишечнополостных и полихет, т.е. представителей более примитивных типов животных (Rees, Jones 1972). У покрытосеменных растений размер генома в среднем не больше, чем у голосеменных (Bennett, Leicht 1995; Wakamiya et al. 1996; Gregory et al. 2007). Кроме того, размеры генома могут значительно различаться даже у филогенетически близких видов (Olmo 1983; Bennett, Leicht 1995; Wakamiya et al. 1996; Gregory et al. 2007). Эти факты позволяют говорить о парадоксе размера генома.

Вариабельность размера генома эукариот определяется в основном количеством некодирующей ДНК. Так например, геном дрожжей примерно на четыре порядка меньше генома некоторых растений, амфибий и двоякодышащих рыб, однако только меньше одного порядка этого различия может быть объяснено разницей в числе генов. Роль некодирующей ДНК, которая составляет более 98% генома человека (IHGSC 2001;Venter et al. 2001), остается неясной. Таким образом, даже в эпоху проектов тотального секвенирования геномов мы не знаем биологического смысла большей части получаемой при этом информации, и парадокс размера генома пока не решен.

Нейтралистское объяснение предполагает, что мутационное давление приводит к накоплению избыточной (redundant) некодирующей ДНК в геномах эукариот, просто "терпимому" (permissive) естественным отбором. Около тридцати лет назад была предложена гипотеза "эгоистичной ДНК", постулирующая, что накопление избыточной некодирующей ДНК в геноме эукариот может быть результатом активности "эгоистичных" внутри геномных мобильных элементов, ведущих себя как элементарные дарвиновские единицы (единицы отбора), просто "терпимые" отбором на уровне организмов (Doolittle, Sapienza 1980; Orgel, Crick 1980).

Другой возможный механизм, увеличивающий размер генома (и не постулирующий при этом функциональности некодирующей ДНК), может быть связан с тем фактом, что делеции требуют двух разрывов геномной последовательности (в отличие от инсерций, требующих только один). Поэтому делеции скорее могут затронуть функциональные участки генома, чем инсерции. В результате, стабилизирующий (purifying) отбор должен работать против делеций, и поэтому инсерции могут накапливаться в геноме быстрее, чем делеции (Petrov 2002).

Тем не менее, анализ крупномасштабных геномных выравниваний (alignment) между человеком и мышью показал, что большинство несовпадающих участков, которые не могут быть идентифицированы как инсерции мобильных элементов, представляют собой делеции в одном из геномов (Waterston et al. 2002; Hardison et al. 2003). Показано также, что по суммарному размеру такие делеции в мышином геноме соответствуют примерно 50% генома (Hardison et al. 2003).)Ч' Известно, что значительная часть генома человека (15-20%) создана инсерциями мобильных элементов, специфичными для приматов (Liu et al. 2003), и что аналогичные инсерции (т.е. специфичные для грызунов) были даже еще более активны в геноме мыши (Waterston et al. 2002). Разница в размере геномов мыши и человека только около 16% (Waterston et al. 2002). Поэтому можно предположить, что в геноме мыши после разделения с филогенетической линией, ведущей к приматам, суммарных делеций было значительно больше, чем на упомянутые выше 50% генома. Таким образом, эволюционная динамика делеций весьма значительна и может компенсировать процесс инсерций.

Динамика инсерций и делеций была детально изучена на примере межгенного промежутка генома дрозофилы (Singh, Petrov 2004). Была обнаружена большая эволюционная "текучесть" последовательности ДНК в этом межгенном промежутке. Длина промежутка сначала удлинилась за счет нескольких больших инсерций, но затем уменьшилась за счет множества мелких делеций, которые превалировали над мелкими инсерциями (Singh, Petrov 2004). Авторы интерпретировали эту динамику как результат нейтральной эволюции последовательности некодирующей ДНК.

Однако, следует заметить, что у близких видов в первую очередь изменяются паттерны экспрессии генов, а не кодируемые генами белки (Enard et al. 2002; Ranz et al. 2003). У видов рода дрозофила изменения в экспрессии особенно сильны в генах, связанных с полом (Ranz et al. 2003). Один из генов, прилегающих к упомянутому выше межгенному промежутку, как раз связан с полом. Ген с другой стороны это промежутка кодируется на противоположной цепи ДНК, и для обоих генов этот промежуток расположен перед началом транскрипции (где обычно и располагаются регуляторные элементы) (Singh, Petrov 2004). Поэтому можно предположить, что структурные изменения последовательности ДНК в этом межгенном промежутке были связаны с изменениями экспрессии прилежащих к нему генов и поэтому не были нейтральными.

Возможно, что существуют механизмы делеций, которые затрагивают преимущественно некодирующую ДНК. Такие делеции должны быть скорее "терпимы" отбором, чем те, которые затрагивают кодирующую часть генома. Неравная рекомбинация между двумя мобильными элементами, находящимися в одном и том же межгенном промежутке или интроне, может быть одним из таких механизмов, Существует много примеров неравной рекомбинации, направляемой мобильными элементами (Babcock et al. 2003; Bouneau et al. 2003; Read et al. 2004; Saitta et al. 2004; Salem et al. 2003). Было показано, что в культивируемых клетках млекопитающих ретротранспозоны LINE1 могут вызвать делеции намного большего размера (>70 тыс. п.н.), чем размеры самих LINE1 (~6 тыс. п.н.) (Gilbert et al. 2002). Авторы сделали вывод, что LINE1 могут участвовать в уменьшении размера генома (Gilbert et al. 2002). Интересно, что LINE1 обычно не встречаются в участках генома с высокой концентрацией генов (Medstrand et al. 2002). Поэтому можно сделать вывод, что делеции, направляемые ретротранспозонами LINE1, происходят преимущественно в некодирующей ДНК.

Но может ли избыточная некодирующая ДНК быть полезной для организма, т.е. выполнять какую-нибудь функцию? Известно, что размер генома связан с рядом фенотипических признаков. В первую очередь это увеличение размера ядра и уменьшение скорости роста и развития (Van't Ноf, Sparrow 1963; Bennett 1971, 1998; Cavalier-Smith 1978, 1985; Olmo 1983). Однако замедление роста и развития вряд ли можно считать адаптивным (в отличие от ускорения). Метафорически можно заметить, что не бывает соревнований под девизом "кто медленней пробежит дистанцию" (Vinogradov 2003а). Но замедление может быть связано с каким-то другим признаком, который является адаптивным. Поискам этого признака и была посвящена первая часть нашей работы. В литературе имелись данные лишь о некоторых частных явлениях у растений, которые можно рассматривать как адаптивные — повышенной устойчивости к засухе и холоду у видов с большим размером генома (Macgillivray, Grime 1995; Wakamiya et al. 1996).

С исторической точки зрения можно упомянуть также гипотезу "скелетной ДНК", которая предполагала, что избыточная некодирующая ДНК служит ядерным каркасом (Cavalier-Smith 1978, 1985). Однако впоследствии было установлено, что эту функцию выполняют специализированные белки и РНК-белковые комплексы (обзоры: Parnaik 2008; Albrethsen et al. 2009; Zhong et al. 2010).

Появление в геноме организмов избыточной некодирующей ДНК совпадает с возникновением эукариот. Основной проблемой генетического аппарата эукариот является управление работой большого количества генов. В первую очередь, это выключение генов, экспрессия которых не нужна в данной клетке. Это достигается путем конденсации ДНК с помощью белков с образованием хроматина. Можно предположить, что появление больших количеств некодирующей ДНК было связано с необходимостью репрессии генов. Известно, например, что длина линкерной ДНК, соединяющей нуклеосомы, возрастает при более плотной упаковке хроматина в клетках со сниженным уровнем синтеза РНК (Villeponteau et al. 1992; Blank, Becker 1996). Гетерохроматин, в состав которого входит в основном некодирующая ДНК, может оказывать репрессирующее влияние и на соседние участки эухроматина, содержащие гены (Holmquist 1989; Zuckerkandl, Hennig 1995).

С помощью биоинформатического анализа на довольно ограниченном наборе данных (около 200 генов) было показано, что потенциал формирования нуклеосом промоторной области выше в тканеспецифичных генах по сравнению с общеклеточными (Levitsky et al. 2001а). В контексте нашей работы следует отметить, что потенциал формирования нуклеосом основной массы ДНК (интронов, экзонов, межгенных промежутков) внутри и вокруг тканеспецифичных и общеклеточных генов при этом не сравнивался. Кроме того, ранее было показано, что потенциал формирования нуклеосом выше в интронах по сравнению с экзонами (Levitsky et al. 2001b). Однако при этом не было проведено статистического анализа, а приведенные авторами гистограммы потенциала формирования нуклеосом интронов и экзонов в основном перекрывались. В этих работах не была исследована связь потенциала формирования нуклеосом нуклеотидных последовательностей с долей ГЦ-пар в них.

Эволюция многоклеточных сопровождалась как сильным усложнением регуляции транскрипции, так и увеличением дистанции от данного гена, на которой могут находится регуляторные последовательности (Levine, Tjian 2003). Регуляторные элементы (промоторы, энхансеры, сайленсеры, инсуляторы) могут быть распределены в межгенных промежутках на расстояниях от регулируемого гена примерно до 10 тыс. п.н. в геноме дрозофилы и до 100 тыс. п.н. в геноме человека (Levine, Tjian 2003). Это различие (в 10 раз) хорошо согласуется с различием размеров генома между дрозофилой и человеком (для эухроматической части: 117 млн п.н. против 2910 млн п.н., соответственно), особенно если учесть, что у человека примерно в два раза больше генов, чем у дрозофилы. Необходимо также отметить, что в геноме дрожжей регуляторные элементы могут находится только до нескольких сот п.н. от регулируемого гена (Levine, Tjian 2003). Это различие в размерах потенциальной регуляторной области гена также хорошо согласуется с разницей размеров генома дрожжей и геномов вышеупомянугых многоклеточных (размер генома дрожжей - 12 млн п.н.).

Проблема взаимоотношения между размером генома, размером генов и сложностью их регуляции получила свое преломление в области функциональной геномики. Несколько лет назад в ведущих международных журналах почти одновременно были опубликованы три работы, в которых было показано, что активно и широко экспрессируемые гены человека короче, чем тканеспецифичные гены - как в кодирующей, так и в интронной последовательности (Castillo-Davis et al. 2002; Eisenberg, Levanon 2003; Urrutia, Hurst 2003). Поскольку транскрипция и трансляция энергетически затратны, это явление было интерпретировано как результат отбора на экономичность в активно экспрессируемых генах и • мутационного давления, увеличивающего размер слабо экспрессируемых генов.

Это объяснение подразумевает отсутствие связи между размером гена и его функциональной нагрузкой. Фактически, оно аналогично "пермиссивной" интерпретации вариабельности размера генома, т.к. предполагает, что избыточная ДНК просто "терпима" в генах с низким уровнем экспрессии. В нашей работе развивается альтернативная концепция, учитывающая функциональную нагрузку гена и сложность его регуляции.

Доля ГЦ-пар, физические свойства ДНК и конденсация хроматина: внутригеномная вариабельность

Геномы теплокровных имеют сильную внутригеномную вариабельность доли ГЦ-пар. Они состоят из т.н. изохор, т.е. участков ДНК размером >300 тыс. п.н., имеющих сходный ГЦ-состав (отличающийся от ГЦ-состава соседних изохор), которые определяют характерный хромосомный бэндинг (обзоры: Bernardi 2000, 2004; Eyre-Walker, Hurst 2001). Впервые изохоры были обнаружены по распределению сегментов ДНК при центрифугировании в градиенте хлористого цезия, поскольку ГЦ-богатая ДНК имеет более высокую плотность по сравнению с АТ-богатой (из-за третьей водородной связи). Поэтому ГЦ-богатые изохоры иногда называют "тяжелыми", а АТ-богатые - "легкими". Хотя ГЦ-богатые изохоры составляют только 10-15% генома млекопитающих, концентрация генов в наиболее "тяжелых" изохорах (НЗ) в 20 раз выше, чем в АТ-богатых изохорах (Bernardi 2000; D'Onofrio et al. 1999). Кодирующие последовательности "тяжелых" изохор имеют наиболее высокую долю ГЦ-пар, но интронные и межгенные последовательности также обогащены ГЦ-парами по сравнению с "легкими" изохорами (Clay et al. 1996; Alvarez-Valin et al. 1998; Musto et al. 1999).

До нашей работы в литературе имелись две основные интерпретации изохорной стуктуры геномов теплокровных. Нейтралистская интерпретация объясняла появление изохор внутригеномной вариацией мутационного давления (в широком смысле слова, включая генную конверсию) (Wolfe et al. 1989; Eyre-Walker 1994; Francino, Ochman 1999; Fryxell, Zuckerkandl 2000; Sueoka, Kawanishi 2000; Galtier et al. 2001; IHGSC 2001). Селекционистская гипотеза связывала появление более термоустойчивых ГЦ-богатых изохор с повышенной температурой тела теплокровных (D'Onofrio et al. 1999; Bernardi 2000).

Однако, гипотеза термоустойчивости не объясняет существование АТ-богатых изохор. Кроме того, не было обнаружено корреляции доли ГЦ-пар в геноме бактерий и холоднокровных позвоночных с температурой окружающей среды (Galtier, Lobry J.R. 1997; Hurst, Merchant 2001; Belle et al. 2002; Ream et al. 2003). С исторической точки зрения можно отметить также гипотезу, которая связывала вариабельность доли ГЦ-пар в геноме с использованием оптимальных для трансляции кодонов (D'Onofrio et al. 1999; Bernardi 2000). Однако она не объясняет, почему доля ГЦ-пар некодирующей ДНК (интронов и межгенных промежутков) коррелирует с долей ГЦ-пар кодирующих последовательностей.

К проблеме внутригеномной вариабельности доли ГЦ-пар имеет отношение и проблема островков (islands) повышенного содержания ЦфГ-динуклеотидов (в основном, в промоторной области генов и в интронах), которые обычно имеют и более высокую долю ГЦ-пар (Larsen et al. 1992; Ponger et al. 2001; Robinson et al.

2004; Yamashita et al. 2005). Эти островки, по-видимому, связаны с регуляцией экспрессии генов. Метилирование цитозина в островках ЦфГ-динуклеотидов приводит к подавлению экспрессии генов (Turker 2002; Yates et al. 2003; Fazzari, Greally 2004). Метилированный цитозин в ЦфГ-динуклеотидах может мутировать в тимин, поэтому концентрация ЦфГ-динуклеотидов в геномах позвоночных обычно ниже ожидаемой, исходя из доли ГЦ-riap (Fazzari, Greally 2004). Островками обычно называют такие участки генома, где отношение реальной концентрации ЦфГ-динуклеотидов к ожидаемой превышает 0.6 (а длина последовательности ДНК более 200 п.н.) (Larsen et al. 1992; Ponger et al. 2001; Robinson et al. 2004; Yamashita et al. 2005).

Каким образом островки ЦфГ-динуклеотидов участвуют в регуляции экспрессии генов пока непонятно. В данной работе мы исследовали возможность того, что связь между этими островками и регуляцией экспрессии осуществляется через влияние ЦфГ-динуклеотидов на степень конденсации хроматина.

Прогрессивная эволюция

Помимо расхождения в объяснении базовых свойств структуры генома (размера генов, сегментов некодирующей ДНК и доли ГЦ-пар), различие между нейтралистскими и адаптационистскими концепциями проявляется и в более глубоком, мировоззренческом аспекте — при выявлении причин увеличения сложности организмов (т.н. прогрессивной эволюции). Нейтралистские интерпретаторы приходят к выводу, что это увеличение происходит в результате ослабления отбора и является просто следствием мутационного давления (напр., Lynch, Conery 2003; Koonin 2004). Другими словами, информация, необходимая для повышения уровня биологической организации, должна создаваться из шума без участия отбора ("демона Максвелла"), что фактически противоречит второму закону термодинамики. ! iCi'

Прогрессивная эволюция представляет собой интригующее и, возможно, наиболее важное биологическое и социальное явление. Ее движущие силы и способы оценки уровня достигнутой в эволюции сложности до сих пор остаются предметом дебатов (Bonner 1998, 2004; McShea 1996; Szathmary et al. 2001; Wolfe 2001; Gould 2002). Одной из важнейших и давно признанных черт прогрессивной эволюции является увеличение "разделения труда" между элементами системы, сопровождающееся их специализацией (Smith 1776; Spencer 1891; Bonner 1988; McShea 1996; Gould 2002). В многоклеточных организмах это отражается в клеточной дифференцировке с соответствующим увеличением числа типов клеток в организме и появлением тканеспецифичных генов.

Однако, подсчет морфологически различимых клеточных типов довольно затруднителен и весьма неопределенен для высших многоклеточных организмов (Carroll 2001; Bonner 2004). Более того, могут существовать типы клеток, которые не различимы морфологически. Аналогично, не существует универсального (подходящего для всех типов клеток) индикатора степени дифференцированности клеток. Вероятно, такой индикатор нужно искать на молекулярном уровне, причем в "омиксном" масштабе данных.

Сравнение человек-мышь представляет собой идеальную модель для поиска молекулярных и клеточных механизмов, обеспечивающих различие в уровне организации, поскольку оба вида принадлежат к одному и тому же классу животных, т.е. имеют гомологичные ткани и много ортологичных генов. Мышь имеет более низкий уровень организации вследствие r-отбора (т.е. отбора на скорость размножения, а не на сложность организации, являющуюся результатом K-отбора; Larke, Crews 2006). Геномы обоих модельных видов хорошо изучены, для них имеются обширные данные по транскриптомам, полученные с помощью схожих микроэррэйных платформ. Кроме того, мышь является важной биомедицинской моделью, и полученные на ней данные часто переносятся на человека.

В нейтралистских анализах дело доходит до курьезов: например, авторы одного транскриптомного анализа пришли к выводу, что различия в паттернах генной экспрессии между гомологичными тканями человека и мыши — случайные (Yanai et al. 2004). Из этого должно следовать, что и различия в фенотипе между человеком и мышью - случайные.

Следует также отметить, что проблему возрастания уровня сложности биологической организации часто рассматривают вместе с проблемой увеличения размера генома. Так, например, была высказана нейтралистская гипотеза о том, что увеличение сложности геномов (вызываемое дупликацией сегментов генома и активностью мобильных элементов) является просто следствием уменьшения размеров популяций, связанным с увеличением размеров организмов (Lynch, Conery 2003). Уменьшение размеров популяций приводит к снижению интенсивности отбора и поэтому, по мнению авторов, влияние мутационного давления, увеличивающего размер генома, начинает превалировать над отбором.

Фактически в данной статье речь идет о размере генома (и анализируются данные именно по размеру генома). Однако, как уже было отмечено раньше (в разделе " Размер генома, конденсация хроматина и размер внутригеномных элементов"), размер генома коррелирует со сложностью организмов только до некоторой степени. У многих пойкилотермных организмов наблюдаются значительные различия размеров генома (в десятки и сотни процентов) даже в пределах рода (т.е. между близкими видами, которые не могут различаться уровнем организации).

Следует подчеркнуть, что ослабление отбора (т.е. усиление влияния стохастического мутационного давления) предлагается нейтралистами в качестве движущей силы как увеличения размера генома, так и возрастания сложности геномов (и организмов). I

Факторы эволюции кодирующей ДНК

Хотя белок-кодирующая ДНК составляет менее 2% генома человека (IHGSC 2001;Venter et al. 2001), она несомненно является наиболее важной его частью. Факторы, влияющие на скорость эволюции несинонимных позиций в кодирующей ДНК (т.е. белков), давно обсуждаются в молекулярной биологии (обзор: Koonin, Wolf 2006). Это проблема важна прежде всего потому, что выявление факторов, определяющих скорость эволюции, позволяет судить о том, какие факторы вообще влияют на эволюцию белков (и, таким образом, о причинах того, почему современные белки такие какие есть). В первую очередь, это вопрос о том, эволюционирует ли белок сам по себе, как это предполагалось в генетике "мешка с бобами" ('beanbag' genetics), или системные факторы являются определяющими? Дилемма генетики "мешка с бобами" и генетики системных факторов, восходящая еще к Дж.Холдейну и Э.Майру, обсуждается в работах: Crow (2001), Wilkins (2007), Heng (2008), Lakhotia (2008), Rao, Nanjundiah (2010).

По этому вопросу существуют противоречивые мнения. Парадоксально, но даже после возникновения биологии систем превалирующей остается нейтралистская точка зрения, согласно которой главным детерминантом скорости эволюции белка является уровень экспрессии кодирующего этот белок гена. Предполагается, что негативная связь между скоростью эволюции и уровнем экспрессии возникает в результате стабилизирующего (purifying) отбора против токсичности неправильно свертывающихся мутантных белков, который должен быть более сильным в случае более интенсивно экспрессирующихся генов (Drummond et al. 2006; Koonin, Wolf 2006; Kawahara, Imanishi 2007; Drummond, H; • Wilke 2008; Powers, Balch 2008).

Другими словами, предполагается, что эволюция белка определяется индивидуальным (по-генным) эффектом. Полагают, что остальные факторы играют второстепенную роль или даже что их эффект объясняется корреляцией с уровнем экспрессии гена (Drummond et al. 2006; Koonin, Wolf 2006; Hakes et al. 2007). Например, было высказано предположение, что близкие скорости эволюции белков, кодируемых ко-экспрессированными генами, объясняются сходством уровней экспрессии этих генов (Fraser et al. 2004; Hakes et al. 2007).

Материалы и методы

Заключение Диссертация по теме "Молекулярная биология", Виноградов, Александр Евгеньевич

Выводы

1) У наземных позвоночных существует негативная зависимость между размером генома и интенсивностью метаболизма (независимого от размера тела), предполагающая функциональное (адаптивное) значение некодирующей ДНК. У них обнаружены две линии регрессии интенсивности метаболизма на размер генома. Одна линия представлена млекопитающими и амфибиями, вторая (с более крутым наклоном) - птицами и рептилиями. У наземных позвоночных существуют также зависимости между размером генома и долей ГЦ-пар и между долей ГЦ-пар, потенциалом образования нуклеосом и размером клеточного ядра (т.е. конденсацией хроматина).

2) Гибкость и способность к B-Z переходу дуплекса ДНК увеличиваются при увеличении содержания ГЦ-пар быстрее, чем в рандомизированных последовательностях, а термостабильность — медленнее. Доля ГЦ-пар негативно коррелирует с потенциалом образования нуклеосом. Эти данные позволяют ■ отвергнуть имеющееся в литературе представление о том, что "тяжелые " (ГЦ-богатые) изохоры возникли в геноме теплокровных для обеспечения термостабильности молекулы ДНК, и предположить, что их возникновение связано с активацией транскрипции в этих участках генома.

3) Гены человека с промежуточной межтканевой широтой экспрессии (т.е. не тканеспецифичные и не общеклеточные) имеют наибольший размер (как интронной, так и кодирующей части), а кодируемые ими белки содержат наибольшее число функциональных доменов. Эти гены имеют наибольшую функциональную сложность на всех исследованных уровнях: в сетях белковых взаимодействий, биохимических путях, модулях, описываемых категориями Gene Ontology, группах генов, регулируемых определенными транскрипционными факторами, группах генов, кодирующих определенные функциональные белковые домены, группах "слов" аминокислотных последовательностей кодируемых белков и нуклеотидных последовательностей интронов и промоторных участков. На модулярном уровне (т.е. на уровне групп генов, связанных общей функцией) дихотомия общеклеточных и тканеспецифичных объектов выражена сильнее, чем на уровне отдельных генов. Предполагается, что именно сложность регуляции генов и генных модулей с промежуточной широтой экспрессии и привела к возникновению дихотомии общеклеточных и тканеспецифичных генов и модулей.

4) Для одного и того же набора гомологичных (ортологичных) генов и гомологичных тканей у человека больше доля тканеспецифичных генов и более высокое отношение экспрессии тканеспецифичных генов к экспрессии общеклеточных генов, чем у мыши. Гены, которые изменили межтканевую широту экспрессии, показывают также большую эволюционную дивергенцию нуклеотидной последовательности промоторных участков и аминокислотной последовательности кодируемых белков. Эти молекулярные данные показывают, что повышение уровня биологической организации связано с более высокой степенью специализации (дифферепцировки) клеток.

5) Скорость эволюции ко-экспрессированных генов, белков-интерактантов и белков, принадлежащих к одному и тому же биохимическому пути, является наиболее важным фактором, определяющим скорость эволюции белков млекопитающих. Другим важным фактором является сложность регуляции кодирующего белок гена. Белки, кодируемые более сложно-регулируемыми генами, эволюционируют медленней. Эти данные показывают, что системные факторы доминируют в эволюции белок-кодирующей ДНК млекопитающих.

6) Подводя общий итог, можно сделать вывод, что все исследованные в данной работе свойства генома (перечисленные в пунктах 1-5) имеют функциональное значение.

Библиография Диссертация по биологии, доктора биологических наук, Виноградов, Александр Евгеньевич, Санкт-Петербург

1. Виноградов А.Е. 1999. Парадокс размера генома и проблема избыточной ДНК. Цитология 41:5-13.

2. Виноградов А.Е., Розанов Ю.М., Гусев Е.В. 1990. Способ определения жизнеспособности клеток. Бюл. открытий и изобретений N 36, авторское свидетельство N 1596247.

3. Розанов Ю.М. 1988. Проточная цитометрия. В Сб. "Методы культивирования клеток". Л. "Наука", с. 136-146.

4. Affymetrix inc. 2004. GeneChip Expression Analysis. Data Analysis Fundamentals.

5. Albrethsen J., Knol J.C., Jimenez C.R. 2009. Unravelling the nuclear matrix proteome.,/. Proteomics 72: 71-81.

6. Allison D.C., Ridolpho P.F., Rasch E.M., Rasch R.W., Johnson T.S. 1981. Increased accuracy of absorption cytophotometric DNA values by control of stain intensity.,/. Histochem. Cytochem. 29: 1219-1228.

7. Altman P.L., Ditmer D.S. 1974. Biology Data Book, vol. Ill, pp. 137-139. Federation of American Societies for Experimental Biology. Bethesda, Md.

8. Alvarez-Valin F., Jabbari K., Bernardi G. 1998. Synonymous and nonsynonymous substitutions in mammalian genes: intragenic correlations. J. Mol. Evol. 46, 37-44.

9. Andrews C.B., Mackenzie S.A., Gregory T.R. 2009. Genome size and wing parameters in passerine birds. Proc. Roy. Soc. B. 276: 55-61.

10. Anselmi C., Bocchinfuso G., De Santis P., Savino M., Scipioni A. 1999. Dual role of DNA intrinsic curvature and flexibility in determining nucleosome stability. J. Mol. Biol. 286: 1293-1301.

11. Anselmi C., Bocchinfuso G., De Santis P., Savino M., Scipioni A. 2000. A theoretical model for the prediction of sequence-dependent nucleosome thermodynamic stability. Biophys. J. 79: 601-613.

12. Babcock M., Pavlicek A., Spiteri E., Kashork C.D., Ioshikhes I., Shaffer L.G., Jurka J., Morrow B.E. 2003. Shuffling of genes within low-copy repeats on 22ql 1 (LCR22) by Alu-mediated recombination events during evolution. Genome Res. 13: 2519-2532.

13. Bachmann K. 1970. Feulgen slope determinations of urodele nuclear DNA amounts. Histochemistry 22: 289-293.

14. Bancaud A., Huet S., Daigle N., Mozziconacci J., Beaudouin J., Ellenberg J. 2009. Molecular crowding affects diffusion and binding of nuclear proteins in heterochromatin and reveals the fractal organization of chromatin. EMBO J. 28: 37853798.

15. Belle E.M., Smith N., Eyre-Walker A. 2002. Analysis of the phylogenetic distribution of isochores in vertebrates and a test of the thermal stability hypothesis. J. Mol. Evol. 55: 356-363.

16. Benhamouche S., Decaens Т., Godard C., Chambrey R., Rickman D.S., Moinard C., Vasseur-Cognet M., Kuo C.J., Kahn A., Perret C., Colnot S. 2006. Ape tumor suppressor gene is the "zonation-keeper" of mouse liver. Dev. Cell 10: 759-770.

17. Bennett M.D. 1971. The duration of meiosis. Proc. Roy. Soc. Lond. В 178: 277-299.

18. Bennett M.D. 1987. Variation in genomic form in plants and its ecological implications. New Phytologist 106 (Suppl.): 177-200.

19. Bennett M.D., Leicht I.J. 1995. Nuclear DNA amount in Angiosperms. Ann. Bot. 76: 113176.

20. Bennett P.M., Harvey P.H. 1987. Active and resting metabolism in birds: allometry, phylogeny and ecology. J. Zool. 213: 327-363.

21. Bennetzen J.L., Hall B.D. 1982. Codon selection in yeast. J. Biol. Chem. 257: 3026-3031.

22. Bensasson D., Petrov D.A., Zhang D.X., Hartl D.L., Hewitt G.M. 2001. Genomicgigantism: DNA loss is slow in mountain grasshoppers. Mol. Biol. Evol. 18: 246-253.

23. Benton M.J. 2009. The Red Queen and the Court Jester: species diversity and the role of biotic and abiotic factors through time. Science 323: 728-732.

24. Bernardi G. 2000. Isochores and the evolutionary genomics of vertebrates. Gene 241: 3-17.

25. Bernard! G. 2004. Structural and Evolutionary Genomics. Natural Selection in Genome Evolution. Elsevier, Amsterdam.

26. Bernardi G., Bernardi G. 1990. Compositional patterns in the nuclear genome of coldblooded vertebrates. J. Mol. Evol. 31: 265-281.

27. Bird A.P. 1995. Gene number, noise reduction and biological complexity. Trends Genet. 11: 94-100.

28. Bishop C.M. 1997. Heart mass and the maximum cardiac output of birds and mammals: implications for estimating the maximum aerobic power input of flying animals. Phil. Trans. R. Soc. B 352:447^156.

29. Bishop C.M. 1999. The maximum oxygen consumption and aerobic scope of birds and mammals: getting to the heart of the matter. Proc. R. Soc. B 266: 2275-2281.

30. Bishop C.M. 2005. Circulatory variables and the flight performance of birds. J. Exp: Biol. 208: 1695-1708.

31. Bishop C.M., Butler P.J. 1995. Physiological modeling of oxygen consumption in birds during flight. J. Exp. Biol. 198:2153-2163.

32. Blank T.A., Becker P.B. 1996. The effect of nucleosome phasing sequences and DNA topology on nucleosome spacing. J. Mol. Biol. 260: 1-8.

33. Bonner J.T. 1988. The evolution of complexity. Princeton Univ. Press, Princeton, NJ.

34. Bonner J.T. 2004. Perspective: the size-complexity rule. Evolution 58: 1883-1890.

35. Braeuning A., Ittrich C., Köhle C., Haiiflnger S., Bonin M., Buchmann A., Schwarz M. 2006. Differential gene expression in periportal and perivenous mouse hepatocytes. FEBSJ. 273: 5051-5061.

36. Cao H., Widlund H.R., Simonsson T., Kubista M. 1998. TGGA repeats impair nucleosome formation. J. Mol. Biol. 281: 253-260.

37. Carroll S.B. 2001. Chance and necessity: the evolution of morphological complexity and diversity. Nature 409: 1102-1109.

38. Castillo-Davis C.I. Mekhedov S.L., Hartl D.L., Koonin E.V., Kondrashov F.A. 2002. Selection for short introns in highly expressed genes. Nature Genet. 31: 415-418.

39. Cavalier-Smith T. 1978. Nuclear volume control by nucleoskeletal DNA, selection' for cell volume and cell growth rate, and the solution of the DNA C-value paradox. J. Cell Sei. 34: 247-278.

40. Cavalier-Smith T. 1985. Cell volume and the evolution of eukaryote genome size. In: Cavalier-Smith T (ed) The Evolution of Genome Size. John Wiley Sons, Chichester, pp. 105-184.

41. Chamary J.V., Parmley J.L., Hurst L.D. 2006. Hearing silence: non-neutral evolution at synonymous sites in mammals. Nat. Rev. Genet. 7: 98-108.

42. Chapman M. G. 1995. Spatial patterns of shell shape of three species of co-existing littorinid snails in New South Wales, Australia. J. Molluscan Stud. 61: 141-162.

43. Chappell M.A., Bech C., Buttemer W.A. 1999. The relationship of central and peripheral organ masses to aerobic performance variation in house sparrows. J. Exp. Biol. 202: 2269-2279.

44. Chiapello H., Lisacek F., Caboche M., Henaut A. 1998. Codon usage and gene function are related in sequences of Arabidopsis thaliana. Gene 209: GC1-GC38.

45. Churbanov A., Rogozin I.B., Babenko V.N., Ali H., Koonin E.V. 2005. Evolutionary conservation suggests a regulatory function of AUG triplets in 5'-UTRs of eukaryotic genes. Nucleic Acids Res. 33: 5512-5520.

46. Clark A.J. 1927. Comparative physiology of the heart. New York: Macmillan.

47. Clay O., Caccio S., Zoubak S., Mouchiroud D., Bernardi G. 1996. Human coding and noncoding DNA: compositional correlations. Mol. Phylogenet. Evol. 5: 2-12.

48. Cohen-Gihon I., Lancet D., Yanai I. 2005. Modular genes with metazoan-specifíc domains have increased tissue specificity. Trends Genet. 21: 210-213.

49. Conley K.E., Christian K.A., Hoppeler H., Weibel E.R. 1989. Capillary and mitochondrial unit in muscles of a large lizard. Am. J. Physiol. 256: R982-R988.

50. Conley K.E., Christian K.A., Hoppeler H., Weibel E.R. 1995. Heart mitochondrialproperties and aerobic capacity are similarly related in a mammal and a reptile. J. Exp Biol. 198: 739-746.

51. Constable P., Hinchcliff K., Demma N., Callahan M., Dale B„ Fox K., Adams L., Wack R., Kramer L. 1998. Electrocardiographic consequences of a peripatetic lifestyle in gray wolves Canis lupus. Comp. Biochem. Physiol. A Mol. Integr. Physiol. 120: 557563.

52. Crile, G., Quiring, D.P. 1940 A record of the body weight and certain organ and gland weights of 3690 animals. The Ohio Journal of Science 40: 219-285.

53. Croft D., O'Kelly G., Wu G., Haw R., Gillespie M., Matthews L., Caudy M., Garapati P., Gopinath G., Jassal B., et al. 2011. Reactome: a database of reactions, pathways and biological processes. Nucleic Acids Res. 39: D691- D697.

54. Crow J.F. 2001. The beanbag lives on. Nature 409: 771.

55. Daan S., MasmanD., Groenewold A. 1990. Avian basal metabolic rates: their association with body composition and energy expenditure in nature. Am. J. Physiol. 259: R333-R340.

56. D'Onofrio G., Jabbari K., Musto H., Alvarez-Valin F., Cruveiller S., Bernardi G. 1999. Evolutionary genomics of vertebrates and its implications. Ann. N.Y. Acad. Sci. 870: 81-94.

57. Doolittle W.F., Sapienza C. 1980. Selfish genes, the phenotype paradigm and genome evolution. Nature 284: 601-603.

58. Drummond D.A., Raval A., Wilke C.O. 2006. A single determinant dominates the rate of yeast protein evolution. Mol. Biol. Evol. 23: 327-337.

59. Drummond D.A., Wilke C.O. 2008. Mistranslation-induced protein misfolding as a dominant constraint on coding-sequence evolution. Cell 134: 341-352.

60. Eisenberg E., Levanon E.Y. 2003. Human housekeeping genes are compact. Trends Genet. 19: 362-365.

61. ElgarM.A., Harvey P.H. 1987. Basal metabolic rates in mammals: allometry, phylogeny and ecology. Functional Ecology 1: 25-36.

62. Eyre-Walker A. 1994. DNA mismatch repair and synonymous codon evolution in mammals. Mol. Biol. Evol. 11: 88-98.

63. Eyre-Walker A., Hurst L.D. 2001. The evolution of isochores. Nat. Rev. Genet. 2: 549555.

64. Fan K., Wang W. 2003. What is the minimum number of letters required to fold a protein? J. Mol. Biol. 328: 921-926.

65. Fazzari M.J., Greally J.M. 2004. Epigenomics: beyond CpG islands. Nat. Rev. Genet. 5: 446-455.

66. Francino M.P., Ochman H. 1999. Isochores result from mutation not selection. Nature 400: 30-31.

67. Fraser H.B., Hirsh A.E., Wall D.P., Eisen M.B. 2004. Coevolution of gene expression among interacting proteins. Proc. Natl. Acad. Sci. USA 101: 9033-9038.

68. Fryxell K.J., Zuckerkandl E. 2000. Cytosine deamination plays a primary role in the evolution of mammalian isochores. Mol. Biol. Evol. 17: 1371-1383.

69. Fudge D.S., Ballantyne J.S., Stevens E.D. 2001. A test of biochemical symmorphosis in a heterothermic tissue: bluefin tuna white muscle. Am. J. Physiol. Regul. Integr. Comp. Physiol. 280: R108-R114.

70. Funke R.P., Kolchinsky A., Gresshoff P.M. 1993. Physical mapping of a region in the soybean (Glycine max) genome containing duplicated sequences. Plant Mol. Biol. 22: 437-446.

71. Gabrielian A., Pongor S. 1996. Correlation of intrinsic DNA curvature with DNA property periodicity. FEBSLet. 393: 65-68.

72. Galtier N., Lobry J.R. 1997. Relationships between genomic G+C content, RNA secondary structures, and optimal growth temperature in prokaryotes. J. Mol. Evol. 44: 632-636.

73. Galtier N., Piganeau G., Mouchiroud D., Duret L. 2001. GC-content evolution inmammalian genomes, the biased gene conversion hypothesis. Genetics 159: 907-911.

74. Garland T. Jr. 1984. Physiological correlates of locomotory performance in a lizard: an allometric approach. Am. J. Physiol. 247: R806-R815.

75. Gebauer F., Hentze M.W. 2004. Molecular mechanisms of translational control. Nat. Rev. Mol. Cell Biol. 5: 827-835.

76. Gene Ontology Consortium. 2010. The Gene Ontology in 2010: extensions and refinements. Nucleic Acids Res. 38: D331-D335.

77. Gilbert N., Lutz-Prigge S., Moran J.V. 2002. Genomic deletions created upon LINE-1 retrotransposition. Cell 110: 315-325.

78. Goffeau A., Barrell B.G., Bussey H., Davis R.W., Dujon B., Feldmann R, Galibert F., Hoheisel J.D., Jacq C., et al. 1996. Life with 6000 genes. Science 274: 546-567.

79. Goodsell D.S., Dickerson R.E. 1994. Bending and curvature calculations in B-DNA. Nucleic Acids Res. 22: 5497-5503.

80. Gould S J. 2002. The Structure of Evolutionary Theory. Harvard University Press, Cambridge, Massachusetts.

81. Green J.A. 2010. The heart rate method for estimating metabolic rate: Review andrecommendations. Comp. Biochem. Physiol. A Mol. Integr. Physiol. Epub ahead of print. PMID: 20869457.

82. Gregory T.R. 2002. A bird's-eye view of the C-value enigma: genome size, cell size, and metabolic rate in the class Aves. Evolution 56: 121-130.

83. Gregory T.R., Andrews C.B., McGuire J.A., Witt C.C. 2009. The smallest avian genomes are found in hummingbirds. Proc. Roy. Soc. B. 276: 3753-3757.

84. Gregory T.R., Nicol J.A., Tamm H., Kullman B., Kullman K., Leitch I.J., Murray B.G., Kapraun D.F., Greilhuber J., Bennett M.D. 2007. Eukaryotic genome size databases. Nucleic Acids Res. 35: D332-D338.

85. Grime, J. P., Shacklock J. M. L., Band S. R. 1985. Nuclear DNA contents, shoot phenology and species coexistence in a limestone grassland community. New Phytologist 100: 435-445.

86. Hakes L., Lovell S.C., Oliver S.G., Robertson D.L. 2007. Specificity in proteininteractions and its relationship with sequence diversity and coevolution. Proc. Natl. Acad. Sci. USA 104: 7999-8004.

87. Hammond K.A, Diamond J. 1997. Maximal sustained energy budgets in human and animals. Nature 386: 457-462.

88. Hartman, F.A. 1955. Heart weight in birds. Condor 57: 221-234.

89. Heath D.J. 1975. Colour, sunlight and internal temperatures of the land snail Cepaea nemoralis (L.). Oecologia 19: 29-38.

90. Heng H.H. 2008. The gene-centric concept: a new liability? Bioessays 30: 196-197.

91. Herbert A., Rich A. 1996. The biology of left-handed Z-DNA. J. Biol. Chem. 21V. \ 159511598.

92. Herbert A., Rich A. 1999. Left-handed Z-DNA, structure and function. Geneiica 106: 3747.

93. Hoffman J., Katz U. 1997. Salt and water balance in the toad Bufo viridis during recovery from two different osmotically stressful conditions. Comp. Biochem. Physiol. A 111: 147-154.

94. Holmquist G.P. 1989. Evolution of chromosome bands: molecular ecology of noncoding DNA. J. Mol. Evol. 28: 469-486.

95. Hoppeler H., Mathieu O., Krauer R., Claassen H., Armstrong R.B., Weibel E.R. 1981. Design of the mammalian respiratory system. VI Distribution of mitochondria and capillaries in various muscles. Respir. Physiol. 44: 87-111.

96. Hoppeler H., Weibel E.R. 1998. Limits for oxygen and substrate transport in mammals. J. Exp. Biol. 201: 1051-1064.

97. Hoppeler H., Weibel E.R. 2000. Structural and functional limits for oxygen supply to muscle. Acta Physiol. Scand. 168: 445-456.

98. Hunter S., Apweiler R., Attwood T.K., Bairoch A., Bateman A., Binns D., Bork P., Das U., Daugherty L., Duquenne L., et al. 2009. InterPro: the integrative protein signature database. Nucleic Acids Res. 37: D211-D215.

99. Hurst L.D. 1995. Evolutionary genetics. The silence of the genes. Curr. Biol. 5: 459-461.

100. Hurst L.D., Merchant A.R. 2001. High guanine-cytosine content is not an adaptation to high temperature, a comparative analysis amongst prokaryotes. Proc. R. Soc. B 268: 493-497.

101. James J. 1972. DNA constancy and chromatin structure in some cell nuclei of Amphiuma. Histochem. J. 4: 181-192 .

102. Jurka J. 2000. Repbase update, a database and an electronic journal of repetitive elements. Trends Genet. 16: 418-420.

103. Jurka J., Kapitonov V.V., Pavlicek A., Klonowski P., Kohany O., Walichiewicz J. 2005. Repbase Update, a database of eukaiyotic repetitive elements. Cytogenet. Genome Res. 110: 462-467.

104. Kanehisa M., Araki M., Goto S., Hattori M., Hirakavva M., Itoh M., Katayama T., Kawashima S., Okuda S., Tokimatsu T., Yamanishi Y. 2008. KEGG for linking genomes to life and the environment. Nucleic Acids Res. 36: D480- D484.

105. Karlin S., Mrazek J. 1996. What drives codon choices in human genes? J. Mol. Biol. 262: 459-72.

106. Kato H., Harada M., Tsuchiya K., Moriwaki K. 1980. Absence of correlation between DNA repair in ultraviolet irradiated mammalian cells and life span of the donor species. Japan J. Genet. 55: 99-108.

107. Kawahara Y., Imanishi T. 2007 A genome-wide survey of changes in protein evolutionary rates across four closely related species of Saccharomyces sensu stricto group. BMC Evol. Biol. 7: 9.

108. Keightley P.D., Gaffney D.J. 2003. Functional constraints and frequency of deleterious mutations in noncoding DNA of rodents. Proc. Natl. Acad. Sci. USA 100: 13402-13406.

109. Kim C., Rubin C.M., Schmid C.W. 2001. Genome-wide chromatin remodeling modulates the Alu heat shock response. Gene 276: 127-133.

110. Kimchi-Sarfaty C., Oh J.M., Kim I.W., Sauna Z.E., Calcagno A.M., Ambudkar S.V.,

111. Gottesman M.M. 2007. A "silent" polymorphism in the MDR1 gene changes substrate specificity. Science 315: 525-528.

112. Kindler S., Wang H., Richter D., Tiedge H. 2005. RNA transport and local control of translation. Annu. Rev. Cell Dev. Biol. 21: 223-245.

113. Knoll A.H. 1992. The early evolution of eukaryotes: a geological perspective. Science 256: 622-627.

114. Koonin E.V. 2004. A non-adaptationist perspective on evolution of genomic complexity or the continued dethroning of man. Cell Cycle 3: 280-285.

115. Koonin E.V., Wolf Y.I. 2006. Evolutionary systems biology: links between gene evolution and function. Curr. Opin. Biotechnol. 17: 481-487.

116. Nucleosome formation potential of exons, introns, and Alu repeats. Bioinformatics 17: 1062-1064.

117. T., Fan K., Wang J., Wang W. 2003. Reduction of protein sequence complexity by residue grouping. Protein Eng. 16: 323-330.

118. Macgillivray C.W., Grime J.P. 1995. Genome size predicts frost resistance in British herbaceous plants: implications for rates of vegetation response to global warming. Functional Ecology 9: 320-325.

119. Machida N., Aohagi Y. 2001. Electrocardiography, heart rates, and heart weights of free-living birds. J. Zoo Wildl. Med. 32: 47-54.

120. Majewski J., Ott J. 2002. Distribution and characterization of regulatory elements in the human genome. Genome Res. 12: 1827-36.

121. Mattick J.S., Gagen M.J. 2005. Accelerating networks. Science 307: 856-858.

122. McAdams H.H., Arkin A. 1999. It's a noisy business! Genetic regulation at the nanomolar scale. Trends Genet. 15: 65-69.

123. McKean, T., Li, G. and Wei, K. 2002 Cardiac effects of hypoxia in theneotenous tiger salamander Ambystoma tigrinum. J. Exp. Biol. 205, 17251734.

124. McNab B.K. 1988. Complications inherent in scaling the basal rate of metabolism in mammals. O. Rev. Biol. 63: 25-54.

125. McShea D.W. 1996. Metazoan complexity and evolution: Is there a trend? Evolution 50: 477-492.

126. McShea D.W. 2001. The hierarchical structure of organisms: a scale and documentation of a trend in the maximum. Paleobiology 27: 405-423.

127. Medstrand P., van de Lagemaat L.N., Mager D.L. 2002. Retroelement distributions in the human genome: variations associated with age and proximity to genes. Genome Res. 12: 1483-1495.

128. Meerlo P., Bolle L., Visser G.H, Masman D., Daan S. 1997. Basal metabolic rate inrelation to body composition and daily energy expenditure in the field vole, Microtus agrestis. Physiol. Zool. 70: 362—369.

129. Mignone F., Gissi C., Liuni S., Pesole G. 2002. Untranslated regions of mRNAs. Genome Biol. 3: REVIEWS0004.

130. Mohd-Sarip A., Verrijzer C.P. 2004. A higher order of silence. Science 306: 1484-1485.

131. Morris C.K., Froelicher V.F. 1991. Cardiovascular benefits of physical activity. Herz 16: 222-236.

132. Munteanu M.G., Vlahovicek K., Parthasarathy S., Simon I., Pongor S. 1998. Rod models of DNA, sequence-dependent anisotropic elastic modelling of local bending phenomena. 775523: 341-347.

133. Musto H., Romero H., Zavala A., Bernardi G., 1999. Compositional correlations in the chicken genome. J. Mol. Evol. 49: 325-329. 1 1'

134. Nemeth A., Langst G. 2004. Chromatin higher order structure: opening up chromatin for transcription. Brief. Fimct. Genomics Proteomics 2: 334-343.

135. Olmo E. 1983. Nucleotype and cell size in vertebrates: a review. Basic Appl. Histochem. 27: 227-254.

136. Organ C.L., Brusatte S.L, Stein K. 2009. Sauropod dinosaurs evolved moderately sized genomes unrelated to body size. Proc. Roy. Soc. B. 276: 4303-4308.

137. Orgel L.E., Crick F.H. 1980. Selfish DNA: the ultimate parasite. Nature 284: 604-607.

138. Parnaik V.K. 2008. Role of nuclear lamins in nuclear organization, cellular signaling, and inherited diseases. Int. Rev. Cell Mol. Biol. 266: 157-206.

139. Petrov D.A. 2002. Mutational equilibrium model of genome size evolution. Theor. Popul. Biol. 61: 531-544.

140. Petrov D.A., Sangster T.A., Johnston J.S., Hartl D.L., Shaw K.L. 2000. Evidence for DNA loss as a determinant of genome size. Science 287: 1060-1062.

141. Poirier M.G. M.G., Oh E., Tims H.S., Widom J. 2009. Dynamics and function of compact nucleosome arrays. Nat. Struct. Mol. Biol. 16: 938-944.

142. Poirier M.G., Bussiek M., Langowski J., Widom J. 2008. Spontaneous access to DNA target sites in folded chromatin fibers. J. Mol. Biol. 379: 772-786.

143. Ponger, L., Duret L., Mouchiroud D. 2001. Determinants of CpG islands: expression in early embryo and isochore structure. Genome Res. 11:1854 -1860.

144. Powers E.T., Balch W.E. 2008. Costly mistakes: translational infidelity and protein homeostasis. Cell 134: 204-206.

145. Prosperi E., Giangare M.C., Supino R., Bottiroli G. 1990. Flow cytometric evaluation of DNA digestion with micrococcal nuclease on isolated HeLa nuclei. J. Microsc. 159: 255-263.

146. Rangarajan A., Hong S.J., Gifford A., Weinberg R.A. 2004. Species- and cell type-specific requirements for cellular transformation. Cancer Cell 6: 171-183.

147. Rangarajan A., Weinberg R.A. 2003. Comparative biology of mouse versus human cells: modelling human cancer in mice. Nat. Rev. Cancer 3: 952-959.

148. Ranz J.M., Castillo-Davis C.I., Meiklejohn C.D., Hartl D.L. 2003. Sex-dependent gene expression and evolution of the Drosophila transcriptome. Science 300: 1742-1745.

149. Rao V., Nanjundiah V. 2010. J. B.S. Haldane, Ernst Mayr and the Beanbag Genetics Dispute. J. Hist. Biol. Epub ahead of print. PMID: 20665094.

150. Rasch E.M. 1985. DNA "standards" and the range of accurate DNA estimates by Feulgen absorption microspectrophotometry. In: Advances in Microscopy, Cowden RR, Harrison FW (eds). A. R. Liss, New York, pp. 137-166.

151. Read L.R., Raynard S.J., Ruksc A., Baker M.D. 2004. Gene repeat expansion and contraction by spontaneous intrachromosomal homologous recombination in mammalian cells. Nucleic Acids Res. 32: 1184-1196.

152. Ream R.A., Johns G.C., Somero G.N. 2003. Base compositions of genes encoding alpha-actin and lactate dehydrogenase-A from differently adapted vertebrates show no temperature-adaptive variation in G+C content. Mol. Biol. Evol. 20: 105-110.

153. Redi C.A., Garagna S., Zuccotti M., Capanna E. 2007. Genome size: a novel genomic signature in support of Afrotheria. J. Mol. Evol. 64: 484-748.

154. Rees H., Jones R.N. 1972. The origin of the wide species variation in nuclear DNA content. Int. Rev. Cytol. 32: 53-92.

155. Richter J.D., Sonenberg N. 2005. Regulation of cap-dependent translation by eIF4E inhibitory proteins. Nature 433: 477-480.

156. Robinson P.N., Böhme U., Lopez R., Mundlos S., Nürnberg P. 2004. Gene-Ontology analysis reveals association of tissue-specific 5' CpG-island genes with development and embryogenesis. Hum. Mol. Genet. 13: 1969-1978.

157. Roti Roti J.L., Wright W.D., Higashikubo R., Dethlefsen L.A. 1985. DNase I sensitivity of nuclear DNA measured by flow cytometry. Cytometry 6: 101-108.

158. Roy S.W., Fedorov A., Gilbert W. 2003. Large-scale comparison of intron positions in mammalian genes shows intron loss but no gain. Proc. Natl. Acad. Sei. USA 100: 7158-7162.

159. Rubidge B.S., Sidor C.A. 2001. Evolutionary patterns among Permo-Triassic therapsids. Ann. Rev. Ecol. Syst. 32: 449-480.

160. Russell P., Nurse P. 1986. Schizosaccharomyces pombe and Saccharomyccs cerevisiae: a look at yeasts divided. Cell AS: 781-782.

161. Ruta M., Coates M.I., Quicke D.L. 2003. Early tetrapod relationships revisited. Biol. Rev. Comb. Philos. Soc. 78: 251-345.

162. Saitta S.C., Harris S.E., Gaeth A.P., Driscoll D.A., McDonald-McGinn D.M.,

163. Maisenbacher M.K., Yersak J.M., Chakraborty P.K., Hacker A.M., Zackai E.H., Ashley T., Emanuel B.S. 2004. Aberrant interchromosomal exchanges are the predominant cause of the 22ql 1.2 deletion. Hum. Mol. Genet. 13: 417-428.

164. Salem A.H., Kilroy G.E., Watkins W.S., Jorde L.B., Batzer M.A. 2003. Recentlyintegrated Alu elements and human genomic diversity. Mol. Biol. Evol. 20: 1349-1361.

165. SantaLucia J Jr. 1998. A unified view of polymer, dumbbell, and oligonucleotide DNA nearest-neighbor thermodynamics. Proc. Natl. Acad. Sci. USA. 95: 1460-1465.

166. Sayers E.W., Barrett T., Benson D.A., Bolton E., Bryant S.H., Canese K., Chetvernin V., Church D.M., Dicuccio M., Federhen S., et al. 2010. Database resources of the National Center for Biotechnology Information. Nucleic Acids Res. 38: D5-D16.

167. Schug J., Schuller W.P., Kappen C., Salbaum J.M., Bucan M., Stoeckert C.J. Jr. 2005. Promoter features related to tissue specificity as measured by Shannon entropy. Genome Biol. 6: R33.

168. Secor S.M., Faulkner A.C. 2002 Effects of meal size, meal type, bodytemperature, and body size on the specific dynamic action of the marine toad, Bufo marius. Physiol. Biochem. Zool. 75: 557-571.

169. Sharp P.M., Averof M., Lloyd A.T., Matassi G., Peden J.F. 1995. DNA sequenceevolution: the sounds of silence. Philos. Trans. R. Soc. Lond. B Biol. Sci. 349: 241247.

170. Sharp P.M., Li W.H. 1987. The codon adaptation index a measure of directionalsynonymous codon usage bias, and its potential applications. Nucl. Acids Res. 15: 1281-1295.

171. Shpun S., Hoffman J., Katz U. 1992. Anuran amphibia which are not acclimable to high salt, tolerate high plasma urea. Comp. Biochem. Physiol. A 103: 473-477.

172. Shuter B.J., Thomas J.E., Taylor W.D., Zimmerman A.M. 1983. Phenotypic correlates of genomic DNA content in unicellular eukaryotes and other cells. Amer. Natur. 122: 2644.

173. Singh N.D., Petrov D.A. 2004. Rapid sequence turnover at an intergenic locus in Drosophila. Mol. Biol. Evol. 21: 670-680.

174. Smith A. 1776. The Wealth of Nations. Edinburgh.

175. Spencer H. 1891. Essays: Scientific, Political, and Speculative. Vol. 1. Williams and Norgate, London.

176. Storey J.D., Tibshirani R. 2003. Statistical significance for genomewide studies. Proc. Natl. Acad. Sci. USA 100: 9440-9445.

177. Subramanian A., Kuehn H., Gould J., Tamayo P., Mesirov J.P. 2007. GSEA-P: a desktop application for Gene Set Enrichment Analysis. Bioinformatics 23: 3251-3253.

178. Sueoka N., Kawanishi Y. 2000. DNA G+C content of the third codon position and codon usage biases of human genes. Gene 261: 53-62.

179. Sugimoto N., Nakano S., Katoh M., Matsumura A., Nakamuta PI., Ohmichi T., Yoneyama M., Sasaki M. 1995. Thermodynamic parameters to predict stability of RNA/DNA hybrid duplexes. Biochemistry 34: 11211-1216.

180. Suzuki Y., Yamashita R., Sugano S., Nakai K. 2004. DBTSS, DataBase of Transcriptional Start Sites: progress report 2004. Nucleic Acids Res. 32: D78-D81.

181. Szathmary E., Jordan F., Pal C. 2001. Can genes explain biological complexity? Science 292: 1315-1316.

182. Takhtajan A.L. 1980. Outline of the classification of flowering plants (Magnoliophyta). Botanical Reviews 46: 225-359.

183. Taylor C.R., Karas R.H., Weibel E.R., Hoppeler FI. 1987. Adaptive variation in themammalian respiratory system in relation to energetic demand. Respir. Physiol. 69: 1127.

184. Taylor C.R., Maloiy G.M., Weibel E.R., Langman V.A., Kamau J.M., Seeherman PI.J., Heglund N.C. 1981. Design of the mammalian respiratory system. Ill Scaling maximum aerobic capacity to body mass: wild and domestic mammals. Respir. Physiol. 44: 25-37.

185. Taylor C.R., Weibel E.R., Weber J.M., Vock R., Hoppeler H., Roberts T. J., Brichon G. 1996. Design of the oxygen and substrate pathways. I. Model and strategy to test symmorphosis in a network structure. J. Exp. Biol. 199: 1643-1649.

186. Thiery J.P., Macaya G., Bernardi G. 1976. An analysis of eucaryotic genomes by density gradient centrifugation. J. Mol. Biol. 108: 219-235.

187. Tiersch T.R., Chandler R.W., Wachtel S.S., Elias S. 1989. Reference standards for flow cytometry and application in comparative studies of nuclear DNA content. Cytometty 10: 706-710.

188. Turker M.S. 2002. Gene silencing in mammalian cells and the spread of DNA methylation. Oncogene 21: 5388-5393.

189. Urrutia A.O., Hurst L.D. 2003. The signature of selection mediated by expression on human genes. Genome Res. 13: 2260-2264.

190. Vallejos C.E., SakiyamaN. S., Chase C.D. 1992. A molecular marker-based linkage map of Phaseolus vulgaris L. Genetics 131: 733-740.

191. Van't Hof J., Sparrow A.H. 1963. A relationship between DNA content, nuclear volume and minimum mitotic cycle time. Proc. Natl. Acad. Sci. USA 49: 897-902.

192. Venter J.C. et al. (274 authors). 2001. The sequence of the human genome. Science 291: 1304-1351.

193. Vermeij G.J. 1973. Morphological patterns of high intertidal gastropods: adaptive strategies and their limitations. Marine Biol. 20: 319-346.

194. Villeponteau B., Brawley J., Martinson H.G. 1992. Nucleosome spacing is compressed in active chromatin domains of chick erythroid cells. Biochemistry 31: 1554-1563.

195. Vinogradov A.E. 1994. Measurement by flow cytometry of genomic AT/GC ratio and genome size. Cytometry 16: 34-40.

196. Vinogradov A.E. 1995a. Nucleotypic effect in homeotherms: body mass-corrected basal metabolic rate of mammals is related to genome size. Evolution 49: 1249-1259.

197. Vinogradov A.E. 1995b. Cell membrane-dependent chromatin condensation. Cytometry 19: 183-188.

198. Vinogradov A.E. 1996. Post-fixation method of cell viability assessment with flow cytometry. Acta Histochemica et Cytochemica 29 (Suppl.): 527-528.

199. Vinogradov A.E. 1997. Nucleotypic effect in homeotherms: body mass-independent resting metabolic rate of passerine birds is related to genome size. Evolution 51: 220225.

200. Vinogradov A.E. 1998a. Genome size and GC-percent in vertebrates as determined by flow cytometry: the triangular relationship. Cytometry 31: 100-109.

201. Vinogradov A.E. 1998b. Variation in ligand-accessible genome size and itsecomorphological correlates in a pond snail. Hereditas 128: 59-65. <

202. Vinogradov A.E. 1998c. Buffering: a possible passive-homeostasis role for redundant DNA. J. Theor. Biol. 193: 197-199.

203. Vinogradov A.E. 1999a. Genome intoto. Genome 42: 361-362.

204. Vinogradov A.E. 1999b. Chromatin signal in genome size measurement. Cytometry 37: 243-245.

205. Vinogradov A.E. 1999c. Intron-genome size relationship on a large evolutionary scale. J. Mol. Evol. 49: 376-384.

206. Vinogradov A.E. 2000. Larger genomes for molluskan land pioneers. Genome 43: 211212. ' i

207. Vinogradov A.E. 2001a. Mirrored genome size distributions in monocot and dicot plants. Acta Biotheoretica 49: 43-51.

208. Vinogradov A.E. 2001b. Intron length and codon usage. J. Mol. Evol. 52: 2-5.

209. Vinogradov A.E. 2001c. Within-intron correlation with base composition of adjacent exons in different genomes. Gene 276: 143-151.

210. Vinogradov A.E. 200 Id. Bendablc genes of warm-blooded vertebrates. Mol. Biol. Evol. 18:2195-2200.

211. Vinogradov A.E. 2002. Growth and decline of introns. Trends Genet. 18: 232-236.

212. Vinogradov A.E. 2003a. Selfish DNA :s maladaptive: evidence from the plant Red List. Trends Genet. 19: 609-614.

213. Vinogradov A.E. 2003b. DNA helix: the importance of being GC-rich. Nucleic Acids Res. 31: 1838-1844.

214. Vinogradov A.E. 2003c. Isochores and tissue-specificity. Nucleic Acids Res. 31: 52125220.

215. Vinogradov A.E. 2003d. Silent DNA: speaking RNA language? Bioinformatics 9: 21672170.

216. Vinogradov A.E. 2004a. Testing genome complexity. Science 304: 389-390.

217. Vinogradov A.E. 2004b. Genome size and extinction risk in vertebrates. Proc. Roy. Soc. B 111: 1701-1705.

218. Vinogradov A.E. 2004c. Evolution of genome size: multi-level selection, mutation bias or dynamical chaos? Curr. Opin. Genet. Devel. 14: 620-626.

219. Vinogradov A.E. 2004d. Compactness of human housekeeping genes: selection for economy or genomic design? Trends Genet. 20: 248-253.

220. Vinogradov A.E. 2005a. Genome size and chromatin condensation in vertebrates. Chromosoma 113: 362-369.

221. Vinogradov A.E. 2005b. Noncoding DNA, isochores and gene expression: nucleosome formation potential. Nucleic Acids Res. 33: 559-563.

222. Vinogradov A.E. 2005c. Dualism of gene GC content and CpG pattern in regard to expression in the human genome: magnitude versus breadth. Trends Genet. 21: 639643.

223. Vinogradov A.E. 2006a. "Genome design" model: evidence from conserved inlronic sequence in human-mouse comparison. Genome Res. 16: 347-354.

224. Vinogradov A.E. 2006b. 'Genome design' model and multicellular complexity: golden middle. Nucleic Acids Res. 34: 5906-5914.

225. Vinogradov A.E. 2010. Systemic factors dominate mammal protein evolution. Proc. Roy. Soc. B 211: 1403-1408.

226. Vinogradov A.E., Anatskaya O.V. 2006. Genome size and metabolic intensity in tetrapods: a tale of two lines. Proc. Roy. Soc. B 273: 27-32.

227. Vinogradov A.E., Anatskaya O.V. 2007. Organismal complexity, cell differentiation and gene expression: human over mouse. Nucleic Acids Res. 35: 6350-6356.

228. Wakaguri H., Yamashita R., Suzuki Y., Sugano S., Nakai K. 2008. DBTSS: database oftranscription start sites, progress report 2008. Nucleic Acids Res. 36: D97-D101.

229. Wakamiya I., Price H.J., Messina M.G., Newton R.J. 1996. Pine genome size diversity and water relations. Physiol. Plantarum 96: 13-20.

230. Walsberg G.E, LeaM.S, Hillman S.S. 1986. Individual variation in maximum aerobic capacity: cardiovascular and enzymatic correlates in Rana catesbeiana. J. Exp. Zool. 239: 1-5.

231. Waterston R.H., Lindblad-Toh K., Birney E., Rogers J., Abril J.F., Agarwal P., Agarwala R., Ainscough R., Alexandersson M., An P. et al. 2002. Initial sequencing and comparative analysis of the mouse genome. Nature 420: 520-562.

232. Weibel E.R. 2000. Symmorphosis. Harvard University Press, Boston.

233. Weibel E.R., Taylor C.R., Gehr P., Hoppeler H„ Mathieu O., Maloiy G.M. 1981. Design of the mammalian respiratory system. IX. Functional and structural limits for oxygen flow. Respir. Physiol. 44: 151-164.

234. Weibel E.R., Taylor C.R., Hoppeler H. 1991. The concept of symmorphosis: a testable hypothesis of structure-function relationship. Proc. Natl. Acad. Sci. USA 88: 1035710361.

235. Weibel E.R., Taylor C.R., Hoppeler IT. 1992. Variations in function and design: testing symmorphosis in the respiratory system. Respir. Physiol. 87: 325-348.

236. Wernersson R., Pedersen A.G. 2003. RevTrans: Multiple alignment of coding DNA from aligned amino acid sequences. Nucleic Acids Res. 31: 3537-3539.

237. Widlund H.R., Cao H., Simonsson S., Magnusson E., Simonsson T., Nielsen P.E., Kahn J.D., Crothers D.M., Kubista M. 1997. Identification and characterization of genomic nucleosome-positioning sequences. J. Mol. Biol. 267: 807-817.

238. Wilkins A.S. 2007. For the biotechnology industry, the penny drops (at last): genes are not autonomous agents but function within networks! Bioessays 29: 1179-1181.

239. Wolf Y.I. 2006. Coping with the quantitative genomics "elephant": The correlation between the gene dispensability and evolution rate. Trends Genet. 22: 354-357.

240. Wolfe K., Sharp, P.M., Li W.H. 1989. Mutation rates differ among regions of the mammalian genome. Nature 337: 441-456.

241. Wolfe K.H. 2001. Yesterday's polyploids and the mystery of diploidization. Nat. Rev. Genet. 2: 333-341.

242. Wright F. 1990. The effective number of codons used in a gene. Gene 87: 23-29.

243. Wunderlich Z., Mirny L.A. 2009. Different gene regulation strategies revealed by analysis of binding motifs. Trends Genet. 25: 434-440.

244. Xia X. 1996. Maximizing transcription efficiency causes codon usage bias: Genetics 144: 1309-1320.

245. Yamashita R., Suzuki Y., Sugano S., Nakai K. 2005. Genome-wide analysis reveals strong correlation between CpG islands with nearby transcription start sites of genes and their tissue specificity. Gene 350: 129-136.

246. Yanai I., Graur D., Ophir R. 2004. Incongruent expression profiles between human and mouse orthologous genes suggest widespread neutral evolution of transcription control. OMICS 8: 15-24.

247. Yang J., Su A.I., Li W.H. 2005. Gene expression evolves faster in narrowly than in broadly expressed mammalian genes. Mol. Biol. Evol. 22: 2113-2118.

248. Yang Z. 2007. PAML 4: a program package for phylogenetic analysis likelihood. Mol. Biol. Evol. 24: 1586-1591.

249. Yates P.A., Burman R., Simpson J., Ponomoreva O.N., Thayer M.J., Turker M.S. 2003. Silencing of mouse Aprt is a gradual process in differentiated cells. Mol. Cell Biol. 23: 4461-4470.

250. Zhong Z., Wilson K.L., Dahl K.N. 2010. Beyond lamins other structural components of the nucleoskeleton. Methods Cell Biol. 98: 97-119. '

251. Zuckerkandl E., Hennig W. 1995. Tracking heterochromatin. Chromosoma 104: 75-83.