Бесплатный автореферат и диссертация по биологии на тему
Сравнительно-геномный анализ посттранскрипционных и посттрансляционных механизмов регуляции структуры и функции белков
ВАК РФ 03.01.09, Математическая биология, биоинформатика

Автореферат диссертации по теме "Сравнительно-геномный анализ посттранскрипционных и посттрансляционных механизмов регуляции структуры и функции белков"

На правах рукописи

005001648

Курмангалиев Ербол Жанузакович

СРАВНИТЕЛЬНО-ГЕНОМНЫЙ АНАЛИЗ ПОСТТРАНСКРИПЦИОННЫХ И ПОСТТРАНСЛЯЦИОННЫХ МЕХАНИЗМОВ РЕГУЛЯЦИИ СТРУКТУРЫ И ФУНКЦИИ БЕЛКОВ

03.01.09 — математическая биология, биоинформагика

АВТОРЕФЕРАТ диссертации па соискание учёной степени кандидата биологических наук

1 О НОЯ 2011

Москва—2011

А о ; - ■)

005001648

Работа выполнена в Учебно-научном центре «Биоинформатика» Учреждения Российской академии наук Института проблем передачи информации им. A.A. Харкевича РАН.

Научный руководитель:

кандидат физико-математических наук, доктор биологических наук, профессор Гсльфанц Михаил Сергеевич

Официачьные оппоненты: доктор физико-математических наук, Макеев Всеволод Юрьевич,

Институт общей генетики им. Н.И.Вавилова РАН, Москва

кандидат биологических наук, профессор Фришман Дмитрий Иосифович,

Технический университет Мюнхена, г. Мюнхен, Германия Ведущая организация:

Учреждение Российской академии наук Институт молекулярной биологии им. В.А. Энгельгардга РАН, Москва

Защита диссертации состоится 25 ноября 2011 года в 14-00 часов на заседании диссертационного совета Д 002.077.04 прниУчреждении Российской академии наук Институте проблем передачи информации им. A.A. Харкевича РАН по адресу: 127994, г. Москва, ГСП-4, Большой Каретный переулок, д. 19, стр. 1.

С диссертацией можно ознакомиться в библиотеке Учреждения Российской академии наук Института проблем передачи информации им. A.A. Харкевича РАН Автореферат разослан октября 2011 года

Учений секретарь диссертационного совета доктор биологических наук, профессор Рожкова Г.И.

Общая характеристика работы

Актуальность темы

До полного секвснирования генома человека высказывались самые различные предположения об общем количестве генов. При этом достаточно общепринятой была точка зрения, что количество генов возрастает со сложностью биологических организмов. Поэтому неожиданными оказались результаты первичного анализа полного генома человека, который выявил менее 30000 генов. Для сравнения, в геноме круглого червя СаепогкаЪИйз е1едапа содержится примерно 20000 генов.

Однако разнообразие белков не ограничивается лишь общим числом генов. У высших эукариот одним из основных механизмов повышения разнообразия генных продуктов на постгранскрипцнонном уровне является альтернативный сплайсинг. Существуют различные оценки общего числа альтернативно сплайсируемых генов человека. Массовое секвенирование Е5Т-последователыгостей и их анализ показали, что не менее трети генов человека альтернативно сплайсируются. Дальнейшее увеличение объема данных о транскриптоме человека только увеличивало эту оценку, которая сейчас достигла 90-95%.

С другой стороны, неясно, какая доля из предсказанных по ЕБТ-последовательностям вариантов транскриптов являются функциональными, а какая является результатом ошибок механизма сплайсинга или экспериментальными артефактами. Традиционно исследователей интересует в первую очередь функциональный альтернативный сплайсинг, и они пытаются очистить анализируемые наборы данных от нефункциональных транскриптов. В то же время, анализ последствий подобных ошибок может дать информацию о том, как функционирует сам механизм сплайсинга. Одной из ошибок сплайсинга является удержание интрона. Другим интересным объектом являются мутации в сайтах сплайсинга, нарушающие их распознавание, что может приводить к различным последствиям. По некоторым данным, мутации, нарушающие сплайсинг пре-мРНК, потенциально являются одной из наиболее частых причин наследственных заболеваний. Поэтому исследования последствий ошибок сплайсинга, и, в частности, мутаций, затрагивающих сплайсинг, может также иметь важное практическое значение.

В то же время, структурное и функциональное разнообразие генных продуктов не ограничивается лишь набором транскриптов, получаемых при альтернативном сплайсинге. Уже после синтеза белки могут подвергаться дальнейшим поспрансляционным модификациям путем ковалентного присоединен™ различных функциональных групп или протеолитического расщепления. Посттрансляционные модификации играют важнейшую роль в самых разнообразных клеточных процессах путем влияния на активность белков, их клеточную локализацию и взаимодействия с другими белками. Одним из наиболее важных н распространенных типов посттрансляционных модификаций эукариот является обратимое фосфорилирование белков по остаткам серина, треонина и тирозина. По некоторым оценкам, треть белков, закодированных в геноме человека, содержат ковалентно связанный фосфат. В последние годы, с развитием новых методов в протеомике и масс-спектроскопии, количество фосфосайтов, идентифицированных в белках различных модельных организмов, достигло десятков тысяч. Накопление таких больших объемов протеомных данных позволяет

3

проводить системные исследования постгрансляционных модификаций методами биоипформатики. Одной из таких задач является исследование возможной связи посттранскрипционных и постгрансляционных механизмов регуляции генов.

Другой интересный вопрос заключается в том, как эволюционируют сайты постгрансляциоиных модификаций. Как и все функционально важные участки белков, сайты модификаций более консервативны по сравнению с окружающими их алшнокислотными остатками. Однако, кроме функциональной значимости, модифицированные аминокислоты отличаются от своих ^модифицированных аналогов и по химическим свойствам. Поэтому мутации в сайтах модификаций и их немодифицированных аналогах, приводящие к их замене на другие типы аминокислот, скорее всего, будут иметь различное влияние на структуру и функцию белков. Это должно приводить к различиям в частотах замен модифицированных и немодифицированных аминокислот па другие типы аминокислотных остатков.

Цель и задачи исследования

Целью данной работы было исследование различных аспектов посггранскрипциониой и посттрансляционной регуляции структуры и функции белков с помощью компьютерного анализа новейших доступных данных. В частности, были исследованы ошибки альтернативного сплайсинга и эволюционные паттерны постгрансляциоиных модификаций. При этом были решены следующие задачи:

• собрана выборка интронов, для которых наблюдались случаи удержания в транскриптах;

• проведен сравнительный анализ удержанных и конститутивных нитронов;

• собрана выборка экзонов, мутации в сайтах сплайсинга которых приводили к пропуску этих экзоноа;

• проведен сравнительный анализ экзонов, в которых мутации в сайтах сплайсинга приводят к пропуску экзона и к активации скрытых сайтов сплайсинга;

• исследована возможная связь между альтернативным сплайсингом и постгрансляционными модификациями путем анализа распределения сайтов фосфоршшрования между различными участками белков;

• проведена реконструкция эволюции сайтов постгрансляционных модификаций, в том числе, сайтов фосфорилирования и сайтов ацешлирования;

• проведен сравнительный анализ паттернов замен сайтов постгрансляционных модификаций и их немодифицированных аналогов на другие типы аминокислот.

Научная новизна и практическое значение

В данной работе был проведен систематический анализ ошибок сплайсинга. Выявлены достоверные различия между конститутивными и удержанными нитронами по ряду параметров (в т.ч. по длине, по качеству сайтов сплайсинга, по плотности потенциальных цис-регуляторных элементов, по расположению в генах). Впервые было показало, что доля удержанных интронов монотонно возрастает от 5'- к З'-концу транскриптов.

Проведен анализ экзонов с мутациями в сайтах сплайсинга. Собрана выборка экзонов, мутации сайтов сплайсинга в которых вызывают пропуск экзона. Выявлены значимые различия между экзонами, в которых мутации в сайтах сплайсинга приводят к пропуску экзона либо к активации скрытого сайта сплайсинга (в т.ч. по длине, по весу сайтов сплайсинга, по плотности потенциальных цис-регуляторных элементов, по наличию эквивалентных скрытых сайтов сплайсинга в непосредственной близости от сайтов с мутациями).

Получены данные о возможной связи альтернативного сплайсинга и постгрансляционных модификаций. Выдвинута гипотеза о различиях в частотах замен модифицированных и ^модифицированных аминокислотных остатков на другие типы аминокислот. Впервые проведен эволюционный анализ паттернов замен сайтов посттрансляциоиных модификаций. На примере сайтов фосфорилирования выявлены значимые различия между векторами замен модифицированных и немодифицированных аминокислотных остатков. В частности показано, что фосфорсерины в среднем чаще заменяются на глутамат и аспартат, по сравнению с нефосфорилированными остатками серина. Реализованная методика анализа паттерна замен сайтов фосфорилирования может использоваться для исследования других типов посттрансляционных модификаций.

В целом, полученные в этом исследование результаты могут использоваться при предсказании возможных последствий мутаций в сайтах сплайсинга и постгрансляционных модификаций, что может иметь практическое значение в исследованиях наследствишых заболеваний и найти применение в персонализированной медицине.

Апробация работы

Материалы исследования по теме диссертации были представлены на следующих конференциях: XIV Международной конференции студентов, аспирантов и молодых ученых "Ломоносов" (Москва, апрель 2007); 3rd International Moscow Conference on Computational Molecular Biology (MCCMB'07, Москва, июль 2007); 30-й конференции "Информационные технологии и системы" (ИТиС'07, Звенигород, сентябрь 2007); 31-й конференции "Информационные технологии и системы" (ИТиС'08, Геленджик, сентябрь, 2008); 4th International Moscow Conference on Computational Molecular Biology (MCCMB'09, Москва, июль 2009); 33-й конференции "Информационные технологии и системы" (ИТиС'Ю, Геленджик, сентябрь 2010).

Объем и структура диссертации

Диссертационная работа изложена на 110 страницах и состоит из введения, трех глав, выводов, списка цитированной литературы и приложений. Глава 1 содержит обзор литературы по теме диссертации. Глава 2 содержит описание данных, методов и программного обеспечения использовавшихся при решении задач, поставленных в диссертации. Глава 3 содержит описание полученных результатов и их обсуждение. Список литературы содержит 206 наименований. В приложениях приведены дополнительные материалы, не вошедшие в основные разделы диссертации. Работа содержит 21 рисунок и 10 таблиц.

Результаты и обсуждение

Ошибки сплайсинга

Сплайсинг, как и любой другой биологический процесс, подвержен ошибкам. Такой сплайсинг по сути также является альтернативным сплайсингом, и приводит к возникновению продуктов, отличных от канонических изоформ гена. В зависимости от того, идет ли распознавание сайтов сплайсинга через экзон или интрон, ошибки сплайсинга будут приводить к различных последствиям. Ошибки при распознавании через экзон должны приводить к полному удалению экзона или, при наличии сильного скрытого сайта, к использованию последнего. В то же время, ошибки при распознавании через интрон должны приводить к удержанию интронов.

В этой главе описаны результаты анализа ошибок сплайсинга в транскриптах человека. В частности, мы провели сравнительный анализ удержанных и конститутивно сплайсируемых интронов, а также мутаций сайтов сплайсинга, приводящих к пропуску экзопа или активации скрытых сайтов сплайсинга. Удержанные интроны

Удержание интрона является наименее изученным типом альтернативного и ошибочного сплайсинга. В отличие от других типов сплайсинга, заключающихся в выборе между различными сайтами сплайсинга, удержание интрона представляет собой полное отсутствие сплайсинга. Большинство случаев удержания нитрона, наблюдаемых в базах данных транскриптомов человека, по всей видимости, являются результатом ошибок сплайсинга или присутствия в образце недосилайсированных транскриптов. Обычно такие транскрипты считаются экспериментальными артефактами и не рассматриваются при анализе альтернативного сплайсинга. Мы попытались рассмотреть удержанные интроны, встречающиеся в базах данных кДНК человека, с другой стороны: они являются промежуточными продуктами процесса сплайсинга и их анализ может дать дополнительную информацию о том, как происходит сплайсинг.

Для определения факторов, влияющих на удержание интронов, был проведен сравнительный анализ удержанных и конститутивно сплайсируемых интронов человека Мы сравнили длины интронов и их фланкирующих экзонов, силу сайтов сплайсинга интрона, ситу дистальных сайтов сплайсинга фланкирующих экзонов (акцепторный сайт 5"-экзона и донорный сайт 3'-экзона), плотности экзонных цис-регуляторных элементов сплайсинга, а также относительную локализацию интронов по длине генов.

Распределения длин интронов между удержанными и конститутивными нитронами значимо различались (двухвыборочный тест Колмогорова-Смирнова, Р<10"). Удержанные интроны были значительно короче конститутивных: 84% удержанных интронов были короче 1000 н.п., по сравнению с 40% конститутивных. Медианы длин удержанных и конститутивных интронов были равны 337 и 1481 н.п. соответственно. В то же время, никакой значимой разницы в длинах фланкирующих экзонов замечено не было.

Сила сайтов сплайсинга интронов и их фланкирующих экзонов для удержанных и конститутивных интронов вычислялась с использованием позиционной матрицы весов.

Сайты сплайсинга удержанных нитронов были более слабыми: распределения весов сайтов сплайсинга удержанных и констизугивных интронов значимо различались как для донорных, так и для акцепторных сайтов (двухвыборочный гест Колмогорова-Смирнова, Р<10"15). Медианы весов донорных сайтов были равны 18.2 и 18.8 для удержанных и конституивных интронов соответственно. Аналогично, для акцепторных сайтов медианы весов равнялись 18.0 для удержанных и 19.1 для конститутивных интронов.

Веса донорных сайтов Зч-фланкирующих экзонов удержанных и конститутивных интронов были схожими. В случае 5~-фланкирующего экзона веса акцепторных сайтов оказались значительно ниже у удержанных интронов, по сравнению с конститутивными-, медианы 18.6 и 19.1 соответственно (двухвыборочный тест Колмогорова-Смирнова, Р<10 ).

Потенциальные цис-регуляторные элементы сплайсинга предсказывались в обоих классах интронов с помощью грех опубликованных программ ESEfinder, RESCUE-ESE, и PESX. Плотность большинства предсказанных экзонных энхансеров сплайсинга (exonic splicing enhancers) была значительно выше в удержанных интронах, тогда как плотность экзонных сайленсеров сплайсинга (exonic splicing silencers) была выше в конститутивных интронах (Рисунки 1 и 2).

0£* 0.06 сайтов на нкулеотид

сайтов на нуяеотид

сайтов на нуклаомд

Рисунок 1. Распределение плотностей ЕБЕ-мотивов предсказанных программой Е5ЕГтс1ег. Сплошная: удержанные интроны; пунктирная: конститутивные интроны.

При этом средняя плотность всех четырех мотивов Е5Е£тс1ег была выше в удержанных

интронах (Рисунок 1). Наибольшая разница между медианами плотностей наблюдалась для

сайтов связывания 5Е2/А5Е (медианы плотностей 0.040 и 0.028 для удержанных и

конститутивных интронов соответственно), в то время как наименьшая разница была в

случае сайтов связывания Э11р55 (медианы плотностей 0.0217 и 0.0215, незначимая разница).

Плотности РЕ5Е-октамеров (энхансеры) также были выше в удержанных интронах, тогда как

плотность РЕЗв-октамеров (сайленсеры) была выше в конститутивных интронах (Рисунок 2).

В отличие от них, плотность ЕЭЕ-гексамеров, предсказанных КЕЯСОЕ-ЕЗЕ, была

значительно выше в конститутивно сплайсируемых интронах, чем в удержанных (Рисунок 2).

Все эти различия были статистически значимыми (двухвыборочный тест Колмогорова-

Смирнова, Р<10'').

PESE

RESCUE-ESE

Рисунок 2. Распределение плотностей ESE-мотивов, предсказанных программами RESCUE-ESE и PESX/PESE, и ESS, предсказанных программой PESX/PESS.

Сплошная: удержанные интроны; пунктирная: конститутивные интроны.

Относительная позиция иптрона в гене была определена как отношение ОП=Р/Д, где Р было расстоянием от 5~-конца гена до 5"-конца интрона (донорный сайт), и Д было длиной гена (расстоянием между 5'- и 3~-концами, в соответствии с аннотацией RefSeq). Так как терминальные интроны и экзоны могут иметь нестандартное распределение длины, вычисления проводились несколькими способами. Во-первых, мы использовали несплайсированные гены, по аннотациям в RefSeq, и в таких случаях расстояние вычислялись по геномным последовательностям. Во-вторых, мы рассматривали сгшайсированные гены: все интроны были удалены и изучаемый интрон был сжат до одной точки ("тень интрона"); расстояния вычислялись по последовательностям мРНК. В-третьих, мы рассматривали сгшайсированные гены с удаленным последним экзоном. И, наконец, мы определяли позицию интрона как отношение порядкового номера изучаемого интрона (от начала гена) к их общему числу в гене.

Конститутивные интроны (показаны светлым па Рисунке 3) смещены к 3"-концам несплайсированньк генов (Рисунок ЗВ), и к 5"-концам при вычислениях на сплайсированных транскриптах (Рисунок ЗС). Это согласуется с понижением плотности интронов и повышением длины экзонов по направлению от 5~-концов к З'-концам генов. При удалении последнего 3"-терминального экзона, распределение становится почти равномерным (Рисунок 3D).

В случае с удержанными интронами ситуации абсолютно другая (двухвыборочный тест Колмогорова-Смирнова, Р<10"15 для относительной позиции интронов в случае со сплайсированными генами и спласированными генами без последнего экзона, и Р<10'9 для несплайсированных генов; тест Хи-квадрат, Р<10"15 для порядкового номера интрона). Распределение удержанных интронов (показаны темным на Рисунке 3) значительно смещено в направлении З'-конца генов во всех случаях, по сравнению с конститутивными ингронами. Таким образом, доля удержанных интронов монотонно увеличивается в направлении от коица к 3"-концу генов (кривая треугольников, Рисунок 3).

О.'В А 00?4 0.2 в 0,014

0.1 0.2 0.3 0..; 0.5 0.6 0.7 0.8 0.3 1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Рисунок 3. Распределение относительной позиции интронов. А: относительный порядковый номер интрона; В: несплайсированные гены; С: сплайсированные гены; 0: сплайсированные гены без последнего экзона. Левая вертикальная ось: доля интронов в каждом сегменте, раздельно для удержанных (темное) и конститутивных (светлое) интронов. Точки 0 и 1 на горизональной оси соответствуют 5'- и З'-концам генов, соответственно. Правая вертикальная ось и кривая треугольников: доля удержанных интронов среди всех интронов в данном сегменте.

Мутации в сайтах сплайсинга

Еще одним способом изучения механизмов сплайсинга является анализ последствий мутаций в сайтах сплайсинга. Такие мутации имеют два основных возможных последствия: пропуск экзона или активацию скрытого сайта сплайсинга, в то время как удержание интрона происходит достаточно редко. Одним из наиболее важных условий активации скрытого донорного сайта является наличие достаточно сильного кандидата в непосредственной близости от мутированного сайта.

Выборки экзонов с мутациями, нарушающими сайты сплайсинга, были получены из базы данных Менделевских наследственных заболеваний ОМ1М и литературы. Рассматривались лишь мутации, непосредственно затрагивающие донорные и акцепторные сайты сплайсинга. Экзоны, в зависимости от того, вызывают ли они пропуск экзона либо активацию скрытого сайта, разделялись на Б-экзоны и С-экзоны, соответственно. Мутации донорных и акцепторных сайтов рассматривались как раздельно, так и вместе, для увеличения статистической значимости наблюдений. Результаты сравнительного анализа Б-экзонов и С-экзонов просуммированы в Таблице 1.

Б-экзоны оказались значимо короче С-экзонов (медианы длин 114 и 136). Никакой значимой разницы в длинах фланкирующих интронов замечено не было.

Были сравнены веса самих сайтов с мутациями, а также соседних сайтов (для экзонов с мутациями в донорных сайтах - ближайшие акцепторные сайты; аналогично, для экзонов с мутациями в акцепторных сайтах - ближайшие донорные сайты с 5'- и З^-стороны). Акцепторные сайты, подверженные мутациям, оказались слабее в С-экзонах по сравнению с Я-экзонами, с медианами весов 18.72 и 19.59 соответственно (тест Манна-Уитни, Р=0.05).

9

Никакой значимой разницы между S-экзонами и С-экзонами в распределениях весов донорных сайтов, подверженных мутациям, а также всех остальных рассмотренных сайтов, обнаружено не было.

Далее, мы анализировали экзоны на наличие потенциальных скрытых сайтов сплайсинга в непосредственной близости от сайтов с мутациями. Для оценки относительного обогащения потенциальными скрытыми сайтами областей, окружающих сайты с мутациями, мы провели поиск эквивалентных сайтов сплайсинга в пределах близлежащих от изучаемого сайта интрона и экзона. Под эквивалентным сайтом сплайсинга мы понимали потенциальный сайт сплайсинга того же типа, что и изучаемый сайт, с весом равным весу последнего или выше. Сайты с мутациями, для которых не удавалось найти эквиваленгный сайт в близлежащих интроне и экзоне, исключались из рассмотрения. Относительное обогащение областей вблизи от мутированных сайтов потенциальными скрытыми сайтами сплайсинга оценивали по расстоянию до ближайшего эквивалентного сайта. И в случае мутаций в донорных, и в акцепторных сайтах, разница между S-экзонами и С-экзонами была очень велика: эквивалентные сайты находились намного ближе к сайтам с мутациями С-экзоиов, чем S-экзонов. Медиана расстояния от донорного сайта с мутацией С-экзонов до ближайшего эквивачентного сайта была равна 75 нукл., в то время как в случае S-экзонов медиана равнялась 220 нукл.. Аналогично, в случае акцепторных сайтов медианы расстояния до ближайших эквивалентных сайтов были равны 66 нукл. и 185 нукл. для С-экзонов и S-экзонов, соответственно.

Плотность потенциальных цис-регуляторных элементов в S-экзонах и С-экзонах вычислялась, так же, как и при сравнении удержанных и конститутивных нитронов. В большинстве случаев медиана плотности предсказанных экзонных энхансеров сплайсинга (ESE) была выше в С-экзонах по сравнению с S-экзонами. В тоже время, медиана плотности экзонных сайленсеров сплайсинга (ESS), наоборот, была выше в S-экзонах (Таблица 1). Однако в связи с малыми размерами выборок, эга разница была значима лишь в нескольких случаях: медианы плотностей были статистически значимо выше в С-экзонах, чем в S-экзонах с мутациями в донорных сайтах, для сайтов связывания SF2/ASF (тест Манна-Уитни, Р=0,048) и SRp40 (тест Манна-Уитни, Р=0,006), а также октамеров PESE (тест Манна-Уитни, Р=0,007).

Обсуждение результатов анализа удержанных интронов и мутаций в сайтах сплайсинга

В целом, результаты данного исследования хорошо согласуются с существующими биологическими моделями. Удержанные интроны относительно короткие - поэтому попарное распознавание сайтов, вероятнее всего, происходит через нитрон, что в случае ошибок сплайсинга должно приводить к удержанию интронов.

Относительно низкий вес сайтов сплайсинга в удержанных интронах, как и отсутствие потенциальных скрытых сайтов с достаточно большим весом в непосредственной близости от аутентичных сайтов S-экзонов, свидетельствует о том, что веса сайтов является адекватной оценкой силы сайтов сплайсинга и их функциональноста. При этом, относительная редкость потенциальных скрытых сайтов в непосредственной близости от С-

экзонов не ограничивается исключительно экзонами с мутациями в донорных сайтах. С другой стороны, мы не смогли подтвердить наблюдение о том, что для С-экзонов с мутациями в донорных сайтах характерны сильные акцепторные сайты.

В отличие от предыдущих исследований, которые интересовались, в первую очередь, функциональным (консервативным) удержанием нитронов, мы не акцептировали внимание на возможной функциональности. Одним из последствий этого является то, что большинство удержанных интронов, рассмотренных в данном исследовании, по всей видимости, не функциональны, так как всего 3,3% из них сохраняют рамку считывания. Но это не исключает возможную роль таких интронов в регуляции на уровне белков или мРНК. Однако и сама процедура, и полученные результаты указывают на то, что большая часть удержашшх интронов в нашем исследовании принадлежат к недосплайсированным транскриптам. Таким образом, низкие веса сайтов удержанных интронов могут иметь два объяснения. Во-первых, удержанные интроны могут происходить от недосплайсированных транскриптов (слабые сайты приводят к низкой эффективности сплайсинга). Во-вторых, удержанные интроны могут быть примером регулируемого альтернативного сплайсинга: известно, что функциональные альтернативные сайты сплайсинга имеют более низкий вес, чем конститутивные сайты сплайсинга.

Было показано, что удержанные интроны человека и растений чаще находятся в 5"- и особенно в 3~-нетранслируемых областях транскриптов, по сравнению с кодирующими областями мРНК. Это объяснялось уничтожением плохо сплайсированных копий мРНК с помощью механизма нонсенс-мотивированной деградации. Однако это не объясняет наблюдаемое преобладание удержанных интронов в 5~-нетранслируемых областях. Наши наблюдения показывают монотонное увеличение доли удержанных интронов по направлению от 5'-конца к 3~-концу генов. Это в некоторой степени согласуется с моделью котранскрипционного сплайсинга (в отличие от предположений о том, что сплайсинг одновременно начинается на всех интронах), которая была подтверждена в эксперимеоте.

Наблюдаемая разница в плотностях экзонных энхансеров сплайсинга между удержанными и конститутивными интронами, а также между 5-экзонами и С-экзонами, тоже имеет естественное биологическое объяснение. Так, высокая плотность Е5Е-подобных сайтов на относительно коротких интронах может приводить к ошибочному распознаванию данного интрона как части экзона вместе с фланкирующими экзонами. Аналогично, высокая плотность экзонных энхансеров сплайсинга в экзонах с мутациями в сайгах сплайсинга может заставить аппарат сплайсинга сохранить данный экзон и использовать скрытый сайт, в то же время экзонные сайленсеры сплайсинга могут вызывать пропуск экзона. В то же время, неясно почему потенциальных энхансеров предсказанных RESCUETi.SE было больше в конститутивных интронах, чем в удержанных.

Наблюдаемая статистически значимая разница в весах аутентичных акцепторных сайтов С-экзонов и Б-экзонов может иметь более сложное, но все же правдоподобное объяснение: экзоны со слабыми сайгами сплайсинга уже содержат больше энхансеров сплайсинга, по сравнению с экзонами с сильными сайтами, и, таким образом, имеют больше шансов стать С-экзонами.

S-экзоны С-экзоиы 1 МУ все внутренние экзоны

Длина экзона (нуклеотиды)

мутации в донорных сайтах 114 147 0.024

мутации в акцепторных сайтах 112.5 130 н/з

все 114 136 0.020 1 123

Плотность цие-регуляторных элементов (п редсказанных сайтов на нуклеотид)

ESEfinder: SC35

мутации в донорных сайтах 0.043 0.042 н/з

мутации в акцепторных сайтах 0.038 0.045 н/з

все 0.042 0.043 н/з 0.038

ESEfinder: SF2/ASF

мутации в донорных сайтах 0.025 0.037 0.048

мутации в акцепторных сайтах 0.036 0.041 н/з

все 0.028 0.040 0.005 0.036

ESEfinder: SRp40

мутации в донорных сайтах 0.034 0.043 0.006

мутации в акцепторных сайтах 0.040 0.043 н/з

все 0.035 0.043 0.004 0.040

ESEfinder: SRp55

мутации в донорных сайтах 0.028 0.024 н/з

мутации в акцепторных сайтах 0.022 0.023 н/з

все 0.025 0.023 н/з 0.023

RESCUE-ESE

мутации в донорных сайтах 0.090 0.108 н/з

мутации в акцепторных сайтах 0.100 0.080 н/з

все 0.091 0.094 н/з 0.099

PESE

мутации в донорных сайтах 0.048 0.082 0.007

мутации в акцепторных сайтах 0.057 0.055 н/з

все 0.055 0.064 0.023 0.064

PESS

мутации в донорных сайтах 0.012 0.008 н/з

мутации в акцепторных сайтах 0.009 0.007 н/з

все 0.011 0.007 1 н/з 0.007

Вес сайта сплайсинга

.нутации в донорных сайтах

исходный донорный сайт 18.52 18.49 н/з 18.82

акцепторный сайт 5"-экзона 18.70 19.67 н/з 19.08

акцепторный сайт 3"-экзона 19.37 18.98 н/з 19.09

мутации в акцепторных сайтах

исходный акцепторный сайт 19.59 18.72 0.050 19.08

донорный сайт 5'-экзона 18.44 18.56 н/з 18.82

донорный сайт З'-экзона 18.48 18.51 н/з 18.79

Расстояния до ближайшего эквивалентного сайта (иуклеотиды)

мутации в донорных сайтах 220 75 0.067 289

мутации в акцепторных сайтах . 185 66 0.024 81

Таблица 1. Свойства в-экзонов, С-экзонов и всех внутренних экзонов из нашей выборки генов RefSeq. Для всех параметров экзонов указаны медианы. МУ: статистическая значимость различий между Э-экзонами и С-экзонами, вычисленная тестом Манна-Уитни; н/з: не значимое.

Альтернативный сплайсинг и посттрансляционные модификации

Фосфорилирование является одним из наиболее важных и распространенных типов посттрансляционных модификаций белков. С другой стороны, у многоклеточных эукариот альтернативный сплайсинг является основным механизмом повышения структурного и функционального разнообразия белков. Для изучения возможной связи между посттрансляционными модификациями и альтернативным сплайсингом мы проанализировали распределение сайтов фосфорилирования в конститутивных и альтернативно сплайсируемых областях белков человека.

В этом анализе использовались сайты фосфорилирования, идентифицированные в высокопроизводительном эксперименте в клетках человека линии HeLa. Сайты были картированы на белки из базы данных EDAS, причем для каждого гена была выбрана наиболее длинная белковая нзоформа. Далее, для каждого аминокислотного остатка модифицированных белков были получены данные по альтернативному сплайсингу, в том числе "включаемосгь" кодонов (доля последовательностей EST, содержащих кодон, среди всех последовательностей EST покрывающих данную область гена). В качестве контрольных выборок использовались кодоны тех же генов, кодирующие нефосфорилированные аналоги модифицированных аминокислот.

В зависимости от уровня "включаемости" сегментов, включающих анализируемые аминокислотные остатки, кодоны были классифицированы как конститутивные (принадлежащие к конститутивным сегментам, включаемость 100%) и альтернативно сплайсируемые (принадлежащие к альтернативно сплайсируемым сегментам белков, включаемость менее 99%). Кроме того, около 30% всех остатков, включая сайты фосфорилирования, имели долю включения 99%. Мы их отнесли к группе неопределенных, так как это могло быть как результатом альтернативного сплайсинга, так и следствием ошибок сплайсинга или экспериментальных артефактов.

Анализ данных показал, что сайты фосфорилирования имеют тенденцию находиться в альтернативно сплайсируемых областях белков. Во всех случаях эта тенденция слаба, но стагистически достоверна. В 24% случаев сайты фосфорилирования были альтернативно сплайсируемыми, а в 46% случаев - конститутивными. В то же время, для нефосфорилированных остатков эти величины равны 21% и 51%, соответственно (тест Хи-квадрат, Р<10"15). Аналогично, при отдельном рассмотрении фосфорилированных серинов, 24% находились в альтернативно сплайсируемых областях и 45% в конститутивных (тест Хи-квадрат, Р = 2х10"8). Сходные данные получены в случае фосфорилированных треонинов - 25% и 44%, соответственно (тест Хи-квадрат, Р=1хЮ"'). В то же время, для относительно небольшой выборки фосфотирозинов значимой разницы не обнаружено.

Результаты, полученные в этом исследовании, согласуются с ранними наблюдениями о корреляции альтернативного сплайсинга и функционально важных участков белков. Другим возможным объяснением полученною результата может являться то, что, как для сайтов фосфорилирования, так и для альтернативно сплайсируемых областей показана тенденция к расположению иа поверхности белков. Кроме того, на предсказанных структурах белков было показано, что фосфосерины и фосфотреонины предпочитают

13

неструктурированные области, в то время как фосфотирозины преимущественно располагаются в областях с упорядоченной вторичной структурой. В свою очередь, сами неструктурированные области белков часто кодируются в альтернативно сплайсируемых сегментах генов. Эти гипотезы можно будет проверить после того, как станут доступны пространственные структуры достаточного количества фосфорилируемых белков.

Паттерны эволюции сайтов посттрансляционных модификаций

Важнейшая роль посттрансляционных модификаций в различных внутриклеточных процессах предполагает консервативность таких сайтов в процессе эволюции. В ряде работ проводился эволюционный анализ сайтов фосфорилирования и было показано, что фосфосайты более консервативны, чем их нефосфорилированные аналоги, расположенные в тех же областях белков. В настоящей работе мы исследовали другой аспект эволюции сайтов постгрансляционных модификаций. Так как модифицированные аминокислоты химически являются отдельными типами аминокислот, в процессе эволюции они могут вести себя отлично от своих ^модифицированных аналогов (с точки зрения частот замен на другие типы аминокислот).

Для изучения различий в эволюции между модифицированными аминокислотами и их немодифицированными аналогами мы реконструировали эволюцию фосфорилированных остатков серима и треонина. В частности, мы изучали эволюцию фосфосеринов человека, плодовой мушки и дрожжей. Кроме того, была проведен эволюционный анализ другого распространенного типа посттрансляционных модификаций, сайтов ацетилирования лизинов в белках человека.

Паттерны замен сайтов фосфорилирования

Для каждого из трех организмов мы использовали наборы сайтов фосфорилирования, полученных в более чем одном массовом эксперименте. Фосфорилированию чаще всего подвергаются остатки серина, реже треонина, и еще реже тирозина. В связи с очень маленькими размерами выборок фосфотирозинов, этот тип сайтов был исключен из анализа.

Фосфорилирование белков - процесс динамичный, поэтому пересечение между наборами фосфосайтов, идентифицированных в различных экспериментах, из различных клеточных линий и тканей, было относительно небольшим. Сайты, которые были фосфорилированы в более чем одном массовом эксперименте, по всей видимости, модифицируются конститутивно, или, как минимум, представляют собой выборку наиболее надежных фосфосайтов.

Мы исследовали эволюцию модифицированных и немодифицированных остатков серина и треонина отдельно в восьми видах позвоночных, одиннадцати видах дрозофил и пятнадцати видах грибов. Для каждого сайта фосфорилирования мы реконструировали эволюцию в соответствующей группе организмов с помощью модифицированного алгоритма максимального правдоподобия. Так как мы не могли определить точный момент в ходе эволюции, начиная с которого данный сайт стал модифицироваться, мы приняли, что этот момент совпадает с моментом появления самой первой аминокислоты того же типа в данном дереве. Далее мы считали количество замен предковых потенциальных сайтов модификации на другие типы аминокислот, и вычисляли вектора замен.

14

Эволюционные особенности и частота фосфосерииов и фосфотреонннов сильно зависят от структурного контекста, и они очень часто располагаются в неструктурированных областях белков. Известно, что неструктурированные и регулярные области белков сильно различаются по аминокислотному составу. Чтобы избежать влияния этого факта на результаты нашего анализа, мы разделили все фосфосайты и немодифицировапные остатки серина и треонина из контрольных выборок на сайты, расположенные в регулярных и неструктурированных областях белков (см. шоке).

Лишь часть фосфосерииов из наших начальных выборок имели замены на другие аминокислоты. Очень небольшая доля из них были локализованы в регулярных участках белков. Поэтому дальнейший анализ проводили только на остатках серина и треонина из неструктурированных участков белков. Конечные выборки фосфорилированных и нефосфорилированных остатков серина и треонина включали сайты с хотя бы одной заменой на другие аминокислоты, расположенные в неструктурированных областях фосфопротеинов. Отдельно рассматривалась подвыборка сайтов фосфорилирования, которые были подтверждены в более чем одном эксперименте (выборка "надежных сайтов").

Для оценки статистической значимости различий между векторами замен мы применили процедуру бутстрепа контрольных выборок ^модифицированных остатков серина и треонина. Размер каждой из 10000 случайных контрольных выборок соответствовал размеру анализируемой выборки фосфосайтов. Так, к примеру, в случае фосфосерииов человека каждая из контрольных выборок содержала по 4277 нефосфорилированных остатков серина. В случае же сравнительного анализа подвыборки фосфосайтов человека, обнаруженных в более чем одном массовом эксперименте, бугстрепы содержали по 906 контрольных сайтов.

В то же время, особенности белковых областей, окружающих сайты фосфорилирования, скорее всего, не ограничиваются лишь их неструктурированностыо. В частности, важную роль в фюсфорилировании может иметь вторичная структура, экспозиция на поверхности белка, доступность растворителям и т.п. Поэтому для уменьшения влияния данных факторов на результаты нашего сравнительного анализа, мы ввели дополнительные контрольные выборки. Они включали нефосфорилированные остатки серина и треонина, находящиеся в тех же областях белков, что и сайты модификаций. Размеры дополнительных контрольных выборок в каждом случае равнялись размерам анализируемых выборок, содержащих все фосфосайты. Достаточное количество немодифицированных остатков серина было набрано на максимальном расстоянии 10, 11 и 9 а.о. от фосфосерииов для дрожжей, дрозофилы и человека соответственно. В случае фосфотреонинов эти расстояния равнялись 29, 26, 20 а.о., соответственно.

Результаты сравнительного анализа векторов замен фосфорилированных и нефосфорилированных остатков серина показаны на Рисунке б (левая панель). Частоты замен фосфосерииов и серинов из контрольных выборок сильно варьировали между различными группами организмов. Однако некоторые тенденции были общими для всех таксонов и статистически значимыми.

! .л

|

1 8* 1 1

к гД.4 г.: ! 15

1 1 1 1" . .. 1 а < 1

Ь, 4- 1 г! 1 г Г 1 ► 4. ...

I г 1 Г 1.ггк ип.

Б Б

.........4.- 1

I I 1

1

Ькт *

в

I 1

1 1 1 1 *

т ^ м-

Г"

1 Ц . ; |"1 , 1 I Г.

I'

1 1 " ! 1 ! 1 '

г гР И-гГк ц

Рисунок 4. Вектора замен серинов (левая панель) и треонинов (правая панель) на другие типы аминокислот. Частоты замен серинов и треонинов из неструктурированных участков фосфопротеинов среди грибов (А), дрозофил (Б) и позвоночных (В): для всех фосфосайтов - белые треугольники; для фосфосайтов, обнаруженных в нескольких экспериментах - черные треугольники; 10000 контрольных выборок - облака больших светло-серых и маленьких темно-серых точек, соответственно; дополнительные контрольные выборки ближайших к фосфосайтам нефосфорилированных серинов и треонинов - горизонтальные полоски.

Вопреки ожиданиям, предпочтения замен фосфосершюв на треошшы и тирозины, которые также являются фосфорилируемыми аминокислотами, обнаружено не было. В то же время, при фосфорилировании остаток серина приобретает отрицательный заряд, и, как видно из полученных результатов, во всех трех группах организмов в процессе эволюции фосфосерины намного чаще заменялись на отрицательно заряженные остатки глутамата и аспартата (по сравнению с нефосфоршшрованными остатками серина). В обоих случаях частота замен остатков фосфосерина была намного выше, чем во всех 10000 случайных контрольных выборках (Р«10~4). В случае подвыборки более надежных фосфосайтов, подтвержденных в нескольких экспериментах, частота замен на аспартат и глугамат была

еще выше, и также лежала вне интервала частот, соответствующих 10000 бутстрепов (который в данном случае шире, так как размеры выборок значительно меньше).

Кроме этого, был и ряд других тенденций, общих для всех трех таксонов. В частности, фосфосерины относительно реже заменялись на остатки аланина, цистеина и аспарагина, по сравнению с контрольными выборками (Рисунок 4, левая панель). Однако в этих случаях немодифнцированные серины из тех же областей белков (дополнительные контрольные выборки) также заменялись на данные аминокислоты реже остальных нефосфорилированных серинов. Вероятнее всего, эти сдвиги в частотах замен связаны не с шетграпеляционными модификациями, а с особенностями участков белков, в которых расположены фосфосайты.

В случае же фосфотреонинов никаких значимых и общих для всех трех таксонов различий между частотами замен фосфосайтов и треонинами из контрольных выборок отмечено не было (Рисунок 4, правая панель). Это может быть связано с тем, что размеры выборок фосфотреонинов были значительно меньше размеров выборок фосфосеринов. В частности, как и в случае фосфосеринов, не было замечено никакого предпочтения к заменам фосфосайтов на другие фосфорилируемые типы аминокислот (серины и тирозины). Паттерны замен сайтов ацетилирования

В дополнение к анализу эволюции фосфорилирования белков, мы провели аналогичное исследование сайтов ацетилирования лизина, также широко распространенного и консервативного типа носттрансляционных модификаций. В анализ были включены массовые протеомные данные по ацетшшрованию белков человека, полученные в двух высокопроизводительных экспериментах. Эти наборы данных были получены из различных типов клеток. Более того, различались и субклеточные фракции, из которых выделялись ацетилированные пептиды. Пересечение между наборами ацетилированных белков, идентифицированных в этих двух исследованиях, было крайне малым (8% белков были общими для двух наборов ацетилпротеинов). На уровне конкретных сайтов ацетилирования, это пересечение было еще меньше - мы обнаружили всего 2% ацетиллизинов, общих для этих двух выборок. В связи с этим, было принято решение рассматривать эти наборы данных раздельно.

Мы изучали эволюцию сайтов ацетилирования человека среди восьми видов позвоночных. Анализ проводился аналогично исследованию эволюции фосфосайтов. Двд каждого сайта фосфорилирования мы реконструировали эволюцию и вычисляли вектора замен (Рисунок 5). Для оценки статистической значимости различий между векторами замен была применена процедура бутстрепа контрольных выборок.

Аналогично фосфосайтам, лишь часть ацетилированных лизинов из начальных выборок имели замены на другие аминокислоты. В отличие от сайтов фосфорилирования, мы не разделяли сайты ацетилироваши по расположению в неструктурированных и регулярных областях белков.

0.(0 ------ 1.Г 4 4-

Рисунок 5. Вектора замен лизинов на другие типа аминокислот. Частоты замен лизинов среди позвоночных: для ацетилированных лизинов из клеточных линий М\/4-11, А549 и иигка! - белые треугольники; для ацетилированных лизинов из клеток печени - черные треугольники; 10000 контрольных выборок - облака больших светло-серых и маленьких темно-серых точек, соответственно.

Как видно из резз'льтатов анализа (Рисунок 5), вектора замен ацетилированных и неацетилированных остатков лизина также имели некоторые различия, но результаты, полученные для двух различных наборов данных, были несогласованными. По всей видимости, как и в случае с фосфорилированными остатками треонина и тирозина, доступных на сегодняшний день данных по ацетилированию белков недостаточно для получения значимых результатов.

Обсуждение результатов анализа эволюции посттрансляционных модификаций

Мы провели сравнительный эволюционный анализ паттернов замен сайтов посттрансляционных модификаций белков и их ^модифицированных аналогов. В частности, была реконструирована и изучена эволюция сайтов фосфорилирования серина и треонина, а также сайтов ацетилирования лизина.

Нами было показано, что в процессе эволюции фосфосерины намного чаще заменяются на отрицательно заряженные остатки глутамата и аспартата (по сравнению с нефосфорилированными остатками серина). Эта тенденция наблюдалась во всех трех группах организмов. Во всех таксонах эта разница была статистически значимой (Р«10 ), а в случае подвыборок надежных сайтов, подгвержденных в нескольких экспериментах, этот эффект был ещё более выраженным. Это наблюдение интересно тем, что искусственная замена серина на аспартат или глутамат, так называемая фосфомиметическая мутация, часто используется для функционального подтверждения фосфорилирования серина.

С другой стороны, методы, используемые в массовых фосфопротеомных экспериментах, часто основаны на предварительной аффинной селекции отрицательно заряженных пегггидов. Это приводит к обогащению фосфопептидов кислотными остатками. Также было показано, чгго некоторые случаи фосфорилирования могут быть функционально консервативными, но при этом не сохранять конкретные позиции в быстро эволюционирующих неструктурированных областях белков. Так, в некоторых случаях функциональной целью фосфорилирования являются не конкретные сайты, а целые участки

18

белков. В таких случаях позиции сайтов фосфорилирования в ортологичных белках могут быть смещены относительно друг друга.

Все это, вместе со структурными особенностями белковых областей, в которых расположены фосфосайты, и проблемами, возникающими при выравниваниях таких областей, могло исказить результаты нашего анализа. Но все эти факторы должны оказывать такой же эффект и на выборку пефосфорилировшшых остатков серина, расположенных в тех же областях белков. Таким образом, эти факторы не могут объяснить наблюдаемую разницу между векторами замен фосфоссршшв и серннов из дополнительных контрольных выборок, расположенных в непосредственной близости от фосфосайтов.

Необходимо учитывать, что анализируемые в данной работе вектора замен сайтов модификаций, вполне возможно, содержат ложные фосфосайты. Это может являться как экспериментальным артефактом массовых протеомных исследований, так и результатом нашей методики реконструкции эволюции фосфосайтов. Кроме того, существуют данные о том, что многие из идентифицированных сайтов фосфорилирования могут быть нефункциональными, и являться результатом неспецифичного фосфорилирования киназами. Паттерны замен таких нефункциональных фосфосайтов, скорее всего, будет схож с паттернами замен нефосфорилированных остатков серина. С другой стороны, контрольные выборки могут содержать еще не идентифицированные сайты фосфорилирования. Эти ложные, неспецифичные и неидентнфицировшшые фосфосайты должны размывать наблюдаемую разницу между векторами замен модифицированных и немодифицированных остатков. Тем самым, реальная разница частот замен может быть еще выше, чем было показано в настоящей работе.

В то же время, для других типов постгрансляцшшных модификаций значимых различий между паттернами замен модифицированных и немодифицированных аминокислотных остатков обнаружено не было. Это могло стать результатом малого количества доступных данных. Кроме того, дополнительное ограничение на объем данных о заменах сайтов модификаций на другие типы аминокислот, накладывало количество доступных ортологов из других организмов. В случае ацетилировапия лизина результаты, полученные для двух различных наборов данных, оказались несогласованными. Это могло стать результатом низкой репрезентативности доступных на сегодняшний день данных по ацетилированию лизина. Поэтому результаты подобных исследований должны интерпретироваться крайне осторожно, и желательно основываться на данных, полученных из различных источников и для разнообразных групп организмов.

Основные результаты и выводы

1. Показано, что удержанные интроны значимо отличаются от конститутивно сплайсируемых по ряду параметров. В том числе, оказалось, что удержанные интроны в среднем короче, имеют более слабые сайты сплайашга, содержат больше энхансеров и меньше сайленсеров сплайсинга, по сравнению с конститутивно сплайсируемыми нитронами.

2. Показано, что удержанные интроны неравномерно распределены вдоль генов. В частности, доля удержанных интронов монотонно возрастает от 5'- к З'-концу транскриптов.

3. Выявлен ряд значимых различий между экзонами, включение которых нарушается в результате мутаций в сайтах сплайсинга (Б-экзсны), и экзонами, которые сохраняют включение, но сплайсируются по другому сайту (С-экзоны). Было показано, что экзоны в среднем короче, имеют более сильный акцепторный сайт, содержат меньше энхансеров и больше сайленсеров сплайсинга, по сравнению с С-экзонами. Кроме того, ближайшие потенциальные скрытые сайты сплайсинга расположены значительно ближе к аутентичным сайтам сплайсинга С-экзонов, по сравнению с экзонами.

4. Показано, что фосфосерииы и фосфотреонины в среднем чаще располагаются в альтернативно сплайсируемых областях генов, по сравнению с нефосфорилированными остатками серина и треонина.

5. Была выдвинута и проверена гипотеза о том, что посттрансляционно модифицированные аминокислоты в процессе эволюции могут вести себя отлично от своих немодифицированных аналогов (с точки зрения частот замен на другие типы аминокислот). Выявлены значимые различия между векторами замен фосфорилированных и нефосфорилированных остатков серина. Оказалось, что фосфосерииы чаще заменяются на глутамаг и аспартат, по сравнению с нефосфорилированными остатками серина.

Список публикаций по теме диссертации

Статьи в научных журналах

1. Kurmangaliyev Y.Z., Gelfand M.S. Computational analysis of splicing errors and mutations in human transcripts // BMC Genomics. - 2008. -9.- 13.

2. Курмангалиев Е.Ж., Гельфанд M.C. Сайты, фосфорилирования тяготеют к альтернативно сплайсируемым областям белков // Молекулярная биология. - 2009. -43. - 572-574.

3. Kurmangaliyev Y.Z., Goland A., Gelfand M.S. // Evolutionary patterns of phosphorylated serines // Biology Direct. - 2011. -6.-8.

Тезисы конференций

1. Курмангалиев Е.Ж. Использование удержанных интронов для изучения ошибок сплайсинга // Материалы XIV Международной конференции студентов, аспирантов и молодых ученых "Ломоносов". - 2007. - 56.

2. Kurmangaliyev Y.Z. Exon skipping and activation of cryptic sites as consequences of splicing mutations // Proc. of 3rd Moscow Conference on Computational Molecular Biology (MCCMB'07). - 2007. - 168.

3. Курмангалиев Е.Ж. Последствия мутаций в сайтах сплайсинга: пропуск экзона и активация сайтов сплайсинга // Информационные технологии и системы (ИТиС'08): сборник трудов конференции. - 2007. - 255-256.

4. Kurmangaliyev Y.Z., Gelfand MS. Alternative splicing tends to involve phosphorylation sites // Информационные технологии и системы (ИТиС'08): сборник трудов конференции. - 2008. - 304-305.

5. Kurmangaliyev Y.Z. Patterns of evolution in protein phosphorylation sites // Proc. of 4th Moscow Conference on Computational Molecular Biology (MCCMB'09). - 2009. - 199200.

6. Курмангалиев E. Изучение эволюции сайтов ацетилирования лизина в белках позвоночных // Информационные технологии и системы (ИТиС'Ю): сборник трудов конференции. - 2010. - 415.

Автор выражает искреннюю благодарность своему научному руководителю Михаилу

Сергеевичу Гсльфанду, а также коллегам из УНЦ «Бноннформатика» 1ШГП1 РАН.

Автор также благодарит свою семью и друзей за терпение и поддержку при подготовке

диссертации.

Подписано в печать:

19.10.2011

Заказ N° 6078 Тираж - 100 экз. Печать трафаретная. Объем: 1 усл.п.л. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 www. autoreferat. ru

Содержание диссертации, кандидата биологических наук, Курмангалиев, Ербол Жанузакович

Введение.

Актуальность темы.

Цели и задачи исследования.

Научная новизна и практическая ценность.

Апробация работы.

Структура и объем диссертации.

Список публикаций по теме диссертации.

1 .Обзор литературы.

1.1 Альтернативный сплайсинг.

1.1.1 Распознавание сайтов сплайсинга через интрон и через экзон.

1.1.2 Цис-регуляторные элементы сплайсинга.

1.1.3 Котранскрипционный сплайсинг.

1.1.4 Альтернативный сплайсинг и структура белков.

1.2 Посттрансляционные модификации.

1.2.1 Фосфопротеомика.

1.2.2 Структурные особенности сайтов фосфорилирования.

1.2.3 Эволюционные особенности сайтов фосфорилирования.

1.2.4 Нефункциональное и неспецифичное фосфорилирование.

1.2.5 Протеомные исследования ацетилирования лизина.

2.Данные и методы.

2.1 Данные.

2.1.1 Выборки удержанных и конститутивно сплайсируемых интронов.

2.1.2 Выборки экзонов с мутациями в сайтах сплайсинга.

2.1.3 Данные по включаемости кодонов.

2.1.4 Сайты посттрансляционных модификаций.

2.1.5 Контрольные выборки немодифицированных аминокислотных остатков.

2.1.6 Ортологи модифицированных белков и филогенетические деревья.

2.2 Методы и программное обеспечение.

2.2.1 Веса сайтов сплайсинга.

2.2.2 Плотность энхансеров и сайленсеров сплайсинга.

2.2.3 Реконструкция эволюции сайтов модификаций.

2.2.4 Предсказание неструктурированных областей белков.

2.2.5 Проверка статистической значимости.

2.2.6 Авторское программное обеспечение.

3.Результаты и обсуждения.

3.1 Ошибки сплайсинга.

3.1.1 Удержанные интроны.

3.1.2 Мутации в сайтах сплайсинга.

3.1.3 Обсуждение результатов анализа удержанных интронов и мутаций в сайтах сплайсинга.

3.2 Альтернативный сплайсинг и посттрансляционные модификации.

3.2.1 Сайты фосфорилирования тяготеют к альтернативно сплайсируемым областям генов.

3.2.2 Обсуждение взаимосвязи между альтернативным сплайсингом и посттрансляционными модификациями.

3.3 Паттерны эволюции посттрансляционных модификаций.

3.3.1 Паттерны замен сайтов фосфорилирования.

3.3.2 Паттерны замен сайтов ацетилирования.

3.3.3 Обсуждение анализа эволюции посттрансляционных модификаций.

Введение Диссертация по биологии, на тему "Сравнительно-геномный анализ посттранскрипционных и посттрансляционных механизмов регуляции структуры и функции белков"

Актуальность темы

До полного секвенирования генома человека высказывались самые различные предположения об. общем количестве генов. При этом достаточно общепринятой была точка зрения, что количество генов возрастает со сложностью биологических организмов. Поэтому неожиданными оказались результаты первичного анализа полного генома человека, который выявил менее 30000 генов. Для сравнения,, в геноме' круглого червя СаепогНаЪйШх е^апя содержится примерно 20000 генов.

Однако разнообразие белков не ограничивается лишь общим числом генов. У высших эукариот одним из основных механизмов повышения разнообразия генных продуктов на посттранскрипционном уровне является альтернативный сплайсинг. Существуют различные оценки общего числа альтернативно сплайсйруемых генов человека. Массовое секвенирование ЕБТ-последовательностей и их анализ показали, что' не менее трети генов человека альтернативно сплайсируются. Дальнейшее увеличение объема данных о транскриптоме человека только увеличивало эту оценку, которая сейчас достигла 90-95%.

С другой стороны, неясно, какая доля из предсказанных по ЕБТ-последовательностям вариантов транскриптов являются функциональными, а какая является результатом ошибок механизма сплайсинга или экспериментальными артефактами. Традиционно исследователей интересует в первую очередь функциональный альтернативный сплайсинг, и они пытаются очистить анализируемые наборы данных от нефункциональных транскриптов. В то же время, анализ последствий подобных ошибок может дать информацию о том, как функционирует сам механизм сплайсинга. Одной из ошибок сплайсинга является удержание интрона. Другим интересным объектом являются мутации в сайтах сплайсинга, нарушающие их распознавание, что может приводить к различным последствиям. По некоторым данным, мутации, нарушающие сплайсинг пре-мРНК, потенциально являются одной из наиболее частых причин наследственных заболеваний. Поэтому исследования последствий ошибок сплайсинга, и, в частности, мутаций, затрагивающих сплайсинг, может также иметь важное практическое значение.

В то же время, структурное и функциональное разнообразие генных продуктов не ограничивается лишь набором транскриптов, получаемых при альтернативном сплайсинге. Уже после синтеза белки могут подвергаться дальнейшим посттрансляционным модификациям путем ковалентного присоединения различных функциональных групп или протеолитического расщепления. Посттрансляционные модификации играют важнейшую роль в самых разнообразных клеточных процессах путем влияния на активность белков, их клеточную локализацию и взаимодействия с другими белками. Одним из наиболее важных и распространенных типов посттрансляционных модификаций эукариот является обратимое фосфорилирование белков по остаткам'серина, треонина-и тирозина. По некоторым оценкам, треть белков, закодированных в геноме человека, содержат ковалентно связанный фосфат. В последние годы, с развитием новых методов в протеомике и масс-спектроскопии, количество фосфосайтов, идентифицированных в белках различных модельных организмов, достигло десятков тысяч. Накопление таких больших объемов протеомных данных позволяет проводить системные исследования посттрансляционных модификаций методами биоинформатики. Одной из таких задач является исследование возможной связи посттранскрипционных и посттрансляционных механизмов регуляции генов.

Другой интересный вопрос заключается в том, как эволюционируют сайты посттрансляционных модификаций. Как и все функционально важные участки белков, сайты модификаций более консервативны по сравнению с окружающими их аминокислотными остатками. Однако, кроме функциональной значимости, модифицированные аминокислоты отличаются от своих немодифицированных аналогов и по химическим свойствам. Поэтому мутации в сайтах модификаций и их немодифицированных аналогах, приводящие к их замене на другие типы аминокислот, скорее всего, будут иметь различное влияние на структуру и функцию белков. Это должно приводить к различиям в частотах замен модифицированных и немодифицированных аминокислот на другие типы аминокислотных остатков.

Цель и задачи исследования

Целью данной работы было исследование различных аспектов посттранскрипционной и посттрансляционной регуляции структуры и функции белков с помощью компьютерного анализа новейших доступных данных. В частности, были исследованы ошибки альтернативного сплайсинга и эволюционные паттерны посттрансляционных модификаций. При этом были решены следующие задачи:

• собрана выборка интронов, для которых наблюдались случаи удержания в транскриптах;

• проведен сравнительный анализ удержанных и конститутивных интронов;

• собрана выборка экзонов, мутации в сайтах сплайсинга которых приводили к пропуску этих экзонов;

• проведен сравнительный анализ экзонов, в которых мутации в сайтах сплайсинга приводят к пропуску экзона и к активации скрытых сайтов сплайсинга;

• исследована возможная связь между альтернативным сплайсингом и посттрансляционными модификациями путем анализа распределения сайтов фосфорилирования между различными участками белков;

• проведена реконструкция эволюции сайтов посттрансляционных модификаций, в том числе, сайтов фосфорилирования и сайтов ацетилирования;

• проведен сравнительный анализ паттернов замен сайтов посттрансляционных модификаций и их немодифицированных аналогов на другие типы аминокислот.

Научная/новизна и практическое значение

В данной работе был проведен систематический анализ ошибок сплайсинга. Выявлены достоверные различия между конститутивными и удержанными интронами по ряду параметров (в т.ч. по длине, по качеству сайтов сплайсинга, по плотности потенциальных цис-регуляторных элементов, по расположению - в генах). Впервые было показано, что доля удержанных интронов монотонно возрастает от 5"- к 3"-концу транскриптов.

Проведен анализ экзонов с мутациями в сайтах сплайсинга. Собрана выборка экзонов, мутации- сайтов сплайсинга в которых вызывают пропуск экзона. Выявлены значимые различия между экзонами, в которых мутации в сайтах сплайсинга приводят к пропуску экзона либо к активации скрытого сайта сплайсинга (в т.ч. по длине, по весу сайтов сплайсинга, по плотности потенциальных цис-регуляторных элементов, по наличию эквивалентных скрытых сайтов сплайсинга в непосредственной близости от сайтов с мутациями).

Получены данные о возможной связи альтернативного сплайсинга и посттрансляционных модификаций. Выдвинута гипотеза о различиях в частотах замен модифицированных и немодифицированных аминокислотных остатков на другие типы аминокислот. Впервые проведен эволюционный анализ паттернов замен сайтов посттрансляционных модификаций. На примере сайтов фосфорилирования выявлены значимые различия между векторами^ замен модифицированных'и немодифицированных аминокислотных остатков. В частности показано, что фосфорсерины в среднем чаще заменяются на глутамат и аспартат, по сравнению с нефосфорилированными остатками серина. Реализованная методика анализа паттерна замен сайтов фосфорилирования может использоваться для исследования других типов посттрансляционных модификаций.

В целом, полученные в этом исследование результаты могут использоваться при предсказании возможных последствий мутаций в сайтах сплайсинга и посттрансляционных модификаций, что может иметь практическое значение в исследованиях наследственных заболеваний и найти применение в персонализированной медицине.

Апробация работы

Материалы исследования по теме диссертации были представлены на следующих конференциях: XIV Международной конференции студентов, аспирантов и молодых ученых "Ломоносов" (Москва, апрель 2007); 3rd International Moscow Conference on Computational Molecular Biology (MCCMB'07, Москва, июль 2007); 30-й конференции "Информационные технологии и системы" (ИТиС'07, Звенигород, сентябрь 2007); 31-й конференции "Информационные технологии и системы" (ИТиС'08, Геленджик, сентябрь, 2008); 4th International Moscow Conference on Computational Molecular Biology (MCCMB'09, Москва, июль 2009); 33-й конференции "Информационные технологии и системы" (ИТиС'10, Геленджик, сентябрь 2010).

Объем и структура диссертации

Диссертационная работа изложена на 110 страницах и состоит из введения, трех глав, выводов, списка цитированной литературы и приложений. Глава 1 содержит обзор литературы по теме диссертации. Глава 2 содержит описание данных, методов и программного обеспечения использовавшихся при решении задач, поставленных в диссертации. Глава 3 содержит описание полученных результатов и их обсуждение. Список литературы содержит 206 наименований. В приложениях приведены дополнительные материалы, не вошедшие в основные разделы диссертации. Работа содержит 21 рисунок и 10 таблиц.

Заключение Диссертация по теме "Математическая биология, биоинформатика", Курмангалиев, Ербол Жанузакович

Основные результаты и выводы

1. Показано, что удержанные интроны значимо отличаются от конститутивно сплайсируемых по ряду параметров. В том числе оказалось, что удержанные интроны в ¡.среднем короче, имеют более слабые сайты сплайсинга, содержат больше энхансеров и меньше сайленсеров сплайсинга, по сравнению с конститутивно сплайсируемыми интронами.

2. Показано, что удержанные интроны неравномерно распределены вдоль генов. В частности, доля удержанных интронов монотонно возрастает от 5Ч- к Зч-концу транскриптов.

3. Выявлен ряд значимых различий между экзонами, включение которых нарушается в результате мутаций в сайтах сплайсинга (Б-экзоны), и экзонами, которые сохраняют включение, но. сплайсируются по другому сайту (С-экзоны). Было показано, что 8-экзоны в среднем короче, имеют более сильный акцепторный сайт, содержат меньше энхансеров и,больше сайленсеров сплайсинга, по сравнению с С-экзонами. Кроме* того, ближайшие потенциальные- скрытые сайты сплайсинга расположены значительно ближе к аутентичным сайтам'сплайсинга С-экзонов, по сравнению с 8-экзонами.

4. Показано, что фосфосерины и фосфотреонины в среднем чаще располагаются в альтернативно сплайсируемых областях генов, по сравнению с нефосфорилированнымиостатками серина и треонина.

5. Была выдвинута и проверена гипотеза о том, что посттрансляционно модифицированные аминокислоты в процессе эволюции могут вести себя отлично от своих немодифицированных аналогов (с точки зрения частот замен на другие типы аминокислот). Выявлены значимые различия между векторами замен фосфорилированных и нефосфорилированных остатков серина. Оказалось, что фосфосерины чаще заменяются на глутамат и аспартат, по сравнению с нефосфорилированными остатками серина.

Благодарности

Хочу выразить искреннюю благодарность своему научному руководителю Михаилу Сергеевичу Гельфанду, а также коллегам из УНЦ «Биоинформатика» ИППИ РАН за ценные советы и помощь в выполнении работы. Хочу также поблагодарить свою семью и друзей за терпение и поддержку при подготовке диссертации.

Библиография Диссертация по биологии, кандидата биологических наук, Курмангалиев, Ербол Жанузакович, Москва

1. Will C.L., Lührmann R. Spliceosome structure and function // Cold Spring Harbor Perspectective in Biology. 2011. - 3. - a003707.

2. Jurica M.S., Moore M.J. Pre-mRNA splicing: awash in a sea of proteins // Molecular Cell. 2003. - 12. - 5-14.

3. Patel A.A., Steitz J.A. Splicing double: insights from the second spliceosome // Nature Reviews. Molecular cell biology. 2003. - 4. - 960-970.

4. Ast G. How did alternative splicing evolve? // Nature Reviews. Genetics. 2004. - 5. -773-782.

5. Wang Z., Bürge C.B. Splicing regulation: from a parts list of regulatory elements to an integrated splicing code // RNA. 2008. - 14. - 802-813.

6. Lodish H., Berk A., Matsudaira P., Kaiser C.A., Krieger M., Scott M.P., Zipursky L., Darnell J. Molecular Cell Biology. New York: W. H. Freeman, 2003. - 493-509.

7. Berget S.M., Moore C., Sharp P.A. Spliced segments at the 5' terminus of adenovirus 2 late mRNA // PNAS. 1977. - 74. - 3171-3175.

8. Chow L.T., Gelinas R.E., Broker T.R., Roberts R.J. An amazing sequence arrangement at the 5' ends of adenovirus 2 messenger RNA // Cell. 1977. - 12. - 1-8.

9. Artamonova I.I., Gelfand M.S. Comparative genomics and evolution of alternative splicing: the pessimists' science // Chemical Reviews. 2007. - 107. - 3407-3430.

10. Mironov A.A., Fickett J.W., Gelfand M.S. Frequent alternative splicing of human genes // Genome Research. 1999 - 9. - 1288-1293.

11. Brett D., Hanke J., Lehmann G., Haase S., Delbrück S., Krueger S., Reich J., Bork P. EST comparison indicates 38% of human mRNAs contain possible alternative splice forms // FEBS Letters. 2000. - 474. - 83-86.

12. Schmucker D., Clemens J.C., Shu H., Worby C.A., Xiao J., Muda M., Dixon J.E., Zipursky S.L. Drosophila Dscam is an axon guidance receptor exhibiting extraordinary molecular diversity // Cell. 2000. - 101. - 671-684.

13. Nilsen T.W., Graveley B.R. Expansion of the eukaryotic proteome by alternative splicing // Nature. 2010. - 463. - 457-463

14. Berget S.M. Exon recognition in vertebrate splicing // The Journal of Biological Chemistry. 1995. - 270. - 2411-2414.

15. Nakai K., Sakamoto H. Construction of a novel database containing aberrant splicing mutations of mammalian genes // Gene. 1994. - 141. - 171-177.

16. Talerico M., Berget S.M. Intron definition in splicing of small Drosophila introns // Molecular and Cellular biology. 1994. - 14. - 3434-3445.

17. Matlin A J., Clark F., Smith C.W. Understanding alternative splicing: towards a cellular code // Nature reviews. Molecular and Cellular biology. 2005. - 6. - 386-398.

18. Graveley B.R., Hertel K.J., Maniatis T. A systematic analysis of the factors that determine the strength of pre-mRNA splicing enhancers // The EMBO Journal. 1998. -17. - 6747-6756.

19. Pozzoli U., Sironi M. Silencers regulate both constitutive and alternative splicing events in mammals // Cell and Molecular Life Sciences. 2005. - 62. - 15791604.

20. Fairbrother W.G., Yeh R.F., Sharp P.A., Burge C.B. Predictive identification of exonic splicing enhancers in human genes // Science. 2002. - 297. - 1007-1013.

21. Fairbrother W.G., Holste D., Burge C.B., Sharp P.A. Single nucleotide polymorphism-based validation of exonic, splicing enhancers // PLoS i Biology. 2004. -2. - E268.

22. Zhang X.H., Chasin L.A. Computational definition of sequence motifs governing constitutive exon splicing // Genes and Development. 2004. - 18. - 1241-1250.

23. Zhang X.H., Kangsamaksin T., Chao M.S., Baneijee J.K., Chasin L.A. Exon inclusion is dependent on predictable exonic splicing enhancers // Molecular and Cellular Biology. -2005. 25. - 7323-7332.

24. Liu H.X., Zhang M., Krainer A.R. Identification of functional exonic splicing enhancer motifs recognized by individual SR proteins // Genes and Development. 1998.- 12. 1998-2012.

25. Liu H.X., Chew S.L., Cartegni L., Zhang M.Q., Krainer A.R. Exonic splicing enhancer motif recognized by human SC35 under splicing, conditions // Molecular and Cellular Biology. 2000. - 20. - 1063-1071.

26. Cartegni L., Wang J., Zhu Z., Zhang M.Q., Krainer A.R. ESEfinder: A web resource to identify exonic splicing enhancers // Nucleic Acids Research. 2003. - 31. - 3568-3571.

27. Smith P.J., Zhang C., Wang J., Chew S.L., Zhang M.Q., Krainer A.R. An increased specificity score matrix for the prediction of SF2/ASF-specific exonic splicing enhancers // Human Molecular Genetics. 2006. - 15. - 2490-2508.

28. Wang Z., Rolish M.E., Yeo G., Tung V., Mawson M„ Bürge C.B. Systematic-identification and analysis of exonic splicing silencers // Cell. 2004. - 119. - 831-845.

29. Wang Z., Xiao X., Van Nostrand E., Bürge C.B. General and specific functions of exonic splicing silencers in splicing control // Molecular Cell. 2006. - 23. - 61-70.

30. McCullough A.J., Berget S.M. G triplets located throughout a class of small vertebrate introns enforce intron borders and regulate splice site selection // Molecular and

31. Cellular Biology. 1997. - 17. - 4562-4571.

32. McCullough A.J., Berget S.M. An intronic splicing enhancer binds U1 snRNPs to enhance splicing and select 5' splice sites // Molecular and Cellular Biology. 2000. - 20.- 9225-9235.

33. Hui J., Hung L.H., Heiner M., Schreiner S., Neumüller N., Reither G., Haas S.A., Bindereif A. Intronic CA-repeat and CA-rich elements: a new class of regulators of mammalian alternative splicing // The EMBO Journal. 2005. - 24. - 1988-1998.

34. Hung L.H., Heiner M., Hui J., Schreiner S., Benes V., Bindereif A. Diverse roles of hnRNP L in mammalian mRNA processing: a combined microarray and RNAi analysis // RNA. 2008. - 14. - 284-296.

35. Brudno M., Gelfand M.S., Spengler S., Zorn M., Dubchak I., Conboy J.G. Computational analysis of candidate intron regulatory elements for tissue-specific alternative pre-mRNA splicing // Nucleic Acids Research. 2001. - 29. - 2338-2348.

36. Jin Y., Suzuki H., Maegawa S., Endo H., Sugano S., Hashimoto K., Yasuda K., Inoue K. A vertebrate RNA-binding protein Fox-1 regulates tissue-specific splicing via the pentanucleotide GCAUG // The EMBO Journal. 2003. - 22. - 905-912.

37. Sorek R., Ast G. Intronic sequences flanking alternatively spliced exons are conserved between human and mouse // Genome Research. 2003. - 13. - 1631-1637.

38. Kornblihtt A.R., de la Mata M., Fededa J.P., Munoz M.J., Nogues G. Multiple links between transcription and splicing // RNA. 2004. - 10 - 1489-1498.

39. McCracken S., Fong N., Yankulov K., Ballantyne S., Pan G., Greenblatt J., Patterson S.D., Wickens M., Bentley D.L. The C-terminal domain of RNA. polymerase II couples mRNA processing to transcription // Nature. 1997. - 385. - 357-361.

40. Zeng C., Berget S.M. Participation of the C-terminal domain of RNA polymerase II in exon definition during pre-mRNA splicing // Molecular and'Cellular Biology. 2000. -20. - 8290-8301.i

41. Brody Y., Neufeld N., Bieberstein N., Causse S.Z., Böhnlein E.M., Neugebauer K.M., Darzacq X., Shav-Tal Y. The in vivo kinetics of RNA polymerase II elongation during co-transcriptional splicing // PLoS Biology. 2011. - 9. - el000573.

42. Schwartz S., Meshorer E., Ast G. Chromatin organization marks exon-intron structure // Nature Structural and Molecular Biology. 2009. - 16. - 990-995.

43. Tilgner H., Nikolaou C., Althammer S., Sammeth M., Beato M., Valcarcel J., Guigo R. Nucleosome positioning as a determinant of exon recognition // Nature Structural and Molecular Biology. 2009. - 16. - 996-1001.

44. Luco R.F., Pan Q., Tominaga K., Blencowe B J., Pereira-Smith O.M., Misteli T. Regulation of alternative splicing by histone modifications // Science. 2010. - 327. -996-1000.

45. Kriventseva E.V., Koch I., Apweiler R., Vingron M., Bork P., Gelfand M.S., Sunyaev S. Increase of functional diversity by alternative splicing // Trends in Genetics. 2003. - 19.- 124-128.

46. Xing Y., Xu Q., Lee C. Widespread production of novel soluble protein isoforms by alternative splicing removal of transmembrane anchoring domains // FEBS Letters. -2003. 555. - 572-578.

47. Cline M.S., Shigeta Rl, Wheeler R.L., Siani-Rose M.A., Kulp D., Loraine A.E. The effects of alternative splicing on transmembrane proteins in the mouse genome // Pacific Symposium on Biocomputing. 2004. -9. - 17-28.

48. Liu S., Altman R.B. Large scale study of protein domain distribution in the context of alternative splicing // Nucleic Acids Research. 2003. - 31. - 4828-4835.

49. Wang P., Yan B., Guo J.T., Hicks C., Xu Y. Structural genomics analysis of alternative splicing and application to isoform structure modeling // PNAS. 2005. - 102.- 18920-18925.

50. Tompa P. Intrinsically unstructured proteins // TRENDS in Biochemical Sciences. -2002. 27. - 527-533.

51. Dunker A.K., Brown C J., Lawson J.D., Iakoucheva L.M., Obradovic Z. Intrinsic Disorder and Protein Function // Biochemistry. 2002. - 41. - 6573-6582.

52. Iakoucheva L.M., Radivojac P., Brown C.J., O'Connor T.R., Sikes J.G., Obradovic Z., Dunker A.K. The importance of intrinsic disorder for protein phosphorylation // Nucleic Acids Research. 2004. - 32. - 1037-1049.

53. Mann M., Jensen O.N. Proteomic analysis of post-translational modifications // Nature biotechnology. 2003. - 21. - 255-261.

54. Seo J., Lee K. Post-translational Modifications and Their Biological Functions: Proteomic Analysis and Systematic Approaches // Journal of Biochemistry and Molecular Biology. 2004. - 37. - 35-44.

55. Lin H., Begley T. Protein posttranslational modifications: Chemistry, biology, and applications //Molecular BioSysems. 2011. - 7. - 14—15.

56. Manning G., Whyte D.B., Martinez R., Hunter T., Sudarsanam S. The Protein Kinase Complement of the Human Genome // Science. 2002. - 298. - 1912-1934.

57. Walsh C.T., Garneau-Tsodikova S., Gatto G.J. Protein Posttranslational Modifications: The Chemistry of Proteome Diversifications // Angewandte Chemie (International ed. in English). 2005, - 44, - 7342 - 7372.

58. Bhaumik S.R., Smith E., Shilatifard A, Covalent modifications of histones during development and disease pathogenesis // Nature structural and molecular biology. 2007.- 14. 1008-1016.

59. Latham J.A., Dent S.Y.R. Cross-regulation of histone modifications // Nature structural and molecular biology. 2007. - 14. - 1017-1024.

60. Hunter T. The age of crosstalk: phosphorylation, ubiquitination, and beyond // Molecular Cell. 2007. 28. - 730-738.

61. Zeidan Q., Hart G.W. The intersections between O-GlcNAcylation and phosphorylation: implications for multiple signaling pathways // Journal of Cell Sciecnce.- 2010. 123. - 13-22.

62. Hunter T. Signaling—2000 and Beyond // Cell. 2000. - 100. - 113-127.

63. Cohen P. The origins of protein phosphorylation // Nature Cell Biology. 2002. - 4. -E.127-E.130.

64. Olsén J.V., Blagoev B., Gnad F., Macek B., Kumar C., Mortensen P., Mann M. Global, In Vivo, and Site-Specific Phosphorylation Dynamics in Signaling Networks // Cell. -2006. 127. - 635-648.

65. Choudhary C., Mann M. Decoding signalling networks by mass spectrometry-based proteomics // Nature reviews. Molecular cell biology. 2010. - 11. - 427-439.

66. Ficarro S.B., McCleland M.L., Stukenberg P.T., Burke D.J., Ross M.M., Shabanowitz J., Hunt D.F., White F.M. Phosphoproteome analysis by mass spectrometry and its application to Saccharomyces cerevisiae // Nature Biotechnology. 2002. - 20. - 301-305.

67. Ptacek J., Snyder M. Charging it up: global analysis of protein phosphorylation // Trends in Genetics. 2006. - 22. - 545-554.

68. Hoch J.A. Two-component and phosphorelay signal transduction // Current Opinion in Microbiology. 2000. - 3. - 165-170.

69. Soufi B., Jers C., Hansen M.E., Petranovic D., Mijakovic I. Insights from site-specific phosphoproteomics in bacteria / / Biochimica et Biophysica Acta. 2008. - 1784. - 186192.

70. Macek B., Mijakovic I., Olsen J.V., Gnad F., Kumar C., Jensen P.R., Mann M. The Serine/Threonine/Tyrosine Phosphoproteome of the Model Bacterium Bacillus subtilis // Molecular and Cellular Proteomics. 2007. - 6. - 697-707.

71. Macek B., Gnad F., Soufi B., Kumar C., Olsen J.V., Mijakovic I., Mann M. Phosphoproteome Analysis of E. coli Reveals Evolutionary Conservation of Bacterial Ser/Thr/Tyr Phosphorylation // Molecular & Cellular Proteomics. 2008. - 7. - 299-307.

72. Soufi B., Gnad F., Jensen P.R., Petranovic D., Mann M., Mijakovic I., Macek B. The Ser/Thr/Tyr phosphoproteome of Lactococcus lactis IL1403 reveals multiply phosphorylated proteins // Proteomics. 2008. - 8. - 3486-3493.

73. Aivaliotis M., Macek B., Gnad F., Reichelt P., Mann M., Oesterhelt D. Ser/Thr/Tyr Protein Phosphorylation in the Archaeon Halobacterium salinarum—A Representative of the Third Domain of Life // PLoS One. 2009. - 4. - e4777.

74. Kersten B., Agrawal G.K., Durek P., Neigenfind J., Schulze W., Walther D„ Rakwal R. Plant phosphoproteomics: An update // Proteomics. 2009. - 9. - 964-988.

75. Nuhse T.S., Stensballe A., Jensen O.N., Pecka S.C. Phosphoproteomics of the Arabidopsis Plasma Membrane and a New Phosphorylation Site Database // The Plant Cell. 2004: - 16. - 2394-2405.

76. Benschop» J.J., Mohammed S., O'Flaherty M., Heck A.J.R., Slijper M, Menke F.L.H. Quantitative Phosphoproteomics of Early Elicitor Signaling in'Arabidopsis // Molecular & Cellular Proteomics. 2007. - 6. - 1198-1214.

77. Sugiyama N., Nakagami H., Mochida K., Daudi A., Tomita M., Shirasu K., Ishihama Y. Large-scale phosphorylation mapping reveals the extent of tyrosine phosphorylation in Arabidopsis // Molecular Systems Biology. 2008. - 4. - 193.

78. Nakagami H., Sugiyama N., Mochida K., Daudi A., Yoshida Y., Toyoda T., Tomita M.', Ishihama Y., Shirasu K. Large-Scale Comparative Phosphoproteomics Identifies Conserved Phosphorylation Sites in Plants // Plant Physiology. 2010. - 153. - 11611174.

79. Bi Y., Wang H., Lu Т., Li X., Shen Z., Chen Y„ Wang B. Large-scale analysis of phosphorylated proteins in maize leaf // Planta. 2011. - 233. - 383-392.

80. Finn R.D., Tate J., Mistry J., Coggill P.C., Sammut S.J., Hotz H., Ceric G., Forslund K., Eddy S.R., Sonnhammer E.L.L., Bateman A. The Pfam protein families database // Nucleic Acids Research. 2008. - 36. - D281-D288.

81. Durek P., Schmidt R., Heazlewood J.L., Jones A., MacLean D., Nagel A., Kersten В., Schulze W.X. PhosPhAt: the Arabidopsis thaliana phosphorylation site database. An update // Nucleic Acids Research. 2010. 38. - D828-834.

82. Gruhler A., Olsen J.V., Mohammed S., Mortensen P., Faergeman N.J., Mann M, Jensen O.N. Quantitative Phosphoproteomics Applied to the Yeast Pheromone Signaling Pathway // Molecular & Cellular Proteomics. 2005. - 4. - 310-327.

83. Li X., Gerber S.A., Rudner A.D., Beausoleil S.A., Haas W., Villen J., Elias J.E., Gygi S.P. Large-Scale Phosphorylation Analysis of a-Factor-Arrested Saccharomyces cerevisiae // Journal of Proteome Research. 2007. - 6. - 1190-1197.

84. Bodenmiller В., Campbell D., Gerrits В., Lam H., Jovanovic M., Picotti P., Schlapbach R., Aebersold R. PhosphoPep—a database of protein phosphorylation sites in model organisms // Nature Biotechnology. -2008. 26. - 1339-1340

85. Albuquerque C.P., Smolka M.B., Payne S.H., Bafna V., Eng J., Zhou H. A Multidimensional Chromatography Technology for In-depth Phosphoproteome Analysis //Molecular and Cellular Proteomics. 2008. - 7. - 1389-1396.

86. Holt L.J., Tuch B.B., Villen J., Johnson A.D., Gygi S.P., Morgan D.O. Global Analysis of Cdkl Substrate Phosphorylation Sites Provides Insights into Evolution // Science. -2009. 325. - 1682-1686.

87. Beltrao P., Trinidad J.C., Fiedler D., Roguev A., Lim W.A., Shokat K.M., ABurlingame • A.L., Krogan N.J. Evolution of Phosphoregulation: Comparison of Phosphorylation

88. Patterns across Yeast Species //PLoS Biology. 2009. - 7. - el000134.

89. Gnad F., de Godoy L.M.F., Cox J., Neuhauser N., Ren S., Olsen J.V., Mann M. High-accuracy identification and bioinformatic analysis of in vivo protein phosphorylation-sites in yeast // Proteomics. 2009. - 9. - 4642-4652.

90. Wilson-Grady- J.T., Villen J., Gygi S.P. Phosphoproteome Analysis of Fission Yeast // Journal of Proteome Research. 2008. - 7. - 1088-1097.

91. Beltrao P., Trinidad J.C., Fiedler D., Roguev A., Lim W.A., Shokat K.M., ABurlingame A.L., Krogan N.J. Evolution of Phosphoregulation: Comparison of Phosphorylation Patterns across Yeast Species // PLoS Biology. 2009. - 7. - el000134.

92. Mann K., Poustka A.J., Mann M. Phosphoproteomes of Strongylocentrotus purpuratus shell and tooth matrix: identification of a major acidic sea urchin tooth phosphoprotein, phosphodontin // Proteome Science. 2010. - 8. -6.

93. Hilger M., Bonaldi T., Gnad F., Mann M. Systems-wide Analysis of a Phosphatase Knock-down by Quantitative Proteomics and Phosphoproteomics // Molecular & Cellular Proteomics. -2009. 8. - 1908-1920.

94. Zhai B., Villen J., Beausoleil S.A., Mintseris J., Gygi S.P. Phosphoproteome Analysis of Drosophila melanogaster Embryos // Journal of Proteome Research. 2008. -7. - 1675-1682.

95. Lemeer S., Jopling C., Gouw J., Mohammed S., Heck A.J., Slijper M., den Hertog J. Comparative phosphoproteomics of zebrafish Fyn/Yes morpholino knockdown embryos // Molecular and Cellular Proteomics. 2008. 7. - 2176-2187.

96. McGivern J.V., Swaney D.L., Coon.JJ., Sheets M.D. Toward defining the phosphoproteome of Xenopus laevis embryos // Dev Dyn. 2009. - 238. - 1433-1443.

97. Ballif B.A., Villen J., Beausoleil S.A., Schwartz D., Gygi S.P. Phosphoproteomic Analysis of the Developing Mouse Brain // Molecular and Cellular Proteomics. 2004. -3.- 1093-1101»

98. Ballif B.A., Carey G.R., Sunyaev S.R., Gygi S.P. Large-Scale Identification and Evolution Indexing of Tyrosine Phosphorylation Sites from" Murine Brain // Journal of Proteome Research. 2008. - 7. - 311-318 .

99. Collins M.O., Yu L., CobaM.P., Husi H., Campuzano I., Blackstock W.P.,

100. Choudhary J.S., Grant S.G.N. Proteomic Analysis of in Vivo Phosphorylated Synaptic

101. Proteins // The Journal of Biological Chemistry. 2005. - 280. - 5972-5982.t

102. Trinidad J.C., Specht C.G., Thalhammer A., Schoepfer R., Burlingame A.L. Comprehensive Identification of Phosphorylation Sites in Postsynaptic Density Preparations // Molecular and Cellular Proteomics. 2006. -5. - 914-922.

103. Munton R.P., Tweedie-Cullen R., Livingstone-Zatchej M., Weinandy F., Waidelich M., Longo D., Gehrig P., Potthast F., Rutishauser D., Gerrits B., Panse C., Schlapbach R., Mansuy I.M. Qualitative and Quantitative Analyses of Protein

104. Phosphorylation in Naive and Stimulated Mouse Synaptosomal Preparations // Molecular and Cellular Proteomics, 2007. - 6. - 283-293.

105. Wisniewski J.R., Nagaraj N., Zougman A., Gnad F., Mann M. Brain Phosphoproteome Obtained by a FASP-Based Method Reveals Plasma Membrane Protein Topology // Journal of Proteome Research. 2010. - 9. - 3280-3289.

106. Villen J., Beausoleil S.A., Gerber S.A., Gygi S.P. Large-scale phosphorylation analysis of mouse liver// PNAS. 2007. - 104. - 1488-1493.

107. Pan C., Gnad F., Olsen J.V., Mann M. Quantitative phosphoproteome analysis of a mouse liver cell line reveals specificity of phosphatase inhibitors // Proteomics. 2008. - 8. - 4534—4546.

108. Weintz G., Olsen J.V., Fruhauf K., Niedzielska M., Amit I., Jantsch J., Mages J., Frech C., Dolken L., Mann M., Lang R. The phosphoproteome of toll-like receptor-activated macrophages // Molecular Systems Biology. 2010. - 6. - 371.

109. Zanivan S., Gnad F., Wickstrom S.A., Geiger T., Macek B., Cox J., Fassler R., Mann M. Solid Tumor Proteome and Phosphoproteome Analysis by High Resolution Mass Spectrometry // Journal of Proteome Research. 2008. -7. - 5314-5326.

110. Moser K., White F.M. Phosphoproteomic analysis of rat liver by high capacity IMAC and LC-MS/MS. Journal of Proteome Research. 2006. - 5. - 98-104.

111. Beausoleil S.A., Jedrychowski M., Schwartz D., Elias J.E., Villen J., Li J., Cohn M.A., Cantley L.C., Gygi S.P. Large-scale characterization of HeLa cell nuclear phosphoproteins // PNAS. 2004. - 101. - 12130-12135.

112. Daub H„ Olsen J.V., Bairlein M., Gnad F., Oppermann F.S., Körner R., Greff Z., Ken G., Stemmann O., Mann M. Kinase-selective enrichment enables quantitative phosphoproteomics of the kinome across the cell cycle // Molecular Cell. 2008. - 31. -438-448.

113. Molina H., Horn D.M., Tang N., Mathivanan S., Pandey A. Global proteomic profiling of phosphopeptides using electron transfer dissociation tandem mass spectrometry// PNAS. 2007. - 104. - 2199-2204.

114. Dephoure N. Zhou C„ Villen J., Beausoleil S.A., Bakalarski C.E., Elledge S.J., Gygi S.P. A quantitative atlas of mitotic phosphorylation // PNAS. 2008. - 105. -10762-10767.

115. Brill L.M., Xiong W., Lee K., Ficarro S.B., Crain A., Xu Y„ Terskikh A., Snyder E.Y., Ding S. Phosphoproteomic Analysis of Human Embryonic Stem Cells // Cell Stem Cell. 2009. - 5. - 204-213.

116. Malik R., Lenobel R., Santamaria A., Ries A., Nigg E.A., Korner R. Quantitative Analysis of the Human Spindle Phosphoproteome at Distinct Mitotic Stages // Journal of Proteome Research. 2009. -8. - 4553^1563.

117. Van Hoof D., Munoz J:, Braam S.R., Pinkse M.W.H., Linding R„ Heck A.J.R., Mummery C.L., Krijgsveld J. Phosphorylation Dynamics during Early Differentiation of Human Embryonic Stem Cells // Cell Stem Cell. 2009. - 5. - 214-226.

118. Swaney D.L., Wenger C.D., Thomson J.A., Coon J.J. Human embryonic stem cell phosphoproteome revealed by electron! transfer dissociation tandem mass spectrometry // PNAS. 2009. - 106. - 995-1000.

119. Oppermann F.S., Gnad F., Olsen J.V., Hornberger R., Zoltan Greff Z„ Keri G., Mann M., DaubiH. Large-scale Proteomics Analysis of the Human Kinome // Molecular and Cellular Proteomics. 2009. - 8. - 1751-1764.

120. Stokes M.P., Rush J., MacNeill J., JRen J.M., Sprott K., Nardone J5., Yang V., Beausoleil S.A., Gygi S.P., Livingstone M., Zhang H., Polakiewicz R.D., Comb M.J. Profiling of UV-induced ATM/ATR signaling pathways // PNAS. 2007. - 104. - 1985519860.

121. Malik R., Nigg E.A., Körner R. Comparative conservation analysis of the human mitotic phosphoproteome // Bioinformatics. 2008. - 241 - 1426-1432.

122. Gnad F., Forner F., Zielinska D.F., Birney E., Gunawardena J., Mann M. Evolutionary Constraints of Phosphorylation in Eukaryotes, Prokaryotes, and Mitochondria // Molecular and Cellular Proteomics. 2010. - 9: - 2642-2653.

123. Via A., Diella F., Gibson T.J., Helmer-Citterich M. From sequence to structural-analysis in proteins phosphorylation motifs // Frontiers in Biosciences. 2011. - 16. -1261-1275.

124. Gnad F., Ren S., Cox J., Olsen J.V., Macek B., Oroshi M., Mann M. PHOSIDA (phosphorylation site database): management, structural* and evolutionary investigation, and prediction of phosphosites // Genome Biol; 2007. - 8. - R250.

125. Jimenez J.L., Hegemann B., Hutchins J.R.A., Peters J., Durbin R. A systematiccomparative and- structural analysis of protein phosphorylation sites based on thetmtcPTM database // Genome Biology. 2007. - 8. - R90.

126. Diella F., Cameron S., Gemünd C., Linding R., Via A., Küster B., Sicheritz-Pontén T., Blom N., Gibson T.J. Phospho.ELM: a database of experimentally, verified phosphorylation sites in eukaryotic proteins // BMC Bioinformatics. 2004. 5. - 79.

127. Hornbeck P.V., Chabra I., Kornhauser J.M., Skrzypek E., Zhang B. PhosphoSite: A bioinformatics resource dedicated to physiological protein phosphorylation // Proteomics. 2004. - 4. - 1551-1561.

128. Zanzoni A., Ausiello G., Via A., Gherardini P.F., Helmer-Citterich M. Phospho3D: a database of three-dimensional structures of protein phosphorylation sites // Nucleic Acids Research. 2007. - 35. - D229-231.

129. Gao J., Agrawal G.K., Thelen J.J., Xu D. P3DB: a plant protein phosphorylation database // Nucleic Acids Research. 2009. - 37. - D960-962.

130. Schweiger R., Linial M. Cooperativity within proximal phosphorylation sites is revealed from large-scale proteomics data // Biology Direct. 2010. -5.-6.

131. Amoutzias G.D., He Y., Gordon J., Mossialos D., Oliver S.G., Van de Peer Y. Posttranslational regulation impacts the fate of duplicated genes // PNAS. 2010. - 107. -2967-2971.

132. Ba A.N.N., Moses A.M. Evolution of Characterized Phosphorylation Sites in Budding Yeast // Molecular Biology and Evolution. 2010. - 27. - 2027-2037.

133. Boekhorst J., van Breukelen B., Heck A.J.R, Snel B. Comparative phosphoproteomics reveals evolutionary and functional conservation of phosphorylation across eukaryotes // Genome Biology. 2008. - 9. - R144.

134. Wang Z., Ding G., Geistlinger L., Li H.,Liu L., Zeng R., Tateno Y., Li Y. Evolution of Protein Phosphorylation for Distinct Functional Modules in Vertebrate Genomes // Molecular Biology and Evolution. 2011. -28.- 1131-1140.

135. Lienhard G.R. Non-functional phosphorylations? // Trends in Biochemical Sciences. 2008. -.33. - 351-352.

136. Tan C.S.H., Pasculescu A., Lim W.A., Pawson T., Bader G.D., Linding R. Positive Selection of Tyrosine Loss in Metazoan Evolution // Science. 2009. - 325. -1686-1688.

137. Landry C.R., Levy E.D., Michnick S.W. Weak functional constraints on phosphoproteomes // Trends in Genetics. 2009. -.25. - 193-197.

138. Cecchinelli B., Porrello A., Lazzari C., Gradi A., Bossi G., D'Angelo M., Sacchi A., Soddu S. Ser58 of mouse p53 is the homologue of human Ser46 and isphosphorylated by HIPK2 in apoptosis // Cell Death and Differentiation. 2006. - 13. -1994-1997.

139. Serber Z., Ferrell J.E. Jr. Tuning bulk electrostatics to regulate protein function // Cell. 2007. - 128. - 441-444.

140. Nash P., Tang X., Orlicky S., Chen Q„ Gertler F.B., Mendenhall M.D., Sicheri F„ Pawson T., Tyers M. Multisite phosphorylation of a CDK inhibitor sets a threshold for the onset of DNA replication // Nature. 2001. - 414. - 514-521.

141. Moses A.M., Liku M.E., Li J.J., Durbin R. Regulatory evolution in proteins by turnover and lineage-specific changes of cyclin-dependent kinase consensus sites // PNAS. 2007. - 104. - 17713-17718.

142. Kouzarides T. Acetylation: a regulatory modification to rival phosphorylation? // EMBO Journal. 2000. - 19. - 1176-1179.

143. Kim G.W., Yang X.J. Comprehensive lysine acetylomes emerging from bacteria tohumans // Trends in Biochemical Sciences. 2011. - 36. - 211-220.

144. Lee K.K., Workman J.L. Histone acetyltransferase complexes: one size doesn't fit all // Nature Reviews. Molecular Cell Biology. 2007. - 8. - 284-295.

145. Yang X.J., Seto E. Lysine acetylation: codified crosstalk with other posttranslational modifications // Molecular Cell. -2008. 31. - 449-461.

146. Glozak M.A., Sengupta N., Zhang X., Seto E. Acetylation and deacetylation of non-histone proteins // Gene. 2005. - 363. - 15-23.

147. Perdiz D., Mackeh R., Potis C., Baillet A. The ins and outs of tubulin acetylation: more than just a post-translational modification? // Cell Signaling. 2011. -23.-763-771.

148. Gu W., Roeder R.G. Activation of p53 sequence-specific DNA binding by acetylation of the p53 C-terminal domain // Cell. 1997. - 90. - 595-606.

149. Choudhary C., Kumar C., Gnad F., Nielsen M.L., Rehman M., Walther T.C., Olsen J.V., Mann M. Lysine acetylation targets protein complexes and co-regulates major cellular functions // Science. 2009. - 325. - 834-840.

150. Yu B.J., Kim J.A., Moon J.H., Ryu S.E., Pan J.G. The diversity of lysine-acetylated proteins in Escherichia coli // Journal of Microbiology and Biotechnology. -2008.- 18.- 1529-1536.

151. Zhang J., Sprung R., Pei J., Tan X., Kim S., Zhu H., Liu C.F., Grishin N.V., Zhao Y. Lysine acetylation is a highly abundant and evolutionarily conserved modification in Escherichia coli // Molecular and Cellular Proteomics. 2009. - 8. - 215-225.

152. Vorechovsky I. Aberrant 3' splice sites in human disease genes: mutation pattern, nucleotide structure and comparison of computational tools that predict their utilization // Nucleic Acids Research. 2006. - 34. - 4630-4641.

153. Online Mendelian Inheritance in Man, OMIM. McKusick-Nathans Institute of Genetic Medicine, Johns Hopkins University (Baltimore, MD). URL: http://omim.org/.

154. Нуртдинов P.H., Неверов А.Д., Малько Д.Б., Космодемьянский И.А., Ермакова Е.О., Раменский В.Е., Миронов А.А., Гельфанд М.С. EDAS база данныхальтернативно еплайсированных генов человека // Биофизика. 2006. - 51. - 589592.

155. Wapinski I., Pfeffer A., Friedman N., Regev A. Natural history and evolutionary principles of gene duplication in fungi // Nature. 2007. - 449. - 54-61.

156. Geer L.Y., Marchler-Bauer A., Geer R.C., Han L., He J., He S., Liu C„ Shi W„ Bryant S.H. The NCBI BioSystems database // Nucleic Acids Research. 2010. - 38. -D492-496.

157. Gelfand M.S., Koonin E.V., Mironov A.A. Prediction of transcription regulatory sites in Archaea by a comparative genomic approach // Nucleic Acids Research. 2000. -28. - 695-705.

158. Larkin M.A., Blackshields G., Brown N.P., Chenna R., McGettigan P.A., McWilliam H., Valentin F., Wallace I.M., Wilm A., Lopez R., Thompson J.D., Gibson T.J., Higgins D.G. Clustal W and Clustal X version 2.0 // Bioinformatics. 2007. - 23. -2947-2948.

159. Peng K., Radivojac P., Vucetic S., Dunker A.K., Obradovic Z. Length-dependent prediction of protein intrinsic disorder// BMC Bioinformatics. 2006. - 7. - 208.

160. Kim E., Goren A., Ast G. Alternative splicing: current perspectives // Bioessays. 2008. - 30. - 38-47.

161. Wang B.B., Brendel V. Genomewide comparative analysis of alternative splicing in plants // PNAS. 2006. - 103. - 7175-7180.

162. Malko D.B., Makeev V.J., Mironov A.A., Gelfand M.S. Evolution of exon-intron structure and alternative splicing in fruit flies and malarial mosquito genomes // Genome Research. 2006. - 16. - 505-509.

163. Sakabe N.J., de Souza J.E., Galante P.A., de Oliveira P.S., Passetti F., Brentani H.,

164. Osorio E.C., Zaiats A.C., Leerkes M.R., Kitajima J.P., Brentani R.R., Strausberg R.L., Simpson A.J., de Souza S.J. ORESTES are enriched in rare exon usage variants affecting the encoded proteins // Comptes rendus biologies. 2003. - 326. - 979-985.

165. Hawkins J.D. A survey on intron and cxon lengths // Nucleic Acids Research. -1988. 16. - 9893-9908.

166. Carothers A.M., Urlaub G., Grunberger D., Chasin L.A. Splicing-mutants and theirsecond-site suppressors at the dihydrofolate reductase locus in Chinese hamster ovary cells // Molecular and Cellular Biology. 1993. - 13. - 5085-5098.

167. Iida Y. A mechanism for unsplicing and exon skipping in human alpha- and beta-globin mutant pre-mRNA splicing // Nucleic Acids Symposium Series. 1997. -37. -183-184.

168. O'Neill J.P., Rogan P.K., Cariello N., Nicklas J.A. Mutations that alter RNA splicing of the human HPRT gene: a review of the spectrum // Mutatation Research. -1998.-411.- 179-214.

169. Kralovicova J., Christensen M.B., Vorechovsky I. Biased exon/intron distribution of cryptic and de novo 3' splice sites // Nucleic Acids Research. 2005. - 33. - 48824898.

170. Kralovicova J., Vorechovsky I. Global control of aberrant splice-site activation by auxiliary splicing sequences: evidence for a gradient in exon and intron definition // Nucleic Acids Research. 2007. - 35. - 6399-6413.i

171. Galante P.A., Sakabe N.J., Kirschbaum-Slager N., de Souza S.J. Detection and evaluation of intron retention events in the human transcriptome // RNA. 2004. - 10. -757-765.

172. Ner-Gaon H., Fluhr R. Whole-genome microarray in Arabidopsis facilitates globalanalysis of retained introns // DNA Research. 2006. - 13. - 111-121.

173. Yeo G.W., Van Nostrand E., Holste D., Poggio T., Burge C.B. Identification and analysis of alternative splicing events conserved in human and mouse // PNAS. 2005. - . 102. - 2850-2855.

174. Clark F., Thanaraj T.A. Categorization and characterization of transcript-confirmed constitutively and alternatively spliced introns and exons from human // Human Molecular Genetics. 2002. - 11. - 451-464.

175. Romero P., Obradovic Z., Li X., Garner E.C., Brown C.J., Dunker A.K. Sequence complexity of disordered protein // Proteins. 2001. - 42. - 38-48.

176. Hao M., Lowy A.M., Kapoor M., Deffie A., Liu G., Lozano G. Mutation of phosphoserine 389 affects p53 function in vivo // Journal of Biological Chemistry. -1996. 46. - 29380-29385.

177. Tarrant M.K., Cole P.A. The chemical biology of protein phosphorylation // Annual Review of Biochemistry. 2009. - 78. - 797-825.

178. Song Q., Pallikkuth S., Bossuyt J., Bers D.M., Robia S.L. Phosphomimetic mutations enhance oligomerization of phospholemman and modulate its interaction with the

179. Na/K-ATPase // The Journal of Biological Chemistry. 2011. - 286. - 9120-9126.

180. Mann M., Ong S.E., Gr0nborg M., Steen H., Jensen O.N., Pandey A. Analysis of protein phosphorylation using mass spectrometry: deciphering the phosphoproteome // Trends in Biotechnology. 2002. - 20. - 261-268.

181. Tan C.S., J0rgensen C., Linding R. Roles of "junk phosphorylation" in modulatingbiomolecular association of phosphorylated proteins? // Cell Cycle. 2010. - 9. - 12761280.