Бесплатный автореферат и диссертация по биологии на тему
Структурная и функциональная характеристика генов, кодирующих трансмембранные белки-паннексины у человека и мыши
ВАК РФ 03.00.15, Генетика
Автореферат диссертации по теме "Структурная и функциональная характеристика генов, кодирующих трансмембранные белки-паннексины у человека и мыши"
На правах рукописи
Пестова Анна Айвеиговна
СТРУКТУРНАЯ И ФУНКЦИОНАЛЬНАЯ ХАРАКТЕРИСТИКА ГЕНОВ, КОДИРУЮЩИХ ТРАНСМЕМБРАННЫЕ БЕЛКИ - ПАННЕКСИНЫ У ЧЕЛОВЕКА И МЫШИ.
специальность - 03.00.15 - генетика
Автореферат диссертации на соискание ученой степени кандидата биологических наук
Москва - 2005
Работа выполнена в лаборатории анализа генома Института общей генетики им. Н. И. Вавилова РАН
Научные руководители:
доктор биологических наук, профессор Николай Кязимирович Янковский доктор биологических наук Анна Вячеславовна Баранова.
Официальные оппоненты:
доктор биологических наук, профессор Андрей Александрович Миронов кандидат биологических наук Евгений Александрович Климов
Ведущая организация:
Институт биоорганической химии им ММШемякина и Ю.А.Овчинникова РАН
Защита состоится " " июня 2005 г 0Рмин на заседании диссертационного совета Д 002 241 01 при Институте общей генетики им Н И Вавилова РАН по адресу 119991 ГСП-1, Москва, ул Губкина, дЗ Факс:(095)132-89-61.
С диссертационной работой можно ознакомиться в библиотеке Института общей генетики им Н И Вавилова РАН
Автореферат разослан "_" мая 2005 г
Ученый секретарь Диссертационного совета, кандидат биологических наук
Г.Н-Полухина
Шкк-ч 4оч
ВВЕДЕНИЕ
Актуальность темы.
Поиск последовательностей ДНК, ортологичных последовательностям из эволюционно-удаленных организмов позволяет находить ранее неизвестные гены в геноме человека Особый интерес представляют гены, продукты которых выполняют уже известные функции у других организмов, но их ортологи у человека пока не известны Поэтому высоко актуальными являются исследования, направленные на поиск и изучение ортологов в геноме человека, дня генов функционально охарактеризованных в других организмах
Семейство генов, кодирующих белки щелевых межклеточных контактов (иннексинов) хорошо охарактеризовано у беспозвоночных. Считалось, что эти гены у позвоночных отсутствуют, а их функция замещена генами, кодирующими коннексины Однако полное исчезновение генов гомологичных иннексинам представлялось маловероятным Данная работа посвящена характеристике паннексинов - генов позвоночных, гомологичных генам щелевых межклеточных контактов беспозвоночных
Цель и задачи исследования. Целью исследования является поиск генов человека, ортологичных генам иннексинов, кодирующих белки щелевых контактов беспозвоночных, а также характеристика этих генов и их продуктов у позвоночных, включая человека
Для реализации поставленной цепи при исследовании генов решались следующие задачи:
А. Провести сравнительный биоинформатический анализ генов и белков позвоночных и беспозвоночных, для поиска и характеристики генов-ортологов иннексинов, в том числе:
1 Провести биоинформатический поиск генов в геноме человека и мыши, гомологичных гену паинексина РАЫХ1.
2. Установить экзон-интронную структуру найденных генов-ортологов (паннексинов) в геноме человека и мыши.
3 Провести биоинформатический анализ предсказанных аминокислотных последовательностей, кодируемых паннексинами, с целью выявления доменов с функциями, ранее установленными для других белков
Б. Провести экспериментальный анализ генов кодирующих паннексины и их продуктов, в том числе •
4 Выявить и охарактеризовать изоформы мРНК паннексинов в геноме человека и мыши
5 Определить спектр тканеспецифичности экспрессии найденных генов паннексинов человека
6 Определить тканевую локализацию транскриптов, кодируемых генами паннексинов в клетках хрусталика глаза и эмбриона мыши
Научная новизна.
Описаны два ранее неизвестных гена человека PANX2 и PANX3, относящиеся вместе с ранее найденным геном человека PANX1 к одному семейству (паннексины), ортологичному семейству генов, кодирующих белки щелевых контактов беспозвоночных (иннексины) В геноме мыши описаны ортологи генов, кодирующих паннексины человека Впервые охарактеризованы мРНК генов паннексинов человека и мыши и экспериментально показано (ОТ-ПЦР и Нозерн-гибридизация) существование двух изоформ мРНК для каждого из генов PANX1 и PANX2 и одной изоформы для гена PANX3 человека Впервые определена полная нуклеотидная последовательность кДНК и экзон-интронная структура генов PANX1, PANX2, PANX3, а также последовательности и структура ортологичных генов мыши Впервые установлен профиль тканеспецифичности экспрессии генов паннексинов у человека ген PANX1 экспрессируется во всех анализированных тканях, хотя и в разной степени, а для генов PANX2 и PANX3 характерен более узкий профиль экспрессии Методом биоинформатического анализа выявлены вероятные функциональные домены в аминокислотных последовательностях белков PANX1, PANX2, PANX3 С помощью гибридизации in situ установлена тканевая локализация белка PANX1 в тканях хрусталика глаза и эмбриона мыши
, ч »-iub.il г11
Практическая значимость работы.
Щелевые контакты имеют существенно важное значение для функционирования многоклеточных организмов, что подтверждается многочисленными фенотипическими аномалиями, возникающими при их повреждении у человека (глухота, нейропатия, катаракта и другие) Полученные в ходе диссертационной работы данные позволили выявить кандидатные гены, повреждения в которых могут приводить к развитию этих заболеваний Обнаружение ортологов паннексинов у мыши позволяет использовать этот модельный объект для будущих исследований заболеваний человека, связанных с дефектами паннексинов Установление структуры генов РАЫХ1, РАЮС2 и РАЫХЗ и их продуктов позволяет приступить к детальному мутационному анализу генома в выборках пациентов, заболевание у которых может быть связано с мутациями в генах паннексинов Это позволит разработать стратегии диагностики, лечения и профилактики заболеваний, связанных с носитеяьством определенных вариантов генов паннексинов у человека
Основные положения выносимые на защиту:
1 Обнаружено новое семейство генов позвоночных, названных паннексины Гены паннексинов ортологичны генам иннексинов беспозвоночных, кодирующих белки щелевых контактов
2 Установлена геномная организация генов РАЫХ1, РАЮС2 и РАЫХЗ, выявлены изформы мРНК всех паннексинов человека, а так же установлен уровень их экспрессии и тканеспецифичность
3 Выявлены вероятные функциональные домены в аминокислотных последовательностях белков РАЫХ1, РАМХ2, РАКХЗ Все три белковых продукта, кодируемые генами РАЫХ1, РАЫХ2 и РАЫХЗ имеют четыре трансмембранных домена, характерных для всех белков щелевых контактов
4 Выявлены гены-ортологи паннексинов человека в геноме мыши, что позволяет использовать этот модельный объект для будущих исследований заболеваний человека, связанных с дефектами паннексинов
Апробация работы.
Результаты работы были представлены на следующих конференциях-
1. Washington, DC: Society for Ncuroscience, 2002.
2. ARVO-The Association for Research in Vision and Ophthalmology, 2005.
Публикации. По теме диссертации опубликовано 2 статьи и тезисы 2 докладов
Структура и объем работы Диссертация состоит из следующих разделов введение, обзор литературы, материалы и методы исследования, результаты с обсуждениями, выводы, список литературы (более 200 источников) Диссертация изложена на 115 страницах машинописного текста, содержит 11 рисунков и 1 таблицу
СОДЕРЖАНИЕ РАБОТЫ. РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ. 1. Биоинформатическое и экспериментальное исследование мРНК гена PANX1(MRS1).
До недавнего времени считалось, что белки щелевых контактов иннексины характерны только для беспозвоночных Первый гомолог иннексинов был идентифицирован у человека в 2000 году д б н Ю В Панчиным (ИППИ РАН) в виде нуклеотидной последовательности мРНК, кодирующей белок MRS1 и названной паннексином (от латинского pan-повсюду и nexus-связь) Эта последовательность (GenBank AF093239) явилась отправной точкой диссертационной работы для проведения с ее помощью детального биоинформатического и экспериментального исследования на геноме человека
Первым этапом работы было выяснение, является ли нуклеотидная последовательность мРНК, представленная в базе данных GenBank, полной Наличие в З'-области описанной выше последовательности мРНК длинного поли-А тракта позволило нам сделать вывод о том, что З'-нетранслируемая область мРНК представлена в этой последовательности полностью Исследование 5'-области мРНК, представленной в базе данных, было проведено нами путем анализа
продуктов 5'-RACE ПЦР (получены от С А Лукьянова, ИБХ РАН) Нами была определена нуклеотидная последовательность получетных продуктов 5'-RACE ПЦР, в результате чего мы получили последовательность кДНК полноразмерного гена паннексина, общей длинной 2771 нуклеотидов, что на 33 нуклеотида длиннее последовательности представленной в GenBank Определенная нами последовательность нуклеотидов была зарегестрирована под номером AF398509, как генный транскрипт PANX1 согласно номенклатуре принятой комитетом HUGO.
Анализ базы данных GenBank выявил в составе З'-нетранслируемой области последовательности PANX1 STS маркер (WIAF-1483/G43027), ранее картированный в сегменте ql4 3 хромосомы 11 человека Это позволило нам утверждать, что ген PANX1 также расположен в составе хромосомы 11 Данный вывод был сделан еще до выхода в свет полной последовательности генома человека
2. Биоинформатический поиск генов человека, гомологичных гену PANXI.
Известно, что гены, кодирующие белки щелевых контактов как у беспозвоночных, так и у позвоночных, составляют большие генные семейства Нами была взята нуклеотидная последовательность мРНК гена человека PANX1 и подвергнута биоинформатическому анализу с использованием программ TBLASTX и TBLASTN Программой TBLASTX была выявлена нуклеотидная последовательность мРНК, кодирующая MRS I-подобный белок, зарегистрированная в базе данных GenBank под номером AL022328 и локализованная в области ql3.31-ql3 33 хромосомы 22 человека Данная последовательность была названа и зарегестрирована нами в GenBank под именем PANX2. С помощью программы TBLASTN, проанализировавшей все опубликованные к тому моменту в GenBank нуклеотидные последовательности генома человека (включая черновые), нами был выявлен еще и третий член генного семейства паннексины-ген PANX3, расположенный на хромосоме llq24 2 Указанная часть работы была выполнена совместно с д б н Ю В Панчиным (ИППИ РАН)
3. Биоинформатическое предсказание и экспериментальное исследование структуры генов паннексинов человека.
В результате проведенной работы, мы установили последовательность нуклеотидов транскрипта гена PANX1, однако сведений о геномной организации этого и других членов генного семейства паннексинов на этом этапе пока доступно не было 3.1.У становление экзон-интронной структуры гена PANX1. К моменту начала исследования геномной организации гена PANX1 определение нуклеотидной последовательности генома человека еще не было полностью завершено и в общедоступных базах данных последовательности нуклеотидов из района локализации гена PANX1 были представлены лишь частично. Для определения геномной структуры гена PANX1 нами был проведен поиск рекомбинантных космидных клонов, содержащих этот ген
Для этого был проведен гибридизационный скрининг высоко-плотного фильтра, содержащего 23500 космидных клона хромосомы 11 человека, полученных из клонотеки LANL В качестве проб были использованы продукты ОТ-ПЦР, полученные на матрице мРНК PANX1 из тканей плаценты и скелетных мышц человека Праймеры были подобраны по последовательности мРНК гена PANX1 в области, соответствующей средней части ОРС, и в 5' -неггранслируемой области, с частичным захватом области трансляции В результате скрининга нами было выявлено 18 позитивных сигналов, 16 из которых были заказаны и получены из депозитария HGMP Resource Center, UK
Гибридизация по Саузерну показала, что 7 из 16 космидных клонов являются ложнопозитивными 9 оставшихся клонов были подвергнуты ПЦР - анализу с последующим определением нуклеотидной последовательное™ продуктов реакции В результате мы установили четыре космидных клона, которые гибридизовапись с к ДНК зондами, соответствующими различным областям гена PANX1.
Определение нуклеотидной последовательности космидных клонов с использованием PANX1 специфичных праймеров показало, что ни один из выявленных космидных клонов не содержит полноразмерный ген PANX1: клоны LA1111т21 и LA1128o20, перекрывают кодирующую область гена PANX1, а клон
LA1139o20 покрывает 5'-нетранслируемый район гена PANX1 В результате выравнивания всех вышеперечисленных последовательностей нуклеотидов космидных клонов друг относительно друга мы получили общую геномную последовательность нуклеотидов, содержащую ген PANX1 целиком.
Выравнивание геномной последовательности нуклеотидов гена PANX1, полученной в результате сочленения последовательностей нуклеотидов космидных клонов, с последовательностью нуклеотидов кДНК гена PANX1 показало, что ген PANX1 состоит по крайней мере из пяти экзонов и четырех нитронов, занимает на хромосоме по меньшей мере 48,230 п н
Первый экзон гена PANX1 имеет длину 564 нуклеотида Длина второго экзона равна 139 нуклеотидов, третьего-223 нуклеотида, четвертого-655 нуклеотида и пятого-1164 нуклеотида.
Полученная последовательность генома, соответствующая гену PANX1, была подвергнута анализу программы NNSSP, предсказывающей сайты сплайсинга Выявленные программой сайты совпали с экзон-интронными границами, которые бьши определены нами в результате выравнивания геномной последовательности нуклеотидов гена PANX1 относительно его кДНК Все интроны фланкированы классическими GT/AG последовательностями нуклеотидов, соответствующими консенсусным 5'-донориому и З'-акцепторному сигнальным сайтам сплайсинга, найденным в других генах человека Так же программой была обнаружена еще одна сигнальная нуклеотидная последовательность сплайсинга, соответствующая консенсусному З'-акцепторному сайту, расположенная на расстоянии 12 п н от определенного нами 5'-конца пятого экзона Таким образом пятый экзон гена PANX1 может быть представлен двумя альтернативными вариантами, отличающимися 5'-концами
Мы провели анализ базы данных dbEST, который выявил множество EST последовательностей, соответствующих обоим вариантам сплайсиша пятого экзона, из чего нами был сделан вывод, что ген PANX1 кодирует по меньшей мере две мРНК изоформы Одна из них была названа PANXla, а вторая, соответствующая варианту с более длинным пятым экзон ом,- PANXlb. Альтернативный сплайсинг пятого экзона ведет к синтезу PANX1 b мРНК, которая
кодирует белок со вставкой четырех аминокислот (GMNI) на расстоянии 22 ак, считая от С-конца
Для проверки наших экспериментально полученных результатов геномной организации PANX1 мы провели сравнение установленной нами геномной последовательности нуклеотидов гена PANX1, с обновленными данными черновой последовательности нуклеотидов генома человека из баз данных GenBank и Celera Анализ этих нуклеотндных последовательностей показал, наличие брешей в областях, относящихся к гену PANX1, покрывающих районы с высоким содержанием G/C нуклеотидов, трудно поддающихся определению, но которые были успешно пройдены нами Нами был построен полный контиг последовательностей относящихся к гену PANX1, состоящий из последовательностей экспериментально полученных нами и информации взятой в базе данных GenBank и Celera В качестве основы нашей реконструкции мы использовали нуклеотидную последовательность ВАС клона АР002784 (подан в GenBank М Хаттори, ROCEN), покрывающего с третьего по пятый экзоны гена PANX1, шесть несостыкованных фрагментов нуклеотидных последовательностей взятых в Celera, расположенных в 5'-области гена PANX1 и экспериментально определенные нами нуклеотидные последовательности перекрывающихся ПЦР продуктов, соответствующих гену PANX1. Все последовательности нуклеотидов были подвергнуты биоинформатическому выравниванию друг относительно друга, результатом которого явилась полная геномная последовательность гена PANX1.
Корректность биоинформатической состыковки полной последовательности нуклеотидов гена PANX1 была проверена с помощью ПЦР на основе матрицы геномной ДНК человека и PANX1 -содержащих космидных клонов с последующим сравнением нуклеотидной последовательности полученных ПЦР-продуктов с последовательностями полученными бионнформатическим методом Данные о нуклеотидной последовательности геномной ДНК, полученные биоинформатически, полностью подтвердили выводы, сделанные нами экспериментальным путем Результирующие последовательности были поданы в GenBank и зарегестрированы под номерамы AY048509, AF398507 и AF398508 Описанная нами структура гена PANX1 приведена на рисунке 1
Следущим этапом исследования последовательности нуклеотидов гена PANX1 стал ее анализ с помощью программы NNPP (The Neural Network Promoter Prediction), предсказывающей наиболее вероятную промоторную область гена Программой NNPP была идентифицирована последовательность, соответствующая с высокой вероятностью (score 1 00) предполагаемому промотору, расположенному на 233 п н левее 5'-конца гена PANX1, полученного с помощью RACE-ПЦР 3.2.Установление экзон-ннтронной структуры гена PANX2. Найденная нами в общедоступной базе данных GenBank последовательность нуклеотидов мРНК (AL022328) гена PANX2 при выравнивании ее относительно геномных последовательностей нуклеотидов взятых из общедоступной базы данных GenBank с помощью программы BLAST разбилась на три части, вероятно соответствующие экзонам данного гена Детальный анализ нуклеотидной последовательности мРНК гена PANX2 показал отсутствие терминаторов в рамке трансляции, из чего мы сделали вывод, что выявленная мРНК не является полной Для установления длины ее концов мы поставили 3' - RACE эксперименты с PANX2 специфичными праймерами на матрице мРНК из тканей плаценты и скелетных мышц человека Была определена нуклеотидная последовательность полученных ПЦР-продуктов В результате нами была обнаружена нуклеотидная последовательность, содержащая терминирующий кодон TGA и 341 п н, принадлежащих З'-некодирующей области и полностью совпадающих с геномной последовательностью нуклеотидов, следующей сразу за кодирующим районом гена PANX2. Анализ базы данных GenBank позволил выявить ВАС клон RP3-402G11 (подан в GenBank Welcome Trust Sanger Institute), содержащий нуклеотидную последовательность гена PANX2. Геномная последовательность нуклеотидов ВАС-клона содержала сигнал полиаденилирования, расположенный на расстоянии 675 п н правее от точки терминации самого длинного З'-RACE продукта, захватывающего кодирующую часть PANX2, из чего нами был сделан вывод, что полная длина 3' -нетраяслируемой области гена PANX2 составляет в общей сложности 1016 п н
В связи с богатым G/C составом (68% GC, 10% CpG динуклеотидов, при Obs/Exp=0 88 для всей длины PANX2) геномной области окружающей экзонные
области гена PANX2 все попытки 5'-RACE оказались неудачными Анализ базы данных GenBank выявил ВАС клон RP3-402G11, содержащий геномную последовательность нуклеотидов гена PANX2, которая была исследована с помощью программы ORF Finder, предсказывающей зону трансляции. Сравнительный анализ результирующей реконструированной последовательности нуклеотидов мРНК гена PANX2, полученной с использованием программы ORF Finder, и геномной нуклеотидной последовательности ВАС клона RP3-402G11, позволил утверждать, что ген человека PANX2 содержит по меньшей мере четыре экзона и покрывает геномную область размером 9185 п н в длину Первый экзон имеет длину равную 196 п н, второй -1463 п н , третий -201 п н Длина четвертого экзона составляет 377 п н (Рисунок 1) Существование мРНК гена PANX2 было доказано анализом базы данных dbEST и экспериментами ОТ-ПЦР, результаты которого приведены на рисунке 2 Поиск по базе данных dbEST выявил шесть EST последовательностей человека, соответствующих изоформе мРНК, полученной нами на основе геномной последовательности ДНК, которые разбиваются на экзоны согласно предсказанным нами экзон-интронным границам PANX2 Результатом экспериментов ОТ-ПЦР на матрице мРНК гиппокампа (Ambion) и суммарной РНК человека (Stratagene) стали два ПЦР фрагмента (Рисунок 2) Определение нуклеотидной последовательности этих фрагментов выявило дополнительный пятый экзон, экзон А, который имеет длину 50 п н и расположен между описанными ранее первым и вторым экзонами По нашему мнению этот фрагмент соответствует альтернативно сплайсируемой изоформе мРНК гена PANX2, получившей название PANX2alt2 (Рисунок 1) Изоформа мРНК PANX2alt2, содержащая альтернативно сплайсируемый экзон А, соответствует EST последовательности под номером AW074800 (IMAGE клон 2572157, линия клеток костного мозга) Сравнительный анализ нуклеотидной последовательности EST AW074800 с продуктами полученными методом ОТ-ПЦР подтвердил сделанный нами вывод о существовании второй альтернативно сплайсируемой изоформы мРНК гена PANX2-PANX2alt2. Существование соответствующих PANX2alt2-специфичных, полученных методом ОТ-ПЦР, электрофоретических полос и достаточно большая представленность обеих изоформ мРНК гена PANX2 в виде
\о
Хромосома 11 a14.3
Геномная организация гена PANX1
»4п.н. 139 П Н. ^ 223 л.у 1__в55п.н^1 __ 1164 п.н
5 экзонов
мРНК гена PANX1
Poly-А хвост
Хромосома 22a13.31-13.33
В
4 экзона
Изоформа мРНК PANX2att1
Poly-А хвост
4473 п.н. 1457 пн
832 п.н. 8в п.н
Геномная организация гена PANX2
186 п.н. 50 п.н
5 ЭК.1ПИОВ
201 п.н. 377 п.н.
Изоформа мРНК PANXaH2
Poly-A хвост
Хромосома 11a24.2 q
Геномная организация гена PANX3
J8D n.jj. 142 пж ^214 njt. ^ 1080 П.н. ^
4 экзона мРНК гена PANX3 Poly-A хвост
Рисунок 1. На схеме представлены геномные регионы, в которых заключены гены человека PANX1, PANX2 и PANX3, и их экзон-интронная структура Схемы геномных локусов содержат экзоны, обозначенные темно-серым цветом На схеме представлены альтернативные изоформы мРНК генов с экзонами белым обозначена открытая рамка считывания, светло-серым-нетранслируемые районы (А) Ген PANXI расположен на хромосоме llql4 человека, (В) Ген PANX2 расположен на хромосоме 22ql3 человека (Ген PANX2 кодирует две альтернативно сплайсируемые изоформы мРНК), (С) Ген PANX3 расположен на хромосоме 1 lq24 человека
к2- кЗ- М 1 2 3 4
200 100 во
Рисунок 2. Электорофореграмма продуктов ОТ-ПЦР реакции на матрице мРНК на матрице мРНК гиппокампа человека (Ambion) и суммарная РНК человека (Stratagen) К2 и КЗ-негативные контроли без добавления в реакцию праймеров и матрицы. М-маркер (слева указан размер полос маркера в п н ) 1 -продукт ОТ-ПЦР, полученный с /МЛЖ-специфичных праймеров на матрице мРНК гиппокампа человека 2-продукт ОТ-ПЦР, полученный с /МЛЖ?-специфичных праймеров на матрице суммарной мРНК человека (Stratagen) 3-продукт ОТ-ПЦР, полученный с ЯАЛЖЗ-специфичных праймеров на матрице мРНК гиппокампа человека 4-продукт ОТ-ПЦР, полученный с /МЛЖ-специфичных праймеров на матрице суммарной мРНК (Stratagen)
EST последовательностей в базе данных dbEST свидетельствуют о том, что количества экзон А-содержащей изоформы мРНК и основной (мажорной) изоформы мРНК гена PANX2 являются сравнимыми и позволяют предположить, что PANX2alt2 мРНК может играть регуляторную роль Геномная последовательность нуклеотидов, соответствующая гену PANX2 была проанализирована с помощью программ NNPP и NNSSP, которые обнаружили предполагаемый промотор (score 0 95) на расстоянии 20 п н левее, считая от начала первого экзона, а на расстоянии 50 п н от начала второго экзона ATG кодон, а также выявили консенсусные сайты сплайсинга, локализующиеся на концах определенных нами интронных границ Как и в случае с первыми четырьмя экзонами гена PANX2, интронные границы экзона А соответствуют общеизвестным консенсусным последовательностям сплайсинга
Часть работы разделов 3 1 и 3 2 была проделана совместно с к б н Д. В Ивановом и к б и М Ю Скобловым
3.3. У становление экзон-интронной структуры гена PANX3.
Сравнительный анализ нуклеотидной последовательности мРНК, соответствующей гену PANX3 с геномной последовательностью нуклеотидов GenBank показал, что ген имеет по крайней мере четыре экзона Для установления 3' - области мРНК гена PANX3 нами были поставлены эксперименты З'-RACE ПЦР на матрице мРНК мозга человека с использованием ЯАЮЗ-специфичных праймеров В результате мы выявили дополнительную нуклеотдную последовательность длинной 1124 н , содержащей стоп-кодон TAG и 3 '- нетранслируемую область размером 546 н , которая заканчивалась классическим ААТААА сигналом полиаденилирования Полная последовательность нуклеотидов мРНК гена PANX3 была реконструирована биоинформатическим путем в результате слияния первого экзона гена PANX3, начинающегося с наиболее вероятной точки инициации транскрипции, предсказанной программой NNPP, второго и третьего экзонов с границами, соответствующими предсказанным программой NNSSP, ищущей наиболее вероятные границы экзонов, и четвертого экзона, удлиненного за счет нуклеотидной последовательности кДНК, полученной в результате З'-RACE реакции Сравнительный анализ реконструированной мРНК гена PANX3 с геномными последовательностями нуклеотидов из банка данных GenBank показал, что ген PANX3 занимает 8799 п н геномной ДНК в длину Анализ базы данных dbEST выявил две EST последовательности с номерами АА452693 и АА450056, соответствующих мРНК гена PANX3, которые принадлежат IMAGE клону 788811, полученному из библиотеки Nb2HF8_9w Схема геномной организации гена PANX3 представлена на рисунке 1
4. Экспериментальный анализ профиля экспрессии генов паннексинов в различных тканях человека. 4.1. Анализ профиля экспрессии гена PANX1.
Для определения профиля экспрессии и разнообразия изоформ мРНК гена PANX1 была проведена нозерн-гибридизация радиоактивно-меченой кДНК-пробы, соответсвующей этому гену, на фильтры, содержащие мРНК из разных тканей человека Результаты гибридизации представлены на рисунке 3 Нами показано,
1 2 3 4 5 6 7 8 9101112131415
1 2 3 4 5 6 7 8
HI
in
Рисунок 3. Результат нозерн-гибридизации на фильтры фирмы ОоШесЬ кДНК-зондов, содержащих ОРС генов человека РАЮС1 (фильтр Н1) и РА1ЧХ2 (фильтр
На фильтре HI представлены 1-сердце, 2-мозг, 3-плацента, 4-легкое, 5-печень, 6-скелетная мышца, 7-почка, 9-селезенка, 10-тимус, 11-простата, 12-яички, 13-яичники, 14-тонкий кишечник, 15-толстый кишечник
На фильтре Ю представлены различные отделы мозга человека 1- мозжечок, 2-кора головного мозга, 3-продолговатый мозг, 4-спинной мозг, 5-затылочный полюс головного мозга, 6-лобная доля, 7-височная доля, 8-путамен
что ген PANX1 имеет две основные изоформы мРНК размером 3 т н и 7 т н , которые экспрессируются практически во всех тканях человека, представленных на Нозерн-блотах Предсказанный размер мРНК гена PANXI составляет 2698 н Изоформа мРНК гена PANX1 размером 7 тн вероятно образуется путем удлинения последнего нетранслируемого экзона в его нетранслируемой чати и полнотсью соответствует геномной последовательности Данный вывод был подтвержден З'-RACE экспериментами (ДШагин, ИБХ) и существованием в базе данных dbEST множества EST, соответствующих геномной последовательности нуклеотидов после точки терминации транскрипции основной мРНК гена PANX1 Нозерн-блот выявил тканевые различие в уровне транскрипции гена PANXI В сердце, скелетных мышцах, семенниках и яичниках ген PANX1 экспрессируется сильнее всего В мозге, плаценте, тимусе, простате и тонком кишечнике ген PANXI имеет средний уровень транскрипции В легких, печени, поджелудочной железе, почках, селезенке, толстом кишечнике ген PANXI имеет очень низкий уровень экспрессии В почках и легких сильнее экспрессируется изоформа мРНК гена PANXJ размером 3 т н , а изоформа соответствующая 7 т н
Н2);
щ
представлена очень слабо Кроме того во всех тканях присутствует слабый сигнал соответствующей изоформе мРНК гена РАЫХ1 размером 2 1-22 т н
Для определения тканеспецифичности гена PANX2 была проведена Нозерн-гибридизацяи с радиоактивно-меченой кДНК-пробой, соответсвующей PANX2, на фильтры, содержащие мРНК из разных тканей человека Согласно результатам гибридизации ген PANX2 экспрессируется только в ткани головного мозга из всех представленных на Clontech MTN фильтре В связи с этим нами был поставлен второй эксперимент Нозерн-гибридизации на фильтре, содержащем только ткани различных отделов головного мозга и спинного мозга Гибридизация показала, что ген PANX2 транскрибируется во всех представленных на фильтре отделах головного мозга в виде изоформы мРНК имеющей размер 4 т н и практически полностью отсутствует в ткани спинного мозга (рисунок 3) Мы провели анализ базы данных dbEST, который показал, что большинство последовательностей EST, соответствующих гену PANX2, были получены из различных кДНКовых клоно гек головного мозга (ВЕ863147, AI356089, HI 8396) и клеток костного мозга, имеют размер, соответствующий гибиридизационному сигналу на фильтре, что служит дополнительным подтверждением наших экспериментальных результатов В совокупности, данные указывают, что нуклеотидная последовательность изоформы мРНК, соответствующая полосе размером 4 т н, включает в себя более длинную некодирующую З'-область
В общедоступной базе данных dbEST нами было найдено пять EST последовательностей, полученых из тканей 8-9 недельного эмбриона человека, которые содержали в себе предсказанную нуклеотидную последовательность гена PANX3 Не смотря на это нами не было обнаружено ни одного PANX3-специфичного гибридизационного сигнала на Clontech MTN фильтре, содержащем ткани взрослого человека Однако, результаты проведенных нами ОТ-ПЦР и RACE-ПЦР экспериментов, поставленные с ЛЦУЛЗ-епецифичных праймеров на матрице мРНК выделенной из гиппокампа (Ambion) и суммарной мРНК человека
42. Анализ профиля экспрессии гена PANX2.
43. Анализ профиля экспрессии гена PANX3.
фирмы (Stratagene), показали, что ген PANX3 имеет низкий уровень транскрипции in vivo в различных тканях взрослого человека (рисунок 2)
5. Выявление и анализ открытых рамок трансляции в различных изоформах мРНК генов паннексинов.
5.1. Выявление и анализ открытых рамок трансляции в генePANXl.
Нами было проведено биоинформатическое исследование нуклеотидной последовательности мРНК гена PANX1, которое показало, что балок-кодирующая часть мРНК с 5'-конца ограничена нетрансли руемой областью длиной по меньшей мере 335 п и , а с З'-конца нетранслируемая область занимает 1097 п н , что следует из наличия поли-А последовательности в составе соответствующих последовательностей EST, а так же на экспериментально полученных методом ОТ-ПЦР нуклеотидных последовательностях кДНК гена PANXI Анализ базы данных dbEST выявил пять EST клонов (А1734133, АА341070, AI732737, AI741369, АА428957), которые имеют дополнительную последовательность нуклеотидов размером 560 п н, совпадающую с геномной областью, расположенной выше, относительно З'-нетранслируемого конца гена PANX1, из чего нами был сделан вывод, что данные EST последовательности соответствуют самой длинной изоформе мРНК гена PANX1.
Биоинформатическое исследование 5-области открытой рамки считывания мРНК гена PANX1 с помощью программы ORF Fmder выявило несколько ATG кодонов, из которых первые три ближе всех к консенсусной последовательности инициации трансляции Козак (aacaATGgc) Все три кодона расположены в области, соответствующей первому экзону гена PANX1 Первый ATG кодон соответствует изоформе, которая кодирует белковый продукт размером 426 а к с рассчитанной молекулярной массой 47 6 кДа. Второй ATG кодон соответствует 386 а к изоформе PANX1, а третий ATG кодон соответствует 280-ак. изоформе Для установления какой из этих кодонов является стартовым необходима дополнительная экспериментальная проверка.
Кроме того, ген PANX1 имеет две альтернативно сплайсируемые формы мРНК, PANXla и PANXlb, отличающиеся размером 5'-области пятого экзона
Сплайсформа мРНК PANXlb, кодирует белковый продукт на четыре аминокислоты длиннее, чем белковый продукт, кодируемый изоформой мРНК PANXla.
5.2. Выявление и анализ открытых рамок трансляции в генePANX2. Анализ нуклеотидной последовательности мРНК гена PANX2 программой ORF Finder выявил в ее составе два наиболее вероятных ATG кодона расположенных в области, соответствующей первому экзону гена Дальнейший анализ показал, что первый ATG кодон гена PANX2 располагается в области не имеющей сходства с фрагментом Козак, в то время как второй ATG кодон, напротив, расположен в области почти идеально совпадающей с консенсусной последовательностью Козак Второй выявленный ATG кодон соответствует изоформе PANX2, которая кодирует белковый продукт размером 633 а к с рассчитанной молекулярной массой 69 5 кДа Как было сказано выше, ген человека PANX2 имеет вторую альтернативную сплайсформу мРНК PANX2alt2, содержащую дополнительный пятый экзон А Вставка экзона А сдвигает открытую рамку считывания PANX2 таким образом, что стартовый метионин перемещается правее, в положение 424, в область, соответствующую третьему, если считать экзон А вторым, экзону и уменьшая длину белкового продукта до 509 а к.
5.3. Выявление и анализ открытых рамок трансляции в гене PANX3. Биоинформатический анализ нуклеотидной последовательности мРНК гена PANX3, показал, что PANX3 имеет одну протяженную открытую рамку считывания, расположенную на всех четырех экзонах, которой соответствует аминокислотная последовательность длинной 392 а к Предсказанный белок имеет молекулярную массу 44 7 кДа.
6. Выявление и биоинформатический анализ ортологов паннексинов человека в геноме мыши.
С целью выявления ортологов генов человека PANX1, PANX2 и PANX3 в геноме мыши мы проанализировали общедоступные базы данных GenBank и dbEST с помощью алгоритма BLAST В качестве сравниваемых последовательностей были взяты полноразмерные мРНК генов человека PANX1, PANX2 и PANX3 В результате нами были обнаружены три гаи мыши, названые нами Panxl, Рапх2,
РапхЗ Степень сходства между паннексин-кодирующими генами человека и мыши представлена в таблице 1
мРНК гена Panxl мыши (No. AF207817) кодирует белковый продукт размером 448
а к, который полностью совпадает своим N-концом с N-концевой частью белка
человека PANX1 и различается с ним в С-концевой области Мышиный Panxl
расположен на хромосоме 9 мыши и имеет в точности такую же геномную ,
организацию как и его человеческий ортолог мРНК гена Panxl широко
распространена в тканях мыши, что следует из большой представленности
соответствующих гену Panxl полностью совпадающих друг с другом EST
последовательностей (более 80) из базы данных dbEST Мышиный ген Рапх2 (No.
ВК000624) локализуется на хромосоме 15 мыши, состоит из четырех экзонов и
кодирует белок размером 697 а к 258 N-концевых аминокислот белка, кодируемого
геном Рапх2, практически полностью консервативны N-области белка человека
PANX2 и содержат всего две эквивалентные замены (Ser-Ala и Val-Ala) Сходство
аминокислотной последовательности белков человека и мыши, кодируемых геном
паннексин 2 уменьшается к С-концу, как и в случае с паннексином 1
Альтернативно сплайсируемый экзон А, который располагается между первым и
вторым экзонами первой изоформы мРНК гена человека PANX2, не был обнаружен
в геноме мыши программой mVISTA, сравнивающей между собой целые геномы
Мышиный ген РапхЗ (No ВК000662) расположен на хромосоме 9 мыши, состоит из 4 экзонов и кодирует белок размером 392 а к
Для оценки профиля экспрессии генов паннексинов мыши мы проанализировали
подгруппу мышиных EST из базы данных dbEST Согласно данным проведенного
анализа по представленности EST последовательностей, мышиный Panxl
экспрессируется во многих тканях мыши, как и его ортолог у человека Ген Рапх2 >
мыши представлен в базе данных dbEST тремя EST последовательностями
полученными из целого мозга, сетчатки и гиппокампуса мыши, что соответствует
тканеспецифичности его человеческого ортолога гена PANX2. Проведенный нами
анализ общедоступных баз данных выявил 13 мышиных РапхЗ-специфичных EST
последовательностей из различных тканей мыши
i ъ
PANX1 PANX2 PANX3 Panxl Равх2 РапхЗ
PANX1 о (100*/.) 2x10 "(51%) Ш0-"(62%) 0 (94%) 8x10 от(51%) 3x10^(61%)
PANX2 2х10"(51%) 0(100%) 3x10 "(52%) 3x10 "(49%) 0 (94%) Sxl0~(50%)
PANX3 1х10-"(62%) Зх10"(52%) 0 (100%) 2x10*" (62%) 1х10"(51%) 0 (93%)
Paml 0 (94%) 3x10 "(49%) 2x10"" (62%) 0 (100%) 6x10 "(50%) 7x10^(59%)
Рам2 8х10-™(51%) 0 (94%) 1х10"(51%) 6x10 "(50%) 0(100%) 7x10'"(50%)
РапхЗ 3xW™(61%) 8x10 "(50%) 0(93%) 7x10"°'(59%) 7х10"'я(50%) 0(100%)
Таблица 1. В таблице представлены величины вероятностей случайного совпадения аминокислотных последовательностей паннексинов человека и мыши, полученные в результате попарного их сравнения, и процент сходства между ними Данные величины демонстрируют степень сходства между паннексин-кодирующими генами человека и мыши.
7. Биоинформатический анализ аминокислотных последовательностей, кодируемых паннексинами.
7.1.1. Анализ аминокислотной последовательности, кодируемой геном PANX1.
Мы провели детальный компьютерный анализ аминокислотной последовательности белка PANX1 (MRS1), который показал статистически значимое сходство белка MRS1 к иннексинам, на основании наличия и расположения четырех трансмембранных доменов, а так же консервативных цистеинов, предсказанных программами ТМНММ и "DAS - Transmembrane Prediction server " (Результаты работы программ показаны на рисунке 8 в рукописи диссертации )
7.1.2. Анализ аминокислотной последовательности, кодируемой геном PANX2. Описанные выше изоформы мРНК гена PANX2, PANX2 и PANX2alt2, содержат открытые рамки считывания, которым соответствуют предсказанные аминокислотные последовательности, состоящие из 633 а к и 509 а к Данные
V9
аминокислотные последовательности были проанализированы программами ТМНММ и "DAS - Transmembrane Prediction server " .
Анализ показал, что последовательность размером 633 а к содержит четыре трансмембранных домена (рисунок 8 в рукописи диссертации) Данная структура белка является характерной для всех известных белков щелевых контактов
Аминокислотная последовательность размером 509 а к по данным программы ТМНММ не содержит ни одного района гомологичного иннексинам 7.13. Анализ аминокислотной последовательности, кодируемой геном PANX3. Мы проанализировали аминокислотную последовательность, кодируемую геном PANX3, на наличие в ней трансмембранных доменов программами ТМНММ и "DAS - Transmembrane Prediction server" Так же как и в случае с PANX1 и PANX2 анализ показал наличие четыре трансмембранных домена в исследуемой аминокислотной последовательности (рисунок 8 в рукописи диссертации) Таким образом все три белковых продукта, кодируемые генами PANX1, PANX2 и PANX3 имеют четыре трансмембранных домена, которые являются характерной особенность структуры всех белков щелевых контактов
7.2. Сравнительный биоинформатический анализ белков паннексинов человека и гомологичных им белков из других организмов.
Для понимания филогенетических отношений между паннексинами человека и родственными паннексинам генами, клонированными в других организмах, были проанализированы соответствующие аминокислотные последовательности Последовательности, кодируемые генами паннексинов и иннексинов были проанализированы программой ТМНММ, которая показала сходный профиль распределения гидрофобных аминокислот для всех иннексинов и паннексинов Обе группы белков имеют четыре предсказанных трансмембранных района, две внеклеточных петли, одну внутриклеточную и С- и N-концы обращенные в цитоплазму Характерной особенностью иннексинов является наличие во второй внеклеточной петле двух цистеинов Эти же серосодержащие аминокислоты были так же обнаружены во второй внеклеточной петле всех белков позвоночных, гомологичных иннексинам
ю
Сравнительный анализ паинексинов и иннексинов беспозвоночных с помощью программы ClustalX показал, что областью наибольшего сходства между паннексинами и иннексинами являются два первых трансмембранных домена и аминокислотная последовательность между ними Короткая изоформа белка человека PANX2, кодируемого PANX2alt2, не содержит этих консервативных доменов и пока нет никаких предположений относительно его функции Стандартный алгоритм белок-белкового сравнения BLAST примененный к аминокислотной последовательности гена PANX2 обнаружил сходство белка PANX2 с иннексином С. elegans eat-5 (Е value 7 х юЛ а также выявил гомологию с белками une-9, inx-10, inx-11, inx-5 и unc-7 иннексинов нематоды Исследования аминокислотной последовательностей PANX1 и PANX3 программой PSI-BLAST так же выявили гомологии к иннексинам в их составе
С помощью программы TREE-PUZZLE была построена дендрограмма отражающая филогенетические отношения между паннексинами человека и белками щелевых контактов прочих организмов, включая нематоду и мышь Сравнение последовательности нуклеотидов показало, что все три гена человека PANX1, PANX2 и PANX3 гомологичны друг другу, но каждый из них имеет еще большее сходство с ортологом в геноме мыши (рисунок 9 в рукописи диссертации) Данная часть работы выполнена совместно с к б н Д В Ивановым и д б н Ю В.Панчиным
Большее сходство между генами ортологами, по сравнению с паралогами означает, что образование всех трех членов генного семейства паннексинов предшествовало образованию видов мыш и человек
8. Исследование экспрессии генов паинексинов мыши Panxl и Рапх2 методом гибридизации in situ на срезах тканей.
Для исследования экспрессии генов мыши Panxl и Рапх2 была проведена гибридизация in situ на сагитальных срезах целого эмбриона мыши, корональных срезах мозга и сагитальных срезах хрусталика глаза взрослой мыши В качестве пробы использовалась меченная кРНК, комплементарная мРНК генов Panxl и Рапх2, размером 1 8 т п н для Panxl и 500 п н для Рапх2.
Наиболее сильный гибридизационный сигнал пробы кРНК гена Panxl, был получен в области центральной нервной системы (рисунок 10 1 в рукописи диссертации)
В связи с этим, для более детального исследования экспрессии гена Parvcl в тканях центральной нервной системы нами была поставлена серия аналохичных экспериментов на срезах тканей мозга мыши Эти эксперименты дали четкий сигнал во всех отделах мозга мыши, что согласуется с данными гибридизации т situ на целом эмбрион (данные не представлены) Данная часть работы была проведена совместно с сотрудниками института Нормальной физиологии РАМН к б н О О Литвин и к б н А Тиуновой
Кроме того, нами была поставлена гибридизация in situ на срезах хрусталика глаза мыши Результаты гибридизации показали, что транскрипт гена Panxl равномерно распределен в дифференцированных волокнах хрусталика и имеет наиболее интенсивный сигнал в области расположения недифференцированных волокон хрусталика ( рисунки 11 1 и 11 2 в рукописи диссертации) Данная часть работы была выполнена мною совместно с сотрудниками Института Глаза им Баском Палмера (Майами, США) Г Дворянчиковой и Д Ивановым
Опираясь на результаты Нозерн-гибридизации гена человека PANX2, а также на данные проведенного нами анализа анализа мышиного кластера EST последовательностей соответствующих Рапх2, которые показали что ген паннексин 2 экспрессируется преимущественно в тканях мозга, нами была проведена гибридизация пробы мРНК, соответствующей мышиному Рапх2, на срезах мозга взрослой мыши Наиболее интенсивный полученный гибридизационный сигнал соответствует клеткам Пуркинье на срезе мозга (рисунок 10 2 в рукописи диссертации) Однако экспрессия Рапх2 наблюдается и в других отделах Данная часть работы была проведена совместно с сотрудниками института Нормальной физиологии РАМН к б н О О Литвин и к б н А Тиуновой
выводы.
1. Обнаружено новое семейство генов позвоночных названных паннексины Гены этого семейства ортологичны генам иннексинов беспозвоночных, кодирующих белки щелевых контактов. Впервые показано, что семейство паннексинов представлено и в геноме человека, и в геноме мыши тремя генами Гены человека названы PANX1, PANX2 и PANX3. Гены мыши-Panxl, Рапх2 и РапхЗ.
2. Определены нуклеотидные последовательности геномной ДНК и кДНК генов паннексинов человека, приоритетно зарегистрированые в публично доступной базе даных GenBank.
3. Впервые выявлены изформы мРНК генов паннексинов человека две изоформы мРНК для генов PANX1 и PANX2 и одна для гена PANX3 Все изоформы мРНК гена PANX1 состоят из пяти экзонов, и отличаются по длине 5'-концевого белок кодирующего экзона Одна из изоформ мРНК гена PANX2 имеют 4 экзона, а другая - 5 экзонов У изоформ PANX2 совпадает первый и три концевых экзона мРНК гена PANX3 представлена четырьмя экзонами
4. Определена экзон-интронная структура генов Panxl, Рапх2 и РапхЗ в геноме мыши Ген Panxl мыши состоит из пяти экзонов имеет такую же геномную организацию как и ген PANX1 человека Гены Рапх2 и РапхЗ состоят из четырех экзонов
5. Методом Нозерн-гибридизации показано, что ген PANX1 имеет широкий профиль экспрессии и обнаруживается во всех проанализированных тканях, что, вероятно, указывает на его значимость для жизнедеятельности клеток всех тканей Ген PANX2 экспрессируется только в нервной ткани Уровень экспресии гена PANX3 низкий (выявляется ОТ-ПЦР) и его тканеспецифичность методом блот гибридизации охаракеризовать не удается
6. Предсказана аминокислотная последовательность белков, кодируемых генами PANX1, PANX2 и PANX3 человека Каждый из белков паннексинов, согласно данным анализа программы ТМНММ, имеет 4 трансмембранных
гъ
домена Структура предсказанных доменов является характерной для белков шелевых контактов
7. Гибридизация in situ с меченной кРНК показала, что в эмбрионе мыши транскрипция генов Panxl и Рапх2 происходит преимущественно в клетках центральной нервной системы В постнатальном периоде показана экспрессия гена Panxl в клетках хрусталика глаза
СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ. Статьи:
1 Макеева Н В, Пестова АА, Бородина ТА Мадера ДА, Иванов ДВ, Степанова Е В, Баранова АВ Фудаментальные и прикладные аспекты сравнительной геномики позвоночных животных Генетика, 2003, т 39, с 1157-1171
2. Baranova A, Ivanov D, Petrash N, Pestova A, Skoblov M, Kelmanson I, Shagin D, Nazarenko S, Geraymovych E, Litvin O, Tiunova A, Born TL, Usman N, Staroverov D, Lukyanov S, Panchin Y. The mammalian pannexin family is homologous to the invertebrate innexin gap junction proteins. Genomics. 2004 Apr; 83(4):706-16
Тезисы и сообщения:
1. A. Baranova, D. Ivanov, M. Skoblov, A. Pestova, I. Kelmanson, D. Shagin, N. Usman, D. Staroverov, S. Lukyanov, Y. Panchin. Mammalian pannexin family homologous to invertebrate gap-junction proteins are differentially expressed in nervous tissue. Program No. 836.9. 2002 Abstract Viewer/Itinerary Planner. Washington, DC: Society for Neuroscience, 2002. http://sfo.scholarone.com/itin2002/index.html http://web.sfn.org/content/Publications/AnnuatMeeting/mdex.htm!
2. V. Shestopalov, G. Dvoriantchikova, A. Pestova, N. Yankovsky, D. Ivanov. Pannexin-1 expression in the lens. ARVO 2005. May 1-5.
Подписано в печать 16.05.2005 Объем 1.75 печ.л. Тираж 100 экз. Заказ № 87 Отпечатано в ООО «Соцветие красок» 119992, г.Москва, Ленинские горы, д.1 Главное здание МГУ, к. 102
05-1 39 0 8
РНБ Русский фонд
2006-4 10433
- Пестова, Анна Айвенговна
- кандидата биологических наук
- Москва, 2005
- ВАК 03.00.15
- Эволюция генов иммунной системы
- Сравнительный геномный анализ систем метаболизма длинноцепочечных жирных кислот и мембранных белков γ-протеобактерий
- Идентификация онко-ассоциированных генов при светлоклеточном раке почки
- Компьютерный анализ закономерностей кодирования функциональных сайтов белков в генах позвоночных
- Конструирование и клонирование искусственных генов, кодирующих иммунодоминантные белки вируса лихорадки долины Рифт