Бесплатный автореферат и диссертация по биологии на тему
Протеомные базы данных для поиска тканеспецифичных белковых маркеров мышечных органов
ВАК РФ 03.01.04, Биохимия

Автореферат диссертации по теме "Протеомные базы данных для поиска тканеспецифичных белковых маркеров мышечных органов"

На правах рукописи

КОВАЛЕВА Марина Анатольевна

Протеомные базы данных для поиска тканеспецифичных белковых маркеров мышечных органов

03.01.04 - Биохимия

Автореферат

диссертации на соискание ученой степени доктора биологических наук

16 МАГ! 2013

005059ььэ

Москва-2013

005059565

Работа выполнена в лаборатории биомедицинских исследований Федерального государственного бюджетного учреждения науки Институт биохимии им. А.Н.Баха Российской академии наук.

Научный консультант: профессор, доктор биологических наук

Шишкин Сергей Сергеевич

Официальные оппоненты: Лисица Андрей Валерьевич

член-корреспондент РАМН, доктор биологических наук, Федеральное государственное бюджетное учреждение науки «Научно-исследовательский институт биомедицинской химии имени В.Н.Ореховича» Российской академии медицинских наук, заместитель директора по научной работе;

Левицкий Дмитрий Иванович

доктор биологических наук, профессор, Федеральное государственное бюджетное учреждение науки Институт биохимии им. А.Н.Баха Российской академии наук, заведующий лабораторией молекулярной организации биологических структур; Зезеров Евгений Гаврилович доктор биологических наук, профессор, академик РАЕН, Государственное бюджетное образовательное учреждение высшего профессионального образования Первый Московский Государственный университет им. И.М. Сеченова Министерства здравоохранения Российской Федерации, кафедра биологической химии, профессор.

Ведущая организация:

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский государственный университет имени М.В.Ломоносова».

Защита состоится « 23 » мая 2013 г. в 13 ч. на заседании диссертационного совета Д 002.247.01 по защите диссертаций на соискание ученой степени доктора и кандидата наук при Федеральном государственном бюджетном учреждении науки Институт биохимии им. А.Н.Баха Российской академии наук по адресу: 119071, Москва, Ленинский проспект, д. 33 стр. 2.

С диссертацией можно ознакомиться в Библиотеке биологической литературы РАН по адресу: 119071, Москва, Ленинский проспект, д.ЗЗ, стр.1.

Автореферат разослан » Й>и.[у1Л5> 2013 г.

Ученый секретарь диссертационного совета

кандидат биологических наук

А.Ф. Орловский

ВВЕДЕНИЕ

Актуальность темы.

Для развития биохимии белков в начале 21 -ого века принципиальное значение приобрело широкое применение протеомных и биоинформационных технологий [Арчаков А.И. 2000, Anderson N.G. et al. 2001; Шишкин С.С. 2002; Прим-роуз С., Тваймен Р. 2008 и др.]. Накапливающиеся результаты, представляющие собой совокупности взаимосвязанных сведений, подлежащих совместной обработке, рассматриваются как соответствующие информационные массивы, на основе которых формируются различные общие и специализированные базы данных, размещаемые в сети «Интернет». Среди них надо особо отметить в базе данных UniProt информационный ресурс, названный «Complete proteome of Homo sapiens», который к середине 2012 года включал более 70 000 аннотаций, однако из них только 25 000 аннотаций (35,2%) представляли результаты прямых исследований соответствующего белка. Таким образом, очевидно, что большая часть (64,8%) созданных аннотаций нуждается в дополнительных экспериментальных материалах, при получении которых решающую роль могут сыграть протеомные технологии и дальнейшее развитие информационных ресурсов, что свидетельствует о высокой актуальности подобных исследований.

В первой декаде 21-го века также поступательный импульс получили протеомные исследования, направленные на выявление полиморфных вариантов белков в мышечных органах и выяснение роли белкового полиморфизма при различных физиологических и патологических процессах [Yip Y. et al., 2008; Wei Y.J. et al. 2009; Manning A. et al., 2012 и др.]. Особое внимание при этом уделялось аллельным изоформам, которые характеризуются единичными аминокислотными заменами в аминокислотных последовательностях, поскольку такие замены могут приводить к изменениям функциональных свойств белка (от незначительных до полной потери функции) или не оказывать подобного влияния (так называемые «нейтральные» замены). Уже собранная обширная информация о белковом полиморфизме в различных базах данных (например, в UniProt) включает и сведения о большом числе спорных определений отдельных аминокислот в ряде позиций первичной структуры многих белков, так называемых «аминокислотных конфликтов в последовательности» (Sequence conflict). Соответственно, при исследованиях любого белка разрешение «аминокислотного конфликта» в пользу одного из вариантов представляет значительный интерес, поскольку итоговая детализация первичной структуры может оказать влияние на формирование представлений о пространственной упаковке его полипептидной цепи и других свойствах, включая функциональные особенности.

Наряду с изучением разных аспектов белкового полиморфизма и других фундаментальных проблем биохимии белков мышечных органов протеомные технологии находят все более широкое применение в разработках биомедицинских проблем, ориентированных на решение многих прикладных задач - от выявления потенциальных диагностических белковых биомаркеров, мишеней фармакологических воздействий [Cummings J. et al. 2008; Principe S. et al. 2012 и др.] до создания методов контроля за качеством различных пищевых продуктов, изготавливаемых из мышечных тканей животных [Zapata I. et al. 2009; de Almeida AM, Bendixen E. 2012 и др.].

Таким образом, направленность данной работы на построение протеомных баз данных, предназначенных для изучения вопросов, относящихся к биохимии белков мышечных органов, а также для решения комплекса прикладных задач, включающих выявление потенциальных белковых биомаркеров различных форм патологии (в частности, рака простаты) в целом, определяет актуальность избранной темы.

Цель и задачи исследования. Основной целью данной диссертационной работы стало построение отечественных биоинформационных ресурсов (баз данных, размещённых в сети «Интернет») о белках ряда мышечных органов для оптимизации поисков новых белковых изоформ и определения тканеспецифичных белковых маркеров. Для решения этой проблемы были поставлены следующие задачи:

1. Провести изучение протеомных профилей и анализ белкового полиморфизма в различных мышечных органах человека, а также некоторых культивируемых клеточных линиях, направленных на выявление изоформ с единичными аминокислотными заменами.

2. Изучить биохимические проявления дифференциальной генной экспресии при клеточной дифференцировке и в онтогенезе мышечных органов человека.

3. Разработать общие принципы построения многомодульных протеомных баз данных и создать на их основе отечественную базу данных «Протеомика мышечных органов» для определения тканеспецифичных белков и анализа белкового полиморфизма в различных мышечных органах человека.

4. Сформировать новую версию отечественной базы данных «Протеомика рака простаты», включающую комплексные модули, обобщающие результаты проте-омного анализа отдельных белковых препаратов, для определения потенциальных биомаркеров этого заболевания

5. Провести с помощью построенных протеомных баз данных поиск так называемых безымянных (unnamed), гипотетических (hypothetical) и других малоизу-

ченных белков в образцах тканей и культивируемых клеточных линиях человека.

6. Разработать на основе протеомных исследований метод, пригодный для контроля качества мясной продукции по белковому составу с определением видовой специфичности мышечных белков и выявлением белковых добавок немышечного происхождения.

Научная новизна.

В ходе протеомных исследований в тканях мышечных органов и культивируемых клетках человека выявлены различные варианты биохимического полиморфизма белков, обусловленные единичными аминокислотными заменами (single amino acid substitution, SAAS), включая новый вариант триозофосфатизо-меразы 1 (SAAS 233G—>D), определены частоты встречаемости в славянских выборках аллельных вариантов с SAAS 41Е—>А АЗ,5-А2,4-диеноил-коэнзим А изомеразы и мышечной енолазы с SAAS 71 N-> S, а также разрешены в одну из сторон «конфликтные» определения (по 135 позициям) в аминокислотных последовательностях 59 белков человека.

На основе специально разработанных общих принципов построения многомодульных протеомных базы данных сформирована новая версия отечественной базы данных «Протеомика мышечных органов», содержащая новые комплексные модули «Белки миокарда» и «Белки миобластов», а также новая версия (2012 г.) отечественной базы данных «Протеомика рака простаты», содержащая новый комплексный модуль «Белки клеток DU-145», в котором обобщены результаты протеомного анализа суммарных белков этих клеток и отдельных белковых препаратов (ядерные белки, гистоны, фосфопротеины), включая сведения о 78 идентифицированных белках.

Получены новые данные, прямо подтверждающие существование пяти безымянных белков (продуктов локусов ВАС05360, BAG63245, ВАН11721, BAG53005, ВАС05009, зарегистрированных в GenBank) в образцах ряда тканей и клеточных линиях человека.

В биоптатах предстательной железы человека, а также в культивируемых клетках линии DU-145 выявлено семь укороченных белковых продуктов, которые соответствуют белкам человека, предсказанным ранее по материалам исследований геномной ДНК и/или соответствующих мРНК; таким образом, впервые обнаружено существование особых укороченных изоформ у некоторых известных белков (тропомиозина 3, поли (А) связывающего белка 1, фосфоглюкомута-зы 3 и др.).

Научно-практическая значимость.

Сформированные отечественные информационные ресурсы «Протеомика мышечных органов» (версия 2012 г., http://mp.inbi.ras.ru) и «Протеомика рака простаты» (версия 2012 г., http://ef.inbi.ras.ru) доступны пользователям сети Интернет и позволяют оптимизировать соответствующие протеомные исследования, направленные на поиски потенциальных белковых биомаркеров тканевой специфичности. База данных «Протеомика рака простаты» включена в Государственный реестр баз данных (регистрационный номер 2012620676 от 13.07.2012). Результаты этой работы использованы в трех информационно-методических письмах, которые нашли применение в учебном процессе при подготовке врачей-урологов (включены в курс последипломного образования по урологии, кафедра урологии РМАПО), а также в обучении студентов и аспирантов кафедры биохимии РУДН (элективный курс «Клиническая биохимия»).

База данных «Протеомика мышечных органов» также включена в Государственный реестр баз данных (регистрационный номер 2013620315 от 20.02.2013).

Показано, что исследования и анализ на основе протеомных баз данных позволяют решать широкий круг биомедицинских вопросов, связанных с обнаружением полиморфных белков, а также с выявлением изменений протеомных профилей в ходе клеточной дифференцировки, онтогенеза мышечных тканей и органов. Обнаружен ряд изменений в протеомных профилях при старении и некоторых формах патологии (злокачественные новообразования и др.)

Проведенное изучение потенциальных белковых биомаркеров рака простаты создало научно-методические основы для организации клинических исследований с целью валидации некоторых из этих маркеров (AGR2, PR02675, Dj-1, сер-пин HI и трансгелин). Получен патент на один из потенциальных биомаркеров рака простаты (№ 2360924, зарегистрирован в Государственном реестре изобретений Российской Федерации 10 июля 2009 г., опубликован 10.07.2009, Бюл., №19. С. 1-7.).

В ходе биомедицинских исследований, направленных на определение качества мясных продуктов, выявлены видоспецифические изоформы ряда мышечных белков и предложен метод, пригодный для контроля качества мясной продукции по белковому составу и обнаружения белковых добавок немышечного происхождения, включая установление признаков фальсификаций.

Основные положения диссертации, выносимые на защиту.

1. Найдены различные варианты биохимического полиморфизма белков человека: а - обусловленные единичными аминокислотными заменами (single amino acid substitution, SAAS), включая новый вариант триозофосфатизомеразы 1

(SAAS 233G—>D), и разрешены в одну из сторон «конфликтные» определения первичной аминокислотной последовательности по 135 позициям 59 белков человека, б - в гладкомышечных тканях и органах, содержащих значительное количество гладкомышечных клеток, показана множественность и органоспеци-фичность спектра изоформ трансгелина.

2. Сформированы двуязычная база данных «Протеомика мышечных органов», содержащая 7 модулей и информацию по 510 идентифицированным белковым фракциям и новая, расширенная версия (2012 г.) отечественного информационного ресурса - база данных «Протеомика рака простаты», включающая 9 модулей (570 идентифицированных белковых фракций), в том числе комплексный модуль «Белки клеток DU-145», обобщающий результаты протеомного анализа суммарных белков этих клеток, а также отдельных белковых препаратов (ядерные белки, гистоны, фосфопротеины).

3. Выявлено и охарактеризовано несколько безымянных и других малоизученных белков человека.

4. На основе количественной денситометрии из потенциальных белковых онкомаркеров для рака простаты отобрана панель наиболее перспективных белков для дальнейшего использования.

5. Определены видоспецифичные белковые биомаркеры мышечных тканей, а также белки различных немышечных пищевых добавок, позволяющие характеризовать качество мясной продукции, включая выявление нарушений нормативов ГОСТ и ТУ.

Апробация работы.

Материалы данной работы докладывались на международных и российских конференциях, а также на научных съездах и конгрессах, в том числе: II Моск. междун. конгресс «Биотехнология: состояние и перспективы развития», 2003. Москва; Intern. Confer., «Chemical and Biological Problems of proteomics», 2004. Novosibirsk; IV Съезд Российского общества биохимиков и молекулярных биологов, 2008, Новосибирск; 10 ESC Meeting, Leuven, Belgium, 2008; XXXVII Eur. Muscle Conference, Oxford, England, 2008; VII Съезд онкологов России 2009, Москва; 25th Anniversary EAU Congress, Barcelona, 2010; III межд. научно-практ. конф. «Постгеномные методы анализа в биологии, лабораторной и клинической медицине». Казань, 2012; Proc. 58th Congr. Meat Science and Technology, Montreal, Canada 2012 и др.

Публикации.

По теме диссертации опубликовано 80 научных работ, среди которых одна монография, две главы в коллективных монографиях, 21 статья в рецензируемых

российских и международных журналах, 4 статьи в тематических сборниках, один патент, три информационно-методических письма, 46 тезисов докладов на различных конференциях.

Структура и объем диссертации.

Диссертация состоит из введения, обзора литературы, описания материалов и методов исследования, изложения результатов и их обсуждения, заключения, выводов и списка цитируемой литературы (760 наименований). Работа изложена на 2-42-страницах, содержит SL „таблиц и 40$ рисунков.

МАТЕРИАЛЫ И МЕТОДЫ ИССЛЕДОВАНИЙ

В соответствии с целью работы для изучения белкового полиморфизма в мышечных органах человека, включая простату, построения протеомных баз данных и поиска тканеспецифичных белковых маркеров использовали в основном биопсийные образцы и операционные материалы, а также различные аутоп-сийные материалы. Параллельно исследовали белки нескольких культивируемых клеточных линий человека.

Биопсийные образцы скелетных мышц (m. vastus lateralis п=23) были получены методом игольчатой биопсии под местной анестезией в ИМБП РАН от практически здоровых молодых добровольцев-спортсменов (20 - 24 лет). Биопсийные образцы миокарда (п=40) были предоставлены сотрудниками Института экспериментальной кардиологии Минздрава России, проводивших хирургические или диагностические вмешательства у лиц с сердечно-сосудистой патологией, включая 16 больных с хронической ишемической болезнью сердца (ХИБС). Биоптаты предстательной железы (п=167) от больных злокачественными и доброкачественными новообразованиями (рак и гиперплазия), которым выполнялись диагностические биопсии и различные хирургические операции, были получены от сотрудников кафедры урологии РМАПО.

Аугопсийные образцы миокарда (п=90), а также некоторых других мышечных органов (п = 34 - га vastus lateralis, n = 3 - простата и n = 5 - миометрий, от лиц, погибших в результате несчастного случая) были получены из Бюро судебно-медицинской экспертизы Департамента здравоохранения г. Москвы с минимальными сроками аутолиза, который не превышал 12 часов. Образцы миокарда эмбрионов и плодов человека (биоптаты, п=95) были предоставлены Республиканским медико-генетическим центром г. Минск. Образцы средней оболочки аорты были предоставлены к.м.н. И.А. Собениным («Российский кардиологический научно-производственный комплекс» Минздравсоцразвития РФ). До начала исследований все аугопсийные образцы хранились при температуре -70°С.

Были исследованы также образцы скелетной мышцы (m. vastus lateralis) от больных медленными нейродегенеративными заболеваниями, включая пациентов с боковым амиотрофическим склерозом (суммарно п=29), диагнозы которым устанавливали в соответствии с критериями Всемирной Федерации неврологов сотрудники НИИ неврологии РАМН. Пациенты включались в исследование в том случае, если они давали на это письменное или засвидетельствованное информированное согласие. Параллельно были проанализированы биопсийные материалы от ряда пациентов с другими нервно-мышечными заболеваниями -митохондриальные миопатии (п=10) и болезни экспансии тринукпеотидных повторов (п=6). Эти биоптаты любезно предоставили к.б.н. Е.Ю. Захарова (МГНЦ РАМН) и к.м.н. В.В. Полищук (НИИ неврологии РАМН).

В работе использовались культивируемые миобласты человека, любезно предоставленные к.б.н. Т.Б. Крохиной и выведенные, как описано ранее [Крохина Т.Б. и др., 1996], а также три линии культивируемых клеток рака простаты (РП) (LNCaP, РС-3, DU-145) и линия ДГПЖ (ВРН-1) человека. Клетки линий РС-3, DU-145 и ВРН-1 были закуплены в German Collection of Microorganisms and Cell Cultures (Германия), а образец LNCaP-FGC - линии из американской клеточной коллекции АТСС (№.CRL-10995) - был получен от д.б.н. И.Г. Шемякина (ГНЦ прикладной микробиологии и биотехнологии, г. Оболенск). Кроме того, в ряде экспериментов исследовали клетки двух линий рабдомиосаркомы человека (линии А-204 и RD) и линии карциномы почки OKP-GS, приобретенные в НИИ вирусологии им. Д.И. Ивановского РАМН и Институте цитологии РАН, соответственно.

В отдельном цикле исследований был изучен ряд образцов мясной продукции: 10 образцов вареной колбасы «Докторская» от разных производителей, образцы мясного сырья (свинина и говядина) и белковых добавок (соевый белок, изолят соевого белка, соевый текстурат и коллагеновый гидролизат говяжий, сухое молоко), используемых согласно нормативной документации. Все образцы были предоставлены сотрудниками ВНИИМП им. В.М. Горбатова Россельхоза-кадемии.

В типичных протеомных исследованиях к 100 мг измельченной ткани добавляли в 2 мл лизирующего раствора (9 М мочевины, 5% меркаптоэтанола, 2% тритона Х-100, 2% амфолинов рН 3,5 - 10) и гомогенизировали в системе тефлон-стекло. Гомогенат осветляли центрифугированием (800gx5 мин) и надоса-дочную фракцию, содержащую солюбилизированные белки (суммарный экстракт), использовали для фракционирования. Суммарные белковые экстракты культивируемых клеток человека получали таким же методом, а для изучения

ядерных белков клетки разрушали в мягких условиях (добавление неионного детергента и проведение нескольких циклов «замораживания - оттаивания»), затем центрифугированием осаждали клеточные ядра, после чего из препаратов ядер экстрагировали суммарные ядерные белки, гистоны и остаточные белки ядерного матрикса [по Green G.R., Do D.P. 2009]. Получение препаратов «Суммарные фосфопротеины» из культивируемых клеток осуществляли с помощью аффинной хроматографии, используя набор реагентов фирмы «Qiagen» по протоколу фирмы-производителя.

В качестве основных протеомных технологий применяли различные модификации двумерного электрофореза по O'Farrell (с изоэлектрофокусированием в амфолиновом или иммобилиновом градиентах pH) [Ковалева М.А. с соавт. 2008; Shishkin et al 2011]. Детекция белков на гелевых пластинах проводилась окрашиванием Кумасси R-250, а также с использованием азотнокислого серебра, коллоидным кумасси G-250 или SYPRO Ruby. Полученные цифровые изображения редактировали в графическом редакторе из пакетов программ ImageMaster 2D Platinum версий 6 и 7 («GE Healthcare», Швейцария). Идентификацию белков с помощью масс-спектрометрии проводили согласно протоколам «Центра протеомных исследований» при НИИ биомедицинской химии им. В.Н. Ореховича РАМН. Масс-спектрометрия методом MALDI-TOF MS выполнялась в НИИ биомедицинской химии им. В.Н. Ореховича РАМН, а также в НИИ физико-химической медицины Росздрава и ИНБИ РАН. При идентификации некоторых белков уточнение структуры триптических пептидов проводили методом MALDI-TOF MS/MS.

Для подтверждения существования полиморфных вариантов у некоторых белков проводили анализ однонуклеотидных замен в соответствующих генах. С этой целью из культивируемых клеток получали препараты ДНК с помощью набора DNeasy Plant Handbook («QIAGEN», США), которые использовали для амплификации соответствующих сайтов. Определение и оптимизацию последовательности олигонуклеотидных праймеров проводили с помощью программ OligoAnalyser 3.1 и Bioedit 7.0.0. Секвенирование всех полученных ДНК осуществляли в Межинститутском Центре коллективного пользования «ГЕНОМ» ИМБ РАН, используя набор реактивов ABI PRISM® BigDye™ Terminator v. 3.1 с последующим анализом продуктов реакции на ДНК-секвенаторе ABI PRISM 3100-Avant (совместно с к.б.н.Черкашиным Е.А).

Сбор и обработку данных для формирования многомодульных протеомных баз данных (далее БД), представляющих собой интерактивные web-ресурсы на основе СУБД MySQL, выполняли с использованием программ MapThis!, Molly

Pinguin Software и пакета программного обеспечения Mozilla Firefox, а также других программных средств, в частности, входящих в набор Microsoft Office.

Статистическая обработка полученных результатов проводилась с использованием пакетов программ: BIOSTAT, MS Office Excel 2010. Сравнение количественных признаков в независимых группах проводили с использованием t-критерия Стьюдента или U- критерия Уилкоксона-Манна-Уитни. Результаты с уровнем значимости менее 0,05 рассматривали как статистически значимые.

РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ 1. Протеомное изучение биохимического полиморфизма белков, обусловленного аминокислотными заменами, в некоторых тканях и культивируемых клетках человека. Проблема «конфликтов» в аминокислотных последовательностях некоторых белков.

Проведенные исследования показали, что в протеомных профилях скелетных мышц, миокарда и других мышечных органах человека, а также в различных культивируемых клетках присутствует ряд полиморфных белков, среди которых практически везде удавалось идентифицировать изоформы енолазы, одного из ключевых гликолитических ферментов (Рис. 1).

Известно, что у человека имеется полилокусный полиморфизм енолазы, вследствие чего этот белок представлен тремя основными изоформами: а-енолаза (ген ENOl), ß-енолаза (ген EN03) и у-енолаза (ген EN02). При этом в образцах скелетных мышц человека были выявлены две белковые фракции (Н и L), являющиеся продуктами гена EN03 (мышечная енолаза, ß-енолаза).

N , 2 2

т^ 1 m

А Б в

Рис. I. Области ДЭ белков скелетной мышцы у разных лиц (А, Б, В), на которых локализованы фракции, идентифицированные как Р-енолаза. Стрелками обозначены 1,2 -полиморфные варианты Р-енолазы, 3 - а-АТФ синтаза.

Эти белковые фракции характеризовались одинаковыми значениями р1 (6,94), но различались по молекулярной массе. При анализе образцов от разных лиц было показано, что эти изоформы образуют три варианта распределения белковых фракций, принадлежащих р-енолазе (Рис. 1).

Из 57 проанализированных биопсийных и аутопсийных образцов скелетных мышц в 10 случаях выявлялась только изоформа Ь, у 32 человек присутствовали

обе изоформы, и у 15 человек наблюдалась изоформа Н (Табл.1). Таким образом, эти варианты можно рассматривать как соответствующие альтернативным гомозиготным состояниям и гетерозиготному состоянию гена EN03. Таблица 1. Частоты встречаемости аллельных вариантов SAAS 71 N—»S в ß-енолазе у обследованных жителей г.Москвы.

Выборка 71N 71S

г. Москва (п=57) 2x^=0,364 0,456 0,544

Для подтверждения предположения о том, что Н и L изоформы ß-енолазы являются аллельными продуктами экспрессии одного и того же гена EN03, был проведен анализ спектров их триптических пептидов методом MALDI-TOF масс - спектрометрии. В результате удалось прямо охарактеризовать структурные различия между Н и L изоформам фермента, которые заключаются в двух аминокислотных заменах 71 N—>S и 85 V-»A.

В проанализированных пробах все образцы Н изоформы содержали серин в положении 71, тогда как в образцах L изоформы в этой позиции определялся только аспарагин. Другой высокочастотный вид SAAS 85 V-»A выявлялся произвольно как в форме L, так и Н, в обследованных нами выборках.

Далее, при протеомном изучении белков в образцах тканей простаты в одном случае из 150 около типичной фракции а-енолазы была зарегистрирована дополнительная фракция, которая характеризовалась большим значением pl, а по результатам MALDI-TOF MS также идентифицировалась как а-енолаза. Сравнительное изучение двух указанных белковых фракций позволило идентифицировать SAAS в дополнительной электрофоретической изоформе енолазы 1. Сначала по результатам анализа спектров триптической фрагментации, полученных для обычной и дополнительной изоформы енолазы 1, удалось установить различие по двум пикам масс, а именно у обычной изоформы присутствовал трипти-ческий пептид, дающий пик с m/z 1939.96/, а у дополнительной - пик масс с m/z 1649.85. Тандемная масс-спектрометрия пика с m/z 1649.85 показала, что в его структуре имеется аминокислотная последовательность LAMQEFMILPVGAAK. Иными словами, различие между обычной и электрофоретической изоформами енолазы 1 представляет собой SAAS 177N—>К. Эти результаты являются первым свидетельством о существовании варианта енолазы 1 с SAAS 177N—>К в обследованной выборке граждан РФ.

При изучении 115 образцов мышцы левого желудочка сердца у 72 человек было выявлено присутствие в одном из участков ДЭ (Рис. 2, а) белковой фракции с координатами Мм/pl - 29,7 кДа/6,75 (№ 4472675, здесь и далее по ранее

предложенной номенклатуре [Kovalyov L. et al., 1995]). У 8 других человек (Рис. 2, в) рядом располагалась белковая фракция с координатами 29,7 кДа/6,57 (№ 4472657).

В 35 случаях (Рис. 2, 6) присутствовали обе указанные белковые фракции - № 4472675 и № 4472657. Эти данные позволили предположить, что отмеченные варианты распределения белков отражают два вида гомозиготных и гетерозиготное состояние продуктов одного гена.

Указанные белковые фракции идентифицировали с помощью масс-спектромерии, и при этом оказалось, что все они являются продуктами одного гена - ЕСН1, который кодирует ЛЗ,5-Л2,4-диеноил-коэнзим А изомеразу (ДКАИ) человека. Выявленные триптические пептиды покрывали 82% аминокислотной последовательности предполагаемого продукта гена ЕСН1 (Рис. 3).

Т Т

I

«у

t

т

Рис. 2. Фрагменты ДЭ белков миокарда человека с полимофными вариантами белкового продукта гена ЕСН1:

а - гомозиготность по аллелю № 4472675,

б - присутствие обоих аллелей (гете-розиготность) - оба белка с координатами 29,7 кДа/6,75 и 29,7 кДа/6,57, соответственно,

в - гомозиготность по аллелю № 4472657

Ранее по материалам секвенирования кДНК, было обнаружено существование полиморфизма продуктов гена ЕСН1 [FitzPatrick D. et al., 1995; Strausberg R. et al., 2002] с различием между изоформами в виде единичной аминокислотной замены в 41 позиции (Е—»A). В базе данных «NCBI protein» соответствующие записи представлены под номерами 11433007 и 16924265.

1 niaagivasi г lidlltnlt gsnypglsis 1 г ltgssaqe aasgvalgea pdlisyesj r v

61 tsaqk hvJliv qlnrpnkrna lmilcvfwremv ecfiikisi cla dci awisga gkurftagidl

121 piiclinasclilqp Kgdclvansw ylrclutiyq etlnvier~| q) kpviaavligg cigggvdlvt

181 а с cur ycaqrt attqvK evdv giaactvgttq ripK\ignqs ivneiaitar Kimnadealgs

241 glvsrvfpdk e\inldaalal aaeisskspv avqstkvnll ysrdlisvaes lim'aswmns

301 hnlqtqdh ks vqattenk el K1\ttsld

Рис. 3. Аминокислотная последовательность ДЗ,5-Д2,4-диеноил-коэнзим А изомеразы человека (NCBI protein» записи 11433007 и 16924265), прямоугольниками выделены идентифицированные по результатам масс-спектрометрии триптические пептиды.

С этими данными хорошо согласовывались наши результаты масс-спектрометрии, которые позволяли считать, что в гидролизатах соответствующих белков присутствуют пептиды с такой же аминокислотной заменой: это выражалось как сдвиг массы триптического пептида 33-59 последовательности.

При исследовании образцов скелетных мышц человека, которые представляют другой тип поперечнополосатой мышечной ткани, в них так же, как и в миокарде, были выявлены белковые фракции, принадлежавшие ДКАИ со сходными свойствами, включая относительное содержание (Рис. 4).

Рис. 4. Фрагменты (зона А3,5-А2,4-диеноилкоэнзим А изомеразы) ДЭ белков разных поперечнополосатых мышц: а -скелетная мышца человека, б - коэлектро-форез скелетной мышцы и миокарда, в -миокард человека.

Стрелками обозначены идентифицированные белки: 1 - малатдегидрогеназа, 2, 3 -изоформы медленного скелетномышечного тропонина Т1, 4 - ДЗ,5-Д2,4-диеноил-коэнзим А изомераза

Представленные данные о встречаемости двух аллельных вариантов этого полиморфизма в гомозиготных и гетерозиготном состояниях для изученной выборки из жителей г. Москвы (п = 115) дали следующие частоты аллелей: для № 4472657 - 0,222, а для № 4472675 - 0,778, что близко к ожидаемым частотам из равновесия Харди-Вайнберга и хорошо согласуется с данными, полученными для европейской выборки.

На ДЭ различных биопсийных материалов и культивируемых клеток человека среди других белков была идентифицирована методом МА1Л)1-ТОР МБ с покрытием 70% триозофосфатизомераза 1 (ТФИ). Вместе с тем оказалось, что в клетках ЫЧСаР, рядом с основной фракцией ТФИ присутствует дополнительная фракция (Рис.5), которая также характеризовалась методом МАЬ01-Т0Р МБ как ТФИ. Отмеченная фракция по Мм соответствовала основной (27 кДа), но отличалась меньшим значением р! (-0,3), и была расценена предварительно как элек-трофоретическая изоформа ТФИ (ТФИ-еО.

Рис. 5. Сравнительный протеомный анализ участков расположения ТФИ на ДЭ белков из разных культур клеток: а - линия LNCaP, б - линия РС-3. Основная фракция ТФИ и ТФИ-ei показаны сплошными стрелками, а пунктирной стрелкой - реперная фракция, идентифицированная как пероксиредоксин 1 (ПР-1).

Это предположение подтвердил анализ масс-спектров, полученных после триптического гидролиза ТФИ и ТФИ-ei методом MALDI-TOF MS («пептидные фингерпринты»). При значительном сходстве было выявлено и существенное различие между этими белковыми фракциями: у ТФИ присутствовал пик m/z 3029.5, соответствующий С-концевой последовательности ТФИ (220-248), тогда как в масс-спектре ТФИ-ei данного пика не было, но имелся другой пик с m/z 3087.7. Масс-спектр фрагментации соответствующего триптического пептида из ТФИ-ei позволил выявить в нем участок из С-концевой последовательности ТФИ, в котором присутствовала аминокислотная замена - остаток глицина в 233 позиции был заменен на остаток аспарагиновой кислоты (233G—»D).

Для получения прямого доказательства у линии LNCaP гетерозиготности за счёт полиморфизма, вызванного единичной аминокислотной заменой 233G—»D, было проведено изучение соответствующего участка нуклеотидной последовательности гена TPI1 в препаратах ДНК, выделенных из клеток LNCaP. С помощью подобранных праймеров удалось синтезировать ПЦР-продукт, секвениро-вание которого показало его полное совпадение с соответствующей последовательностью гена TPI1 за исключением того, что в положении 2765 были выявлены два пика, указывающие на равновероятное нахождение в данной позиции G или А (Рис. 6, график 1).

Присутствие в анализируемой ДНК однонуклеотидного полиморфизма (SNP) 2765G/A удалось установить путем клонирования ПЦР-продуктов и сек-венирования участков плазмид, выделенных из отдельных клонов. По результатам секвенирования плазмид из 6 клонов, у четырех образцов в 2765 положении нуклеотидной последовательности гена TPI обнаружено основание G, а в двух -А (Рис. 6 графики 2 и 3).

Г, >аф]ск 1

'р-афя LK 2

га «в м we ив- чае Mi

Г] >м >«в )<« ым itq ;кЬ» lx 3 с с тсмгт g <з о с * сс т>& с

о -.с» с f« с с с с »л féù. е ' тес ' -fd с- Ш а те с * с ■»• с* -с с с » *а ы « те аа

ас »не *»е is« • »! и

Рис. 6. Результаты секвенирования суммарного (график 1) и клонированных (графики 2 и 3) ПЦР-продуктов. Голубым цветом выделены нуклеотидные остатки, находящиеся в позиции 2765.

Эти данные позволили сделать вывод о том, что ген TPI в клеточной линии LNCaP содержит SNP G/A в позиции 2765, и такая нуклеотидная замена приводит к аминокислотной замене 233G—>D в изоформе ТФИ-ei, обнаруженной при протеомном исследовании. В результате проведенной работы выявлен новый аллельный вариант ТФИ человека, который может рассматриваться как белковый биомаркер клеток линии LNCaP.

Учитывая большое количество спорных определений позиций отдельных аминокислот в первичной структуре многих белков человека, так называемых «аминокислотных конфликтов в последовательности» (Sequence conflict), были суммированы полученные экспериментальные протеомные данные. Полученные результаты идентификации белков различных биообъектов человека позволили однозначно подтвердить присутствие одного из вариантов наличия аминокислотных остатков, соответствующий только одному из «конфликтных» вариантов определений аминокислотной последовательности.

При этом в нескольких случаях один и тот же SAAC выявлен при анализе структуры белка, полученного из разных источников, но идентифицированного как один и тот же продукт генной экспрессии. Например, в препаратах, идентифицированных как а-енолаза (ENOl) из скелетных мышц человека, был обнаружен пептид с mz 1143.60 с SAAC 187_E/G, и тот же SAAC 187_E/G отражен по пику масс при идентификации а-енолазы из коры мозга, миобластов, ткани простаты и культивируемых клеток простаты. Сходная ситуация оказалась при анализе белка, идентифицированного как триозофосфатизомераза 1 (TPI1), для SAAC 167 P/N в пептидах с экспериментальными значениями mz 1602.71 и 1602.89. Такое многократное определение одного и того же SAAC, очевидно, позволяет разрешить однозначно «конфликт» в пользу варианта, выявленного протеомными технологиями.

Кроме того, прямое подтверждение результата определения SAAC в некоторых белках было получено с помощью метода MALDI-TOF MS/MS.

В целом, проведенный протеомный анализ, охвативший более 500 белковых фракций из ряда тканей, органов и клеток человека, позволил уточнить первичные структуры 59 белков и по 135 конфликтным определениям и выявить у некоторых из них полиморфные варианты. Соответственно, можно ожидать, что расширение подобных исследований будет способствовать развитию представлений о белковом полиморфизме человека и возможности его использования при решении различных биомедицинских задач.

2. Биохимические проявления дифференциальной генной экспрессии в некоторых мышечных органах человека, а также при клеточной дифферен-цировке и в онтогенезе.

Расширение сведений о полиморфных изоформах мышечных белков человека (особенно специфичных для сердечной мышцы) представляет значительный интерес для решения ряда биомедицинских задач, включая поиск новых потенциальных биомаркеров различных видов патологии.

При сравнительном анализе белковых профилей у образцов сердечной и скелетной (m. vastus lateralis) мышц человека с помощью протеомных технологий удалось отметить ряд известных мажорных белков, проявляющих определенную тканеспецифичность для соответствующих мышечных органов. Выявленные особенности носят как качественный, так и количественный характер. Так, выраженные количественные различия наблюдались для фракций ß-тропомиозина, а-АТФ синтазы. Особенности в наборах легких цепей миозина и тропомиозиновых белков использовались далее при анализе белковых профилей различных мышечных клеток и образцов тканей.

На протяжении ряда лет в литературе обсуждаются возможности биомедицинского использования изоформ карбоангидраз, включая идентифицированную мышечную карбоангидразу 3. В данной работе были проведены целенаправленные сравнительные исследования изоформ карбоангидраз в нескольких мышечных органах, в частности, в миокарде, скелетной мышце и ткани простаты (Рис. 7).

Рис. 7. Фрагменты ДЭ, на которых идентифицированы изоформы карбоангидраз и триозофосфатизомераза. А - миокард, Б - скелетная мышца, В — простата. Стрелками отмечены 1 - триозофосфат изомераза, 2 - карбоангидраза 1,3- карбоангидраза 3. Пунктирными прямоугольниками показаны участки возможной локализации карбоангидразы 3 на ДЭ миокарда и простаты.

Как видно из представленных данных, карбоангидраза 1 присутствовала в трех обследованных мышечных органах. При этом в скелетных мышцах явно доминировала другая изоформа фермента - карбоангидраза 3. Однако карбоангидраза 3 не детектировалась в миокарде, но фракция с подобными электрофо-ретическими характеристиками имелась на ДЭ белков простаты.

Известно, что сердечная мышца человека претерпевает сложные преобразования в ходе индивидуального развития, которые иногда сопровождаются определенными нарушениями и могут приводить к различной патологии, например, к порокам сердца и кардиомиопатиям. При этом для сердца высших млекопитающих (включая человека) в онтогенезе обычно выделяют, как минимум, два принципиально разных этапа: период эмбрионального развития и послеродовые возрастные изменения. В следующем цикле исследований из собранных коллекций двумерных электрофореграмм (ДЭ), полученных из образцов миокарда эмбрионов, начиная с 6-7 недель развития до рождения, выделили 13 мажорных белковых фракций, для которых ранее были показаны изменения в пренатальном периоде развития, и провели их масс-спектрометрическую идентификацию (Табл. 2).

Таблица 2. Результаты масс-спектрометрической идентификации 13 мажорных белковых фракций миокарда человека, для которых были показаны изменения в пренаталь-ном периоде развития.

№ Наименование белка, некоторые синонимы (символ гена) № по Рпйет ж:в1 Идентификация* % перекрытия Мм/р1 (эксп.) Мм/р1 (расчет.)

1 Белок теплового шока 60, шаперонин 60, (Н8РБ1) 77702086 239/24 46 58,0/5,25 58,0/5,24

2 Десмин (БЕБ) 55749932 468/39 62 54,0/5,20 53,4/5,21

3 АТФ-синтаза Р-изоформа митохондр. (АТР5В) 32189394 338/37 66 51,0/5,00 51,8/5,00

4 Тропомиозин 1 а- вариант 6(ТРМ1) 89954539 199/6 16 28,0/4,70 28,5/4,74

5 Тропомиозин 1 а- изофор-ма 4 (ТРМ1) 63252900 59/7 21 33,0/4,70 32,9/4,72

6 Трансферрин (17) 115394517 131/20 24 76,0/6,60 75,2/6,70

7 Аконитаза 2 (АС02) 49168620 206/23 39 84,0/6,90 82,4/6,85

8 а-субьединица АТФ син-тазы (АТР5А1) 4757810 203/19 43 55,0/7,70 55,2/8,28

9 Миозин, легкая цепь 2 (М\Ъ2) 21411329 205/19 94 19,0/4,90 18,8/4,92

10 Белок теплового шока 27, НБрВ1 (ШРВ1) 662841 163/13 76 23,0/6,00 22, 8/5,98

11 Белок теплового шока 27, электрофоретическая изо-форма 1 (Н8РВ1) 662841 207/14 78 23,0/5,70 22, 8/5,98

12 Белок теплового шока 27, электрофоретическая изо-форма 2 (Н8РВ1) 662841 166/6 24 23,3/5,50 22, 8/5,98

13 Белок теплового шока 27, электрофоретическая изо-форма 3 (Н8РВ1) 662841 139/8 37 22,5/5,50 22, 8/5,98

* Вероятностный коэффициент достоверности/количество совпадающих масс пептидов

Онтогенетические изменения этих белков были оценены сравнительным количественным анализом с использованием компьютерной денситометрии и построены соответствующие ЗО-модели. (Рис. 8). Как видно из рисунка, фракция № 1, идентифицированная как белок теплового шока 60, характеризовалась значительным содержанием в интервале 7-16 недель развития, а затем содержание этого белка к 21 неделе развития выходило на уровень, близкий к наблюдаемому в миокарде взрослых лиц. Фракция № 2, принадлежащая по результатам идентификации десмину, практически не регистрировалась на ДЭ в образцах миокарда на 8 нед. развития, однако содержание этого белка постепенно увеличива-

лось к 15 неделе, а к 30-32 нед. пренатального периода развития достигало уровня, имевшегося в образцах миокарда взрослых лиц.

Нескоординированная экспрессия отмечалась также для нескольких изо-форм белков, относящихся к семейству легких цепей миозина. С 5-6 недели развития детектировались только фракции эмбриональной желудочковой/ пред-сердной ЛЦМ1 (ген МГЙ_4) и желудочковой ЛЦМ1 (ген МУЬЗ), тогда как продукт гена МУЬ2 (ЛЦМ2, №9) на 5-6 неделях присутствовал в следовых количествах с повышением только к 8 неделе развития (Рис. 9).

Рис. 8. Фрагменты ДЭ белков миокарда (I) и соответствующие ЗО-изображения (II) белковых фракций №1 (красные стрелки) и №2 (синие стрелки), которые изменялись в пренатальном онтогенезе и были идентифицированы как шаперонин 60 и десмин.

Как видно из Табл. 2, в списке идентифицированных белков присутствуют две субъединицы митохондриальной АТФ-синтазы (№ 3 и 8). Проведенный анализ выявил нескоординированную продукцию двух этих белков в пренатальном периоде, подобно той, что наблюдалось для различных ЛЦМ (Рис. 9).

Так, (3-изоформа АТФ-синтазы (№ 3) на ранних этапах была представлена ярко выраженной мажорной фракцией, которая к 24 нед. развития уменьшалась (по сравнению с близлежащими реперными белками) до уровня, характерного для зрелого миокарда. Другая идентифицированная субъединица (а, № 8) митохондриальной АТФ-синтазы уверенно детектировать только на сроке 19-21 нед., затем наблюдалось значительное увеличение этой фракции с выходом к зрелому уровню на 24-26 нед. Таким образом, можно предположить, что в миокарде человека функционально активный комплекс митохондриальной АТФ-синтазы формируется постепенно к 24 нед. развития.

Рис. 9. Результаты протеомного анализа количественных изменений в пренатальном онтогенезе белков миокарда, представляющих семейство легких цепей миозина. Красная стрелка - желудочковая ЛЦМ1 (ген МУЬЗ), синяя стрелка - регуляторная ЛЦМ2 (ген МУЬ2), зелёная стрелка - эмбриональная желудочковая/предсердная ЛЦМ1 (ген М\1_4). Вверху - фрагменты ДЕ, внизу - ЗБ модели.

Полученные данные идентификации позволили сформировать таблицу потенциальных белковых биомаркеров некоторых этапов в пренатальном онтогенезе миокарда человека (Табл. 3).

Таблица 3. Результаты протеомного изучения некоторых идентифицированных белков миокарда человека в пренатальном онтогенезе (молекулярные маркеры стадий эмбриогенеза миокарда человека).

Название белка Маркируемый Срок выхода содержания

(символ гена) этап гестации белка на уровень в зрелом

миокарде

ЛЦМ 2 (MYL2) До 8 нед 8 нед и далее—»

Белок теплового шока 60 кДа (HSPD1 ) 7-16 нед 21 нед —>

АТФ-синтаза (3-субъединица (АТР5В) 7-20 нед 21 нед —>

Альфа тропомиозин 1 вариант 6 (ТРМ/) До 18 нед 19 нед —>

Альфа тропомиозин 1 (ТРMl) До 18 нед 19 нед —>

Белок теплового шока 27 кДа (HSPB1 ) До 19 нед 21 нед —>

Трансферрин (TRFE) До 20 нед 21 нед —>

АТФ синтаза а-субьединица (АТР5А1) До 21 нед 21 нед —>

Десмин (DES) 8-30 нед 30 нед —*

ЛЦМ эмбриональная желудочко- До 40 нед 1-3 года

вая/предсердная (MYL4)

Постнатальное исследование белков левого желудочка сердца человека проводилось на 90 образцах миокарда, полученных от лиц, погибших в результате несчастного случая, без явных признаков сердечной патологии, учитывая их распределение по полу и возрасту. Все образцы были сформированы в 5 групп: 10-20 лет, 21-30 лет, 31-40, 41-50 лет, старше 51. В анализируемой выборке в

спектре белков миокарда наблюдались качественные различия, коррелировавшие с возрастом, по пяти белковым фракциям, располагавшимися на ДЭ в виде двух различных групп, которые по результатам масс-спектрометрической идентификации оказались продуктами гена а-актина (ген АСТС1) и альбумина (ген АСВи) соответственно (Рис. 10). Как видно из представленных данных, две фракции, составившие группу I, характеризовались одинаковой р! (5.60), но разной Мм (33.2 и 37.3 кДа). Они выявлялись даже у некоторых представителей из возрастной категории 21-30 лет (почти 25% случаев) с постепенным увеличением пропорции с возрастом. Проведенная идентификация показала, что указанные фракции представляют собой продукты гена АСТС1, но отличаются меньшими Мм от полноразмерного а - актина (41.7 кДа.).

При этом во фракции с Мм 37 кДа были выявлены только те пептиды, которые соответствовали области от 53 а.о. до 374 а.о. из полной последовательности а-актина, содержащей 377 а.о, а. во фракции с Мм 33 кДа - от 87 а.о. до 374 а.о. Таким образом, можно считать, что эти возраст — зависимые белковые фракции являются укороченными производными а - актина, лишившимися Ы-концевых участков, имеющиеся в полной последовательности а-актина.

Возраст-зависимая группа II была представлена белковыми продуктами гена АЦВи. Анализ результатов масс-спектрометрической идентификации показал, что в каждой из белковых фракций группы II обнаруживаются пики масс пептидов, перекрывающих только часть аминокислотной последовательности альбумина, начинающуюся с 237 а.о. (для фракций с Мм 44,2 кДа и 44,1 кДа) или с 250 а.о. (для фракции с Мм 43,2 кДа) и практически до С-конца молекулы.

. _

^ т ^ 3 4

"» тт машв Г и* _

Е в» -

*

Ш> ^ -

Рис. 10. Фрагменты ДЭ с расположенными на них белковыми фракциями группы I (продукты гена АСТС1), которые изменялись с возрастом. А - 10-20 лет, Б - 21-30 лет, В - 31-40, Г-41-50 лет, Д - 51 и более. Е,Ж,3 -случаи ХИБС в возрасте до 35 лет.

Стрелками без номеров показаны возраст-зависимые фракции. Стрелками с номерами обозначены реперные фракции: 1 -сердечная изоформа тропонина Т, 2-полноразмерный а-актин, 3 - а-тропомиозин, 4 - легкая цепь миозина 1.

Различия в значениях р1 у белковых фракций группы II дают основание думать, что они могут быть и следствием посттрансляционных модификаций (Рис

Рис. 11. Фрагменты двумерных электрофореграмм зоны белков, коррелирующих с возрастом (продуктов гена ALBU). А - 10-20 лет, Б - 21-30 лет, В -31-40, Г - 41-50 лет, Д - 51 и более. Стрелками без номеров обозначены возраст-зависимые фракции производные альбумина,, стрелкой с номером 1 — референсная фракция (полноразмерный а-актин)

В целом, результаты выполненных протеомных исследований белков миокарда человека в постнатальном онтогенезе суммированы в Табл. 4. Таблица 4. Распределение образцов по возрасту и найденным возраст-зависимым белкам.

Возрастные Количество Число лиц, имевших Число лиц, имевших

группы лиц в группе фрагменты а-актина фрагменты альбумина

10-20 лет 8 0 0

21 -30 лет 15 4 0

31 -40 лет 35 21 3

41 - 50 лет 18 14 7

более 51 года 14 14 12

Всего 90 63 22

Следует отметить также, что в контрольной группе все 5 указанных возраст-зависимых белковых фракций вместе не были обнаружены ни у кого из лиц с возрастом менее 35 лет, тогда как в группе из 10 больных с ХИБС при возрасте менее 35 лет 8 имели полный набор этих белков (Табл. 5).

Таблица 5. Распределение по найденным возраст-зависимым белкам в контроле и при ХИБС в возрастной группе до 35 лет.

Группы Контроль / ХИБС до 35 лет Количество лиц в группах Число лиц, имевших фрагменты а-актина Число лиц, имевших фрагменты альбумина

40/10 14/10 3/8

Таким образом, полученные данные позволяют думать, что указанные возраст-зависимые белки могут быть каким-то образом вовлечены в патогенез хронической ишемии миокарда.

3. Разработка общих принципов построения многомодульных протеомных баз данных и создание базы данных «Протеомика мышечных органов».

Выполнявшиеся на протяжении ряда лет протеомные исследования белков различных мышечных органов в норме и при патологии привели к накоплению значительного информационного массива из соответствующих экспериментальных данных. Для оптимизации работы с собранными информационными материалами предпринималось несколько попыток к созданию обобщающей отечественной базы данных [Шишкин С.С. с соавт. 2004; Ковалева М.А. с соавт. 2008, 2009 и др.]. При этом удалось сформулировать ряд принципов и подходов, которые были использованы в настоящей работе для создания отечественной базы данных «Протеомика мышечных органов» (БД «ПМО») и версии 2012 года специализированной базы данных «Протеомика рака простаты» (БД «ПРП») (пп.4). Эти принципы включают в себя:

♦ Принцип многомодульности - создание отдельных информационных модулей для каждого вида изучавшихся объектов.

♦ Принцип многоуровневое™ - возможность под визуальным контролем помечать различные белки на картах, создавая специальные ссылки («кнопки») для перехода на следующие информационные уровни - второй, третий и четвертый, предназначающиеся для различных сведений об отдельных изучавшихся белках.

♦ Принцип комплексности - возможность перехода от одного модуля к другому.

♦ Принцип повышения эффективности фракционирования БПГЭ - возможность создания дополнительных модулей или наложений синтетических изображений различных модификаций фракционирования белков.

♦ Принцип возможности постоянной детализации информации - возможность создания новых полей для записей информации.

♦ Принцип оптимизации - возможность совершенствования дизайна информационной базы.

БД «ПМО» выполнена в виде интерактивного web-pecypca на основе СУБД MySQL, который позволяет исследователям в режиме on-line просматривать, вводить и редактировать данные о белках, имеющихся в тканях и мышечных органах в норме и при патологических состояниях. БД «ПМО» расположена по адресу http://mp.inbi.ras.ru и существует в двух версиях - на русском и английском языках.

Программная оболочка БД обладает широкими функциональными возможностями: создание последующих и корректировку существующих модулей, соз-

дание новых и редактирование имеющихся карточек белков; редактирование информационных полей в карточке белка и доступ к карточке белка под визуальным контролем (с помощью «мыши»); включение гиперссылок в карточку белка; возможности поиска белков по выбранным модулям и др.

БД «ПМО» состоит из пяти основных и двух дополнительных взаимосвязанных модулей. Основные модули содержат протеомную информацию о мышечных органах человека, а дополнительные несут информацию о культивируемых мышечных клетках. Каждый из модулей наряду с протеомной информацией содержит и определенные биомедицинские данные о белках соответствующего биообъекта. Основой модулей являются синтетические двумерные карты, представляющие собой обобщенные результаты фракционирования двумерным электрофорезом белков соответствующих объектов. На каждой карте показаны белки, идентифицированные с помощью масс-спектрометрии и других методов (первый информационный уровень), обеспечивается доступ к карточке белка под визуальным контролем. В карточке белка представлены данные, полученные при изучении свойств каждого из идентифицированных белков (второй уровень), собраны различные литературные сведения об этом белке (третий уровень) и представлены гиперссылки, связывающие описание белка в БД с соответствующими записями в публичных базах данных >ГСВ1 и ишРго! (четвертый уровень). Общие сведения о модулях в БД «ПМО» приведены в Табл. 6, два из этих модулей являются комплексными, общее количество идентифицрованных фракций превысило 500.

Таблица 6. Модули в БД «ПМО» и количество идентифицированные в них белковых фракций.

Основные и дополнительные модули (синтетические карты белков для исследуемых объектов) Идентифицированные белковые фракции

Основные Белки миокарда (комбинированный модуль) 80

Белки скелетной мышцы (m. vastus lateralis) 89

Белки миометрия 35

Белки средней оболочки аорты 29

Белки биоптатов предстательной железы (гиперплазия, рак) 187

Дополнительные Белки недифференцированных и дифференцированных миобластов человека (комбинированный модуль) человека 60

Белки клеток рабдомиосаркомы (линия А-204) 30

Принципиальное значение сердечной мышцы для жизнеобеспечения и широкая распространённость патологических процессов, захватывающих миокард, во многом предопределили особую заинтересованность в использовании БД «ПМО» для комплексного изучения белков миокарда человека. С этой целью сначала с использованием описанных ранее результатов и компьютерных технологий при формировании модуля «Белки миокарда» в качестве основы были выбраны ДЭ белковых экстрактов из аутоптатов миокарда человека, получены их компьютерные изображения и построена соответствующая синтетическая двумерная карта. На этой карте среди идентифицированных фракций оказались изоформы миозиновых легких цепей, актин, изоформы тропомиозинов, тропо-нинов, десмин, мышечная креатинфосфокиназа и некоторые другие известные мышечные белки, в частности, некоторые ферменты метаболизма углеводов (изоформы аконитазы, енолазы, триозофосфатизомераза 1 и др.)

Далее существенной составляющей при формировании данного модуля стали также результаты протеомных исследований белков миокарда человека в пренатальном онтогенезе, которые были представлены в пп. 2. Как и ранее, полученные цифровые изображения для построения комплексной (обобщенной) двумерной карты редактировали в графическом редакторе из пакета программ ImageMaster 2D Platinum (версия 7), а также с помощью метода компьютерного «наложения изображений», применяя опцию «Слой» графического редактора Adobe Photoshop. При этом в качестве реперных точек были использованы специально выбранные белковые фракции с одинаковыми электрофоретическими свойствами, часть из которых являлась и по результатам масс-спектрометрической идентификации одними и теми же белками. В частности, для указанных целей применяли следующие фракции: аконитазы, шаперонина 60, десмина, актина, тропомиозинов, легких цепей миозина и др. Построенную таким образом комбинированную синтетическую двумерную карту белков применили в качестве основы при создании первого информационного уровня в комплексном модуле «Белки миокарда» (Рис. 12).

Кроме комплексного модуля «Белки миокарда», в процессе работы аналогичным способом был сформирован дополнительный комплексный модуль «Белки недифференцированных и дифференцированных миобластов человека». При этом использовались ранее полученные совместно с A.A. Макаровым результаты протеомного изучения белков из недифференцированных и дифференцированных in vitro миобластов человека [Макаров A.A. с соавт. 2009].

Рис. 12. Первый уровень в комплексном модуле «Белки миокарда» человека; черным цветом показаны белковые фракции, полученные при анализе белковых экстрактов взрослых; другими цветами - белковые фракции четырех участков ДЭ эмбриональных образцов (8,5 недель) со специфическими особенностями: на участке легких цепей миозина -фиолетовым цветом; на участке тропомиозиновых белков - красным; на участке шаперо-нина-десмина - синим; на участке HSP 27 - оранжевым; на учатке трансферрина - же-лым.

Соответствующие данные удалось обобщить и детализировать (включая масс-спектрометрическую идентификацию различных белковых фракций). Так, в качестве основы при формировании первого уровня для указанного модуля были выбраны ДЭ белковых экстрактов из недифференцированных миобластов человека. Компьютерные изображения этих ДЭ использовались для построения начальной синтетической двумерной карты. Затем полученные цифровые изображения для построения комплексной (обобщенной) двумерной карты совмещали, как описано выше, с цифровыми изображениями ДЭ белков из дифференцированных in vitro миобластов.

В качестве реперных точек использовались общие белковые фракции, идентифицированные как изоформы белков теплового шока (HSPA9), митохондри-альной а АТФ-синтазы; актина, тропомиозинов, трансгелина, белка S100A10 и др. Кроме того, на обобщенную синтетическую карту были нанесены фракции гистоновых белков (дополнительной реперной точкой служила фракция, идентифицированная как пептидилпролилизомераза В; PPIB). На итоговой ком-

плексной карте белки, полученные из недифференцированных миобластов, окрашены в различные оттенки серого цвета, а белки, полученные из клеток дифференцированных миобластов, обозначены красным цветом (Рис. 13).

ч" ГСО!-1А2

15РА5

"■"»ЕЙР!1?«

**ств

'1д101

ямхАг-» лмк*1у1>АС| .н,

Рис. 13. Первый уровень в комплексном модуле «Белки недифференцированных и дифференцированных миобластов человека». Формирование комплексного модуля «Белки миобластов». Красным цветом показаны фракции препарата «Ядерные белки миобластов».

В ходе работы по формированию данного модуля удалось выявить существенные различия по 12-й белковым фракциям. Среди изменявшихся белков оказались два белка БЮОАП и изоформа 1 (3-тропомиозина, которые привлекли особое внимание. Для подтверждения изменений в ходе клеточной дифференци-ровки указанных белковых фракций дополнительно с использованием компьютерной денситометрии был проведен их сравнительный количественный анализ. Полученные результаты представлены на Рис. 14.

Из приведенных данных видно, что содержание белка 8100А11 (по сравнению с соседними реперными белками) сразу после индукции дифференцировки кратковременно увеличивалось, а затем к четвертому дню дифференцировки эта фракция практически переставала детектироваться. В отличие от белка 8100А11 изоформа 1 (3-тропомиозина только появилась на шестой день дифференцировки. Как следствие, указанные белки можно рассматривать в качестве участников и потенциальных биомаркеров миогенной дифференцировки.

Рис. 14. Фрагменты ДЭ (I) и соответствующие ЗБ-изображения (II) белков, экстрагированных из пролифе-рирующих и дифференцирующихся миобластов человека на разных сроках до и после индукции дифферен-цировки. А - зоны белка БЮОА! 1; Б -зоны тропомиозинов. Вверху указан срок инкубации клеток в дифферен-цировочной среде (день -2 - за два дня до начала индукции дифферен-цировки).

День +б

День О

Другие модули строились без комбинирования синтетических изображений. В частности, при формировании модуля «Белки скелетной мышцы (m. vastus lateralis)» данные протеомного анализа образцов этой мышцы (полученные ранее совместно с Ивановым A.B. и другими соавторами [Ковалева М.А. с соавт. 2009]) дополнялись и уточнялись.

Параллельно модуль «Белки скелетной мышцы (m. vastus lateralis)» был использован для анализа протеомных изменений в скелетных мышцах при некоторых заболеваниях, проявляющихся тяжелым поражением мышечной ткани. Так, при протеомном анализе белковых экстрактов из биоптатов скелетных мышц от больных боковым амиотрофическим склерозом (БАС) удалось обнаружить определенные количественные и качественные изменения. В частности, у больных генерализованной формой БАС практически полностью отсутствовали или характеризовались резким снижением содержания четыре близко расположенных на ДЭ белковых фракции (Рис. 15). Три из них обладали одинаковыми Мм (35 кДа) и различались по величинам pi (5.96, 6.01 и 6.04), а четвертая - характеризовалась отношением Мм/р! 32 кДа / 6.34.

Рис. 15. Фрагменты ДЭ белков из биоптатов скелетной мышцы, где были локализованы зоны, изменяющиеся при БАС белковые фракции. А - норма (пациент без БАС), Б - больной БАС в начальной стадии заболевания, В - стадия генерализации БАС. Стрелками отмечены исчезающие белки

Результаты масс-спектрометрической идентификации показали, что все отмеченные фракции являются продуктами гена ТМЧП, который детерминирует образование медленных изоформ скелетномышечного тропонина Т1. Среди 100 наиболее представленных мышечных белков на долю четырёх исчезающих фракций из общего содержания белка, зарегистрированного на ДЭ, приходится 0,1%, 0,2%, 0,3% соответственно. При этом у пациентов, находящихся в начальной стадии БАС, отмечалось динамическое снижение представленности указанных фракций до следовых количеств, тогда как у пациентов с генерализованной формой БАС зарегистрировать соответствующие белки не удавалось.

Таким образом, зависимое от стадии развития болезни постепенное снижение содержания в мышцах больных БАС четырех электрофоретических вариантов медленной изоформы скелетномышечного тропонина Т1 указывает на возможную их вовлечённость в патогенез БАС.

Результаты параллельно проводившегося протеомного анализа трех мышечных органов, содержащих гладкомышечные волокна (миометрий, средняя оболочка аорты и простата), нашли применение при формировании соответствующих модулей в БД «ПМО». При этом изучение белковых профилей этих органов позволило выявить необычайную множественность электрофоретических изоформ трансгелина 1, общее количество которых после масс-спектромерической идентификации достигло 22. В образцах миометрия человека удалось зарегистрировать 11 электрофоретических изоформ трансгелина 1, в медиальном слое аорты - 14, а в биоптатах простаты - 15. Полученные результаты обобщены на Рис. 16 и в Табл. 7.

Известно, что в геноме человека имеется как минимум три гена, кодирующих трансгелиновые белки. Основной трансгелин человека (или трансгелин 1), названный сначала 8М22-а1р11а, присутствует в гладкомышечных клетках различных органов и тканей, кроме того, этот белок выявлялся и в культивируемых

— _ «

Б

фибробластах. Этот трансгелин кодируется геном ТАСгЬН, экспрессия которого происходит с альтернативным сплайсингом, приводящим к образованию двух транскриптов, различающихся по размерам, но обеспечивающих синтез одного и того же белка из 200 а.о. Был найден ещё один родственный транскрипт, кодирующий последовательность из 184 а.о. (трансгелин-вариант) [по ишРпЛ]. С учетом этих литературных данных среди обнаруженных электрофоретических изоформ фракция № 2 (Рис. 16), идентифицированная как трансгелин из 200 а.о. и наибольшая по количественной представленности, в БД «ПМО» была обозначена как Т§п1, а четыре родственные ей фракции — как её изоэлектрические изо-формы (е1 - егЗ).

Ш

1ЖГ

Рис.16. М ножественность электрофоретических изоформ трансгелина 1 в трех органах человека, содержащих гладко-мышечные волокна. А - фрагменты ДЭ, на которых локализованы электрофо-ретические изо-формы трансгелина 1: а -миометрий, б - медиальный слой аорты, с - простата. Б -результаты сравнительного компьютерного анализа (методом «наложения») соответствующих фрагментов ДЭ с изоформами трансгелина :

а - миометрий, б - медиальный слой аорты, в - простата.

Таблица 7. Электрофоретические изоформы трансгелина 1, идентифицированные в трех органах человека, содержащих гладкомышечные волокна.

№ Наименование белка и его обозначение в БД ПМО»* р1/Мш экспер. Простата Миометрий Аорта (Шшса тесНа)

1 Трансгелин, Трп1-е1 (Т200) 22,5/8.40 + + +

2 «—»Tgn 1 22.5/7,80 + + +

3 «—»Т£п 1 -е11 22,5/7,45 + + +

4 «—»Tgnl-ei2 22.5/6.95 + + +

5 «—»Tgn 1 -е!3 22,5/6,75 + - +

6 Трансгелин вариант (Т184) aTgn-vl 21,0/6,95 - - +

7 «--» ТЙП-У1 20,0/7,25 + + +

8 «—» ашТ^-у1 18,3/7,50 - + +

9 «—» атТрп-\'2 18,3/7,40 - + +

10 «--» атТрп-уЗ 18,3/6,75 - + +

11 «—» атТрп-у4 18,3/6,70 - + +

12 «--» арТ£П1-у1 18,3/6,50 + - +

13 «--» тТ£П1-у1 18,1/6,46 - + -

14 «--» Т;*п-У2 18,0/6,55 + + +

15 «--» аТрп-у2 17,8/6,55 - - +

16 «—» рТ^-у1 21,0/6,42 + - -

17 «--» рТ^т-\'2 20,5/7,15 + - -

18 «--» рТап-уЗ 20,2/6,85 + - -

19 «—» рТ£п-у4 18,7/6,88 + - -

20 «--» pTgn-v5 20,0/6,42 + - -

21 «--» рТ|*п-у6 18,06,30 + - -

22 «—» pTgn-v7 17,8/6,88 + - -

* аТ§п-у - трансгелин-варианты, специфичные для аорты, атТ^-у - трансгелин-варианты, обнаруженные в аорте и миометрии; арТ§п-у трансгелин-варианты, обнаруженные в аорте и простате; пт^п-у трансгелин-вариант, специфичный для миометрия; рТ^-у - трансгелин-варианты, специфичные для простаты.

Т§п1 и практически все родственные ему фракции присутствовали в каждом из изучавшихся трех мышечных органов, содержащих гладкомышечные волокна, но в разных количественных соотношениях (Рис. 16, Табл. 7). В отличие от этого среди остальных электрофоретических изоформ трансгелина (которые были идентифицированы как трансгелин-варианты, Т184) только фракции № 7 (Tgn-vl) и 14 (Т§п-у2) удалось выявить в каждом из изучавшихся органов. Остальные проявляли различную тканеспецифичность.

Таким образом, сравнительный анализ результатов протеомного анализа трех мышечных органов, содержащих гладкомышечные волокна (миометрий, средняя оболочка аорты и простата), обобщенных в соответствующих модулях БД «ПМО», позволил установить, что в этих органах имеется множественность изоформ трансгелина, и указанные изоформы могут рассматриваться как потенциальные тканеспецифичные биомаркеры.

4. Специализированная база данных «Протеомика рака простаты» (версия 2012 г.).

Параллельно с информационным наполнением БД «ПМО» проводились циклы исследований, направленные создание и развитие специализированной БД «Протеомика рака простаты» (БД «ПРП»), предназначавшейся для оптимизации поисков потенциальных белковых биомаркеров указанного заболевания, размещенной по адресу http://ef.inbi.ras.ru.

Основой БД «ПРП» стал модуль «Белки биоптатов предстательной железы (гиперплазия, рак)», который в первых версиях (2009-2010 гг.) дополняли модули, содержащие информацию о белках нескольких культивируемых клеточных линий человека, включая Ь>ГСаР и РС-3 (моделирующие рак простаты), а также ВРН-1 (моделирующая доброкачественную гиперплазию) [Шишкин С.С. с соавт. 2010].

В период 2011-2012 гг. БД «ПРП» была расширена за счет увеличения числа идентифицированных белковых фракций в разных модулях и включения двух дополнительных модулей - комплексного модуля «Белки клеток ои-145» (моделирующих рак простаты) и обычного модуля «Белки клеток ОКР-вЗ» (моделирующих рак почки).

Сначала при получении белкового профиля клеток линии Ои-145 были опробованы три варианта протеомного фракционирования экстрактов суммарных белков и собрана коллекция ДЭ суммарных белковых экстрактов с различным содержанием белка, которая использовалась при построении синтетического изображения. С помощью масс-спектрометрии на ДЭ суммарных белковых экстрактов клеток линии 011-145 были идентифицированы 52 белковые фракции. Расположение этих фракций на ДЭ показано на Рис 17.

Параллельно, используя набор реагентов фирмы «Qiagen» по протоколу фирмы-производителя, получали препараты фосфопротеинов из клеток Би-145 и анализировали эти белки протеомными технологиями. Проведенная компьютерная денситометрия изображений таких ДЭ позволила выявить более 150 белковых фракций (Рис. 18). Подавляющее большинство этих белков обладали Мм в диапазоне от 12 до 100 кДа и широко различались по изоэлектрическим точкам, располагаясь практически по всей ширине ДЭ. Девять фосфопротеинов из клеток 011-145 (в частности, изоформу гетерогенного ядерного рибонуклеопро-теина С1/С2, кальретикулин, ядерный белок В1 группы высокой подвижности и др.) удалось идентифицировать с помощью масс-спектрометрии, они показаны фиолетовыми стрелками на Рис. 18.

Кроме того, в соответствии с общей стратегией протеомных исследований далее были проведены работы по системному исследованию ядерных белков, включающих средне- и низкокопийные белки. Для указанных целей использовалась разработанная ранее схема предварительного фракционирования клеточных гомогенатов, полученных в условиях мягкого разрушения клеток с помощью процедуры «замораживание - оттаивание» в присутствии неионного детергента Тритона Х-100.

♦ —

49

50"1

Г

4Э> 34-»

38

I

Рис. 17. Типичная ДЭ суммарного экстракта белков из клеток линии Ои-145. Окраска азотнокислым серебром. Синими стрелками и номерами обозначены фракции белков, идентифицированных с помощью масс-спектрометрии.

Рис. 18. Результаты протеомного анализа (1ЕР-20Е) фосфопротеинов, сорбированных на колонке фирмы «Qiagen», Окраска азотнокислым серебром. Фиолетовыми стрелками и цифрами обозначены фракции, для которых проводилась масс-спектрометрическая идентификация. Справа на ДЭ показаны белки - маркеры Мм.

Эта схема, включающая дифференциальное центрифугирование, позволила получить для дальнейшего протеомного исследования три препарата ядерных белков - «суммарные белки ядер», «пистоны» и «белки ядерного матрикса». Результаты протеомного анализа препаратов «Суммарные белки ядер» показаны на Рис. 19.

* 9

Рис. 19. ДЭ препарата «Суммарные ядерные белки» DU-145., окраска азотнокислым серебром. Стрелками и цифрами обозначены белковые фракции, идентифицированные масс-спектрометрическими методами. Пунктирными прямоугольниками выделены изо-формы некоторых представителей семейства гетерогенных ядерных рибонуклеопротеи-нов (hnRNP).

Суммированием описанных выше результатов протеомного изучения цельного белкового экстракта из раковых клеток линии DU-145, а также препаратов фосфопротеинов и ядерных белков, было осуществлено построение обобщенного протеомного профиля (синтетического изображения) с помощью пакета программ ImageMaster 2D Platinum 7.0. Существенным условием для обеспечения этого построения стало то, что на ДЭ различных белковых препаратов оказались белковые фракции с одинаковыми электрофоретическими свойствами, часть из которых являлась и по результатам масс-спектрометрической идентификации одними и теми же белками. Такие фракции (в частности, изоформы представителей семейства hnRNP) были использованы в качестве реперных точек для обеспечения совмещения анализируемых изображений. (Рис. 20).

Построенная карта была загружена в БД «ПРП» и стала основой для формирования принципиально нового модуля «Белки клеток DU-145».

■SHMT2 ^ _ " ТЙГМЗО ,

^Я* АЙХАВп»

щ » — ^^ «ммц^с»;

М|ЧЕ2 ЛОВ2 г МОиРАб

РР1А - г > нз

н»

5 МНП21.1 нл

г

Рис. 20. Итоговая обобщенная синтетическая двумерная карта белков культивируемых клеток линии 011-145, черным цветом показаны белковые фракции, полученные при анализе суммарных белковых экстрактов, зеленым - фосфопротеинов, жёлто-коричневым -«Суммарные ядерные белки», красной окантовкой - «Гистоны»

В целом, в новой версии БД «ПРП» (2012г.) общее число идентифицированных фракций составило 570 по сравнению с 359 в первых версиях (2009-2010 гг.). Общая информация о БД «ПРП» представлена в Табл. 8.

Таблица 8. Модули в обновленной БД «ПРП» (версия 2012 г.) и идентифицированные в них белки (для сравнения включены соответствующие данные о более ранних версиях).

Модули — синтетические карты белков в исследуемых объектах (метод фракционирования) Идентифицированные белковые фракции

Версия 2010 Версия 2012

Белки биоптатов предстательной железы (рак и гиперплазия) 165 187

Белки клеток LNCaP (IEF-PAGE) 60 76

Белки клеток LNCaP (IPG-PAGE) 18 18

Белки клеток РС-3 (IEF-PAGE) 25 49

Белки клеток DU-145 (комплексный модуль, включающий фософопротеины, ядерные белки, белки фракции гистонов и остаточные белки ядерного матрикса) 78

Белки клеток ВРН-1 (IEF-PAGE) 24 51

Белки клеток рабдомиосаркомы (IEF-PAGE) 29 31

Белки нормальных миобластов человека (IEF-PAGE) 38 48

Белки клеток OKP-GS - 32

Кроме того, версия 2012 г. БД «ПРП» представлена на двух языках (на русском и на английском).

С помощью БД «ПРП» было определено несколько потенциальных биомаркеров этого заболевания [Шишкин С.С. с соавт. 2010]. Дальнейшая детализация показала, что один из таких белков - ЛСК-2 представляет особый интерес. Проведенные исследования в биоптатах рака простаты и доброкачественной гиперплазии, а также клеточных линий, показали, что АСК-2 содержится в раковых клетках простаты, а в образцах «гиперплазия» практически не детектируется (Рис. 21). Выявленные биомаркерные свойства АСЫ-2 при раке простаты в сочетании с имеющимися сведениями о появлении АОЯ-2 в биологических жидкостях позволяют рассматривать этот белок как перспективный кандидат для разработок соответствующих диагностических тест-систем и начала клинических исследований по их валидации.

Биоптат (гиперплазия

РС-3 ВРН-1

(гиперплазия^

ш

1 \ '

м Ш1

Белок Биоптат Биоптат ЦЧСаР РС-3 ВРН-1

(биомаркер) (гиперплазия) (рак) (рак) (рак) (гиперплазия)

Сус1орЫНп 511,4 281,3 519,4 262,2 327,3

ДвЯ-2 Не выявлен 202,6 266,7 409,4 Не выявлен

Рис. 21. Обобщенные данные сравнительной компьютерной денситометрии биомаркера АСК-2 в разных биообразцах «рак» и «гиперплазия» простаты. Красными стрелками показаны фракции АОЯ-2, голубыми - реперного белка циклофилина В. В таблице даны результаты количественного определения соответствующих белковых фракций.

В рамках данной работы была также выполнена идентификация фракции № 4716560, которая оказалась белковой дисульфидизомеразой изоформой АЗ. Сделанные к настоящему времени количественные оценки содержания белковой дисульфидизомеразы АЗ (по отношению к реперному белку десмину) по анализу построенных ЗБ моделей в образцах раковой ткани (1,64 ± 0,72) достоверно превышали аналогичные оценки в образцах «гиперплазия» (0,47 ± 0,12, р<0,05) (Рис. 22).

Рис. 22. Фрагменты ДЭ разных биообразцов «гиперплазия» (слева) и «рак» (справа) простаты, на которых локализована белковая дисульфидизоме-раза АЗ, а также обобщенные данные сравнительной компьютерной денситометрии (2Б и ЗБ модели) этого биомаркера. Красными стрелками показаны фракции белковой ди-сульфидизомеразы АЗ, голубыми - реперного белка изо-формы десмина.

Таким образом, созданный в результате проведенных протеомных исследований специальный отечественный информационный ресурс «Протеомика рака простаты» позволил оптимизировать работу по изучению белковых профилей в тканях простаты при ДГП и РП, а также в нескольких клеточных линиях человека.

5. Протеомные технологии для выявления «гипотетических» (hypothetical), «безымянных» (unnamed) и других малоизученных белков.

С началом постгеномной эры так называемые «безымянные» (unnamed) и «гипотетические» (hypothetical) белки фактически стали особыми категориями в общей белковой номенклатуре. Построение БД «ПМО» и особенно «ПРП» стали предпосылками для целенаправленного поиска белков, которые можно было бы отнести к указанным категориям.

Так, ещё на стадии формирования начальной версии базы данных «ПРП» удалось выявить в биоптатах простаты с раковыми опухолями фракцию, результаты идентификации которой свидетельствовали, что по первичной структуре это «безымянный белок», зарегистрированный в базе данных Protein NCBI под номером 21758704 (66% покрытия триптическими пептидами предсказанной аминокислотной последовательности) (Рис. 23).

Сведения о возможном существовании данного «безымянного белка» представили японские исследователи [08-JUL-2002; Sugano,S. and Suzuki,Y. по 21758704 Protein NCBI], выявившие при изучении кДНК-библиотеки (полученной из образцов тканей яичка человека) клон с соответствующей кодирующей последовательностью. В нашей базе данных «ПРП» этот белок получил обозначение - NEDO (Рис. 23).

А 0 ppiB

^ AGR2

а N :do

г ESRl-sv

t г DEADCI

HBA-vC

r NDUFA2

9,0

ш

Рис. 23. Результаты протеомного выявления и масс-спектрометрической идентификации безымянного белка NEDO. А фрагмент синтетической карты в модуле «Белки биоптатов предстательной железы», пунктирным фиолетовым овалом показан безымянный белок NEDO; Б - распределение выявленных триптических пептидов (красный шрифт) по предсказанной аминокислотной последовательности «безымянного белка 21758704 Protein NCBI

1 MCTVGGNVSE DACYGEPLEF PENTKKRATL GSSSPTAGHT PQRKEIRISK

51 MYLHIPIHCS TTYHGRDLES TSVPINRRTD KKNVVRRHSG YCSAREERNP 101 VISAAWMSLE ELGKSARCRK TNTPGSHTSV GAKKAELKAV VMDCWLPESG

151 EGVRVRARRE WKL

Обобщенные данные об определении «безымянных» и «гипотетических» белков человека в биоптатах тканей простаты с раковыми опухолями представлены в Табл. 9.

Таблица 9. Белковые фракции, охарактеризованные как «безымянные» (unnamed protein product, Homo sapiens) и «гипотетические» белки при протеомном изучении биоптатов тканей простаты с раковыми опухолями.

№ Наименование белка и обозначения в БД «ПРП» Номера в Protein NCBI/локус Genbank Идентификация % совпадения Мм/р1 (эксп.) Мм/р1 (расчет)

1 «Безымянный белок», NEDO 21758704/ BAG05360 66 18,0/8,80 18,1/9,45

2 «Безымянный белок», pUP-1 194377764/ BAG63245 38/ 10 50 30,5/8,80 31.2/9,83

3 «Безымянный белок», pUP-2 221039916/ ВАН11721 34/8 60 21,0/9.20 21.5/11,2

4 «Безымянный белок», сходный с полиадени-лат-связывающим белком 1, pUP-3 193787802/ BAG53005 94/ 10 16 76,5/7,05 70,6/9.55

5 «Безымянный белок», с иммуноглобулиновыми доменами, pUP-4 21757066/ ВАС05009 110/7 16 52,8/6.57 51.8/8,76

6 Гипотетический белок, НР-МА-1 51476663/ САН 18309 27 52,5/6,59 55,0/10,1

При протеомном изучении в образцах тканей простаты была обнаружена ещё одна интересная, но непостоянно встречающаяся фракция. Из 144 исследо-

ванных образцов (37 - ДГПЖ, 107 - рак) её удалось выявить в 8 случаях (5,6%). При масс-спектрометрической идентификации методом MALDI-TOF был получен масс-спектр триптических пептидов, который по результатам анализа был расценен как принадлежащий белку PR02044, содержащему альбуминовый домен. Выявленные триптические пептиды покрывали 44% предполагаемой аминокислотной последовательности PR02044. Вместе с тем электрофоретические свойства указанного белка явно отличались от расчетных значений (Мм/pi экспериментальные - 14,5/6,75; Мм/pi расчетные - 29,2/6,97 по 6650826 Protein NCBI). При этом в других протеомных исследованиях экспериментальные значения Мм PR02044 были близки к расчетным. Практически в два раза меньшая молекулярная масса у фракции, выявленной при раке простаты, позволяет думать, что этот белок, возможно, является фрагментом (или резко укороченной формой) PR02044. Ещё один малоизученный белок, содержащий альбуминовый домен (PR02675), достаточно специфично выявлялся при РП, не обнаруживался у больных доброкачественной гиперплазией, а также у здоровых лиц, что позволило запатентовать его как биомаркер данного заболевания [Ковалев Л.И. с со-авт. 2009].

Среди малоизученных белков, идентифицированных при анализе изучавшихся биообъектов, отдельную группу образовали так называемые укороченные формы. В целом, было выявлено и идентифицировано 7 укороченных изоформ у различных белков, в частности, у поли (А) связывающего белка 1 цитоплазмы, тропомиозина а-3, гуанин-нуклеотид связывающего белка, фосфоглюкомугазы 3, пероксиредоксина 6, виментина, ламинина у-1.

6. Использование протеомных технологий для изучения белковых биомаркеров у некоторых лабораторных животных и в мясных продуктах.

Создание БД «ПМО» позволило организовать ещё один цикл исследований, направленных на выявление некоторых ткане- и видоспецифичных белков для их применения при решении определенных практических задач, связанных с обеспечением эффективного контроля за качеством мясного сырья и мясных продуктов (на примере образцов вареных колбас сорта «Докторская»),

На ДЭ белковых экстрактов, полученных из образцов мясного сырья (говядины и свинины), а также образцов конечных продуктов (колбас сорта «Докторская»), стандартно детектировались сотни белковых фракций, окрашиваемых Кумасси R-250. Полученные протеомные профили характеризовались определенным сходством. На Рис. 24 в качестве примера представлен результат анализа образца колбасы сорта «Докторская». При этом масс-спектрометрическими методами было идентифицировано более 34 мажорных белковых фракции, среди

которых оказались: ряд основных сократительных белков (актин, тропомиозины, легкие цепи миозина, тропонины Т и I), а также другие известные белки мышечных органов (мышечная креатинфосфокиназа, аВ кристаллин, енолаза, карбоан-гидраза, глицеральдегид-3-фосфатдегидрогеназа, альдолаза А, миоглобин и пр.).

Рис. 24. Типичная ДЭ, полученная при анализе белкового экстракта докторской колбасы. Окраска Кумасси R-250. Стрелками с номерами обозначены все белковые фракции, идентифицированные масс-спектрометрией, при этом красным цветом указаны белки, идентифицированные как свиные (Sus scrofa), синим цветом белки коровьего происхождения (Bos taurus), фиолетовым - казенны молока, черным цветом — белки животного происхождения, общие для свинины и говядины.

Далее, используя в качестве эталона образцы колбасы сорта «Докторская», приготовленной в строгом соответствии с ГОСТ, были количественно характеризованы шесть групп легко узнаваемых и хорошо воспроизводимых белковых фракций, которые были идентифицированы как мажорные мышечные белки - а-и Р-тропомиозины, структурные и фосфорилируемые легкие цепи миозина, изо-формы мышечной енолазы, креатинфосфокиназы, альдолазы А и глицеральаль-дегид-3-фосфатдегидрогеназы и миоглобины. Полученные количественные показатели рассматривались как референсные значения и послужили основой для последующего определения общего количества мясного сырья в коммерческих образцах колбасных изделий (Рис. 25).

Надо отметить также, что проведенные исследования показали присутствие в образцах конечных мясных продуктов некоторых видоспецифичных белков, которые при одинаковых Мм различались по pi (мышечная енолаза, триозофос-

фатизомераза, миоглобины и др.)- Данное заключение было подтверждено с помощью коэлектрофореза (свинина / говядина). Эти белковые фракции были выбраны в качестве биомаркеров видоспецифичности и дальнейший анализ (несмотря на некоторую вариабельность) показал, что количественные оценки соотношения мышечной енолазы, триозофосфатизомеразы и миоглобина в эталонных образцах позволяют рассчитать соотношение двух видов мясного сырья и в конечных мясных продуктах. 1800 1600 1400 1200 1000 800 600 400 200 О

Рис. 25. Результаты определения шести групп мажорных мышечных белков (отмеченных в тексте) как показателей присутствия мясного сырья в эталонных пробах и различных изучавшихся образцах мясных продуктов, (коммерческие образцы: М - комбинат им. А.И. Микояна, Д - производство «Дымов», К - Клинский комбинат)

Кроме того, проведенный протеомный анализ выявил в конечных мясных продуктах ряд белков немышечного происхождения, в частности, белков коровьего молока (что не противоречит ГОСТу на колбасу «Докторская»), (Табл. Ю)

Таблица 10. Результаты идентификации MALDI-TOF масс-спектрометрией молочных белков (Bos taurus) в образцах колбасы сорта «Докторская».

№* Название белка Номер в Protein NCBI Идентификация** % перекрытия Мм/р1 эксперим. Mw/pl расчет.

13 Казеин CSN2 83406093 97/9 29 33,0/4,80 25.2/5.53

14 Казеин пара каппа А 229416 94/6 77 14,0/8,75 12,3/8,92

* Номера соответствуют фракциям, показанным на Рис. 24

** Вероятностный коэффициент достоверности/ количество выявленных масс пептидов. Вероятностный коэффициент достоверности считается высоко достоверным при значении не ниже 84 (р<0,05).

Далее, для повышения эффективности обнаружения в мясных продуктах пищевых добавок был проведен электрофоретический анализ ряда немясных компонентов, использующихся в производстве колбасных изделий: сухого молока, яичного желтка и яичного порошка, а также препаратов коллагена, соевого

_

1 2 3

,_

№ 1 2 3 4

М

Эталон Образец Коммерческие

образцы

белка и соевого текстурата. Оказалось, что каждый из этих объектов обладает достаточно специфичным протеомным профилем, в котором не обнаружились фракции, совпадающие по электрофоретическим свойствам, с мажорными мышечными белками. На основе полученных результатов были предложены некоторые из выявленных видоспецифичных белковых фракций (в частности, соевых белков) в качестве потенциальных биомаркеров для детектирования в колбасных изделиях немясных добавок.

Известно, что проблемы, связанные с поступлением на рынок мясных продуктов (в частности, вареных колбас) недостаточного качества или даже фальсифицированных продуктов, традиционно являются актуальными для общества. Полученные результаты показывают эффективность применения протеомных технологий для решения трех основных вопросов, которые интересуют контролирующие организации и непосредственных потребителей колбасных изделий: 1 - соответствие ГОСТам и ТУ по количеству мышечной ткани; 2 - соблюдение технологических соотношений разных видов мышечного сырья; 3 — наличие белков немышечного происхождения или мышечных, но чужеродных видов. Таким образом, выявление потенциальных белковых биомаркеров (которые позволяют оценивать качество мясной продукции по белковому составу) может стать основой для практического контроля качества мясных продуктов с использованием специально разработанных экспресс-методов детекции таких белков, например, на основе иммуноферментных или иммунохроматографических технологий.

ЗАКЛЮЧЕНИЕ.

Одной из существенных черт развития биохимии белков в последние десятилетие стало активное использование стратегии, ориентированной на параллельное изучение сотен белков с помощью протеомных технологий. Появляющиеся в результате информационные массивы становятся основой для создания различных баз данных, содержащих разнообразную биомедицинскую информацию. В целом, взаимоотношения между различными протеомными технологиями, решаемыми с их помощью научными задачами можно представить в виде схемы, представленной на Рис. 26.

Практически в соответствии с такой схемой проводились исследования, составляющие данную диссертационную работу, общую направленность которой можно определить как создание протеомных баз данных (БД) о белках мышечных органов и некоторых модельных клеточных линий. В созданных БД аккумулировались собственные и литературные данные, характеризующие соответствующие белки (включая их полиморфизм) в норме и при патологических со-

стояниях. Было показано, что с помощью протеомных технологий и построенных БД можно получать различные новые данные о белках человека (например, удалось выявить существование пяти безымянных белков - продуктов локусов ВАС05360, ВАв63245, ВАШ 1721, ВА053005, ВАС05009, зарегистрированных в СепВапк, и др.), а также решать определенные прикладные задачи, включающие выявление потенциальных белковых биомаркеров тканеспецифичности и различных форм патологии, в частности рака простаты.

Рис. 26. Схема взаимоотношений между различными протеомными технологиями, решаемыми с их помощью научными задачами.

Перспективными представляются также выполненные с помощью протеомных технологий разработки, направленные на объективную оценку качества мясных продуктов с определением видовой специфичности мышечных белков, а также выявлением белковых добавок немышечного происхождения, включая установление некоторых признаков фальсификаций.

Таким образом, совокупность полученных результатов и разработанных теоретических положений можно квалифицировать как научное достижение, свидетельствующее о высокой значимости применения протеомных технологий и соответствующих баз данных в различных биомедицинских исследованиях.

Отдельные разделы данной работы были поддержаны и выполнялись как задания Государственных контрактов № 14.740.11.0762 Федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» на 2009-2013 гг. и №8/3-373н-08 Программы прикладных научных исследований

и проектов в интересах города Москвы на 2006-2008 годы, а также гранта «Изучение биохимического полиморфизма СН-домен содержащих и некоторых других актин-связывающих белков при раке простаты для разработки новых методов диагностики» Программы Президиума РАН «Фундаментальные науки — медицине» и др.

ВЫВОДЫ

1. В результате протеомных исследований в тканях мышечных органов и культивируемых клетках человека выявлены различные варианты биохимического полиморфизма белков, обусловленные единичными аминокислотными заменами (single amino acid substitution, SAAS), включая новый вариант триозо-фосфатизомеразы 1 (SAAS 233G-»D) и разрешены в одну из сторон «конфликтные» определения (по 135 позициям) в аминокислотных последовательностях 59 белков человека.

2. В органах человека, содержащих поперечнополосатые мышечные волокна, охарактеризован ряд других проявлений биохимического полиморфизма: в миокарде выявлены потенциальные белковые маркеры пренатальных и постна-тальных стадий онтогенеза, в скелетных мышцах в норме и при патологии показаны проявления мультилокусного полиморфизма; в модельных клеточных культурах выявлены изменения в продукции ß-тропомиозина и белка S100A11, связанные с клеточной дифференцировкой.

3. Создана отечественная многомодульная база данных «Протеомика мышечных органов», включающая результаты изучения белкового полиморфизма в различных мышечных органах человека, при этом установлено, что в трех органах человека, содержащих гладкомышечные волокна (миометрий, аорта и простата) имеется множественность изоформ трансгелина, которые могут рассматриваться как потенциальные тканеспецифичные биомаркеры.

4. Сформирована новая версия специализированной (2012 г.) базы данных «Протеомика рака простаты», в состав которой включен комплексный модуль, «Белки клеток DU-145», обобщающий результаты протеомного анализа суммарных белковых экстрактов, а также специально полученных белковых препаратов (фосфопротеинов и ядерных белков); с помощью базы данных «Протеомика рака простаты» определены перспективные потенциальные биомаркеры указанного заболевания.

5. Обнаружено несколько безымянных, гипотетических и других малоизученных белков в образцах тканей и культивируемых клеточных линиях человека, в том числе пять безымянных белков (продукты локусов ВАС05360, BAG63245, ВАШ 1721, BAG53005, ВАС05009, зарегистрированных в GenBank),

и семь укороченных белковых продуктов, предсказанных ранее по материалам исследований геномной ДНК и/или соответствующих мРНК; таким образом, впервые доказано существование у некоторых известных белков (тропомиозина 3, поли (А) связывающего белка 1, фосфоглюкомутазы 3 и др.) особых укороченных изоформ.

6. Построенная база данных ««Протеомика мышечных органов» способствовала выявлению видоспецифических изоформ ряда мышечных белков, которые могут найти применение для создания методов контроля качества пищевой продукции по белковому составу.

Основные публикации по теме диссертации

Монография и главы в коллективных монографиях:

Шишкин С.С. Ковалев Л.И., Крахмалева И.Н., Ковалева М.А. Полиморфизм мышечных белков человека. Изд-во РУДН. 2011. 572с.

Shishkin S.S., Kovalev L.I., Krakhmaleva I.N., Kovaleva M.A.. Eremina L.S., Popov V.O. Biomedical aspects in investigations of biochemical polymorphism of actins and some actin-binding proteins. // In: «Molecular Polymorphism of Man: Structural and Functional Individual Multiformity of Biomacromolecules». Editors: Sergei D. Varfolomyev and Gennady E. Zaikov. Nova Publisher Hauppauge, NY, 11788-3619 USA. 2011. P.237-280.

Статьи в рецензируемых журналах, рекомендованных ВАК РФ:

Ковалев Л.И., Северин С.С., Ершова Е.С., Лукашова М.В., Ковалева М.А.. Шишкин С.С. Двумерный электрофоретический анализ белков миокарда при некоторых формах сердечно-сосудистой патологии человека.//Вопр. мед. химии. 1998. т.44 .№1. С.106-110.

Малашенко А.М., Бескова Т.Б., Ковалева М.А.. Ковалев Л.И. Выявление различий в составе белков печени у мышей рекомбинантных линий, отличающихся по чувствительности к воздействию тиоТЭФ. // Генетика. 2000. т.36. № 4. С.533-537.

Шишкин С.С., Ковалев Л.И., Ковалева М.А. Протеомные исследования мышечных белков человека и некоторых других позвоночных. // Биохимия. 2004. т.69. №11. С.1574-1591.

Ковалев Л.И., Шишкин С.С., Хасигов П.З., Дзеранов Н.К., Казаченко A.B., Ковалева М.А.. Торопыгин И.Ю., Мамыкина C.B. Идентификация белка AGR2 - нового потенциального маркера рака с использованием протеомных технологий. // Прикладная биохимия и микробиология, 2006, т.42, № 4, с.480-484.

Ковалев Л.И., Ковалева М.А.. Ковалев П.Л., Серебрякова М.В., Мошковский С.А., Шишкин С.С. Полиморфизм АЗ,5-Д2,4-диеноил-коэнзим А изомеразы (белкового продукта гена ЕСН1) в поперечно-полосатой мышечной ткани человека. // Биохимия. 2006. Т.71, № 4, С.554-560

Ковалев Л.И., Шишкин С.С., Хасигов П.З., Дзеранов Н.К., Казаченко A.B., Ковалева М.А.. Торопыгин И.Ю., Еремина Л.С., Грачев C.B. Новые подходы к молекулярной диагностике рака простаты. //Урология. 2006. № 5. С.16-19

Ковалев Л.И. Ковалева М.А.. Буракова М.В., Еремина Л.С., Шишкин С.С., Шигеев C.B., Серебрякова М.В., Захарова М.Н., Завалишин И.А. Исследование патогенеза медленных нейроинфекций протеомными технологиями. // Нейрохимия, 2007, т.24, №3, С.248-256.

Еремина Л.С., Ковалев Л.И., Шишкин С.С., Торопыгин И.Ю., Буракова М.И., Ковалева М.А.. Макаров A.A., Дзеранов Н.К., Казаченко A.B., Тотров К.И., Кононков И.В., Лоран О.Б. Биохимический полиморфизм трансгелинов в предстательной железе человека при гиперплазии и раке. // Вопросы биологической, медицинской и фармацевтической химии, 2007, № 3, С.50 - 53.

Еремина JI.С., Ковалев Л.И., Ковалева М.А., Макаров A.A., Шишкин С.С., Буракова М.И., Чернов H.H., Торопыгин И.Ю., Кононков И.В. Сравнительное изучение белка AGR2 в некоторых культивируемых клетках и образцах тканей простаты. // Вестн. РУДН. Серия «Медицина». 2007. №6. С. 257-261

Ковалева М.А.. Ковалев Л.И., Серебрякова М.В., Мошковский С.А., Шишкин С.С. Возрастные изменения альбумина и актина миокарда человека. // Биомедицинская хи-мия.2007. 53.6.644 - 653

Ковалева М.А.. Ковалев Л.И., Еремина Л.С., Макаров A.A., Буракова М.В.,Торопыгин И.Ю., Серебрякова М.В., Шишкин С.С., Арчаков А.И. Определение «аминокислотных конфликтов» и аминокислотных замен в первичных структурах 41 белка человека проте-омными технологиями. // Биомедицинская химия. 2008. Т.54. №4. с.420-434

Макаров A.A., Ковалев Л.И., Ковалева М.А.. Торопыгин И.Ю., Шишкин С.С. Изучение изменений белкового профиля в дифференцирующихся миобластах человека. // Онтогенез. 2009. т.39. №2. С.112-119.

Шишкин С.С., Дзеранов Н.К., Тотров К.И., Казаченко A.B., Ковалев Л.И., Еремина Л.С., Ковалева М.А.. Торопыгин И.Ю. Клинико-биохимическое исследование диагностической значимости панели из 10 потенциальных белковых маркеров рака простаты. // Урология, 2009. №1. С.56-58.

Ковалева М.А.. Ковалев Л.И., Торопыгин И.Ю., Шигеев C.B., Иванов A.B., Шишкин С.С. Протеомный анализ белков скелетной мышцы (m.vastus lateralis) человека, идентификация 89 белковых продуктов генной экспрессии. // Биохимия, 2009, т.74, №11, С. 15241538.

Шишкин С.С., Ковалев Л.И., Ковалева М.А.. Крахмалева И.Н., Лисицкая К.В., Еремина Л.С., Иванов A.B., Герасимов Е.В., Садыхов Е.Г., Уласова Н.Ю., Соколова О.С., Торопыгин И.Ю., Попов В.О. База данных «Протеомика рака простаты». // Acta naturae, 2010, т.2, №4, С. 104-114.

Shishkin S., Kovaleva M.. Ivanov A., Eryomina L., Lisitskaya K., Toropugin I., Kovalev L., Okhritz V., Loran O. Comparative proteomic study of proteins in prostate cancer and benign hyperplasia cells. // J. Cancer Sei. Ther. 2011. SI. http://dx.doi.org/10.4172/1948-5956.Sl-003 (P.l-8)

Ковалев Л.И., Макаров A.A., Черкашин Е.А., Дулиньска И., Ковалева М.А.Лисицкая К.В., Иванов А.И., Торопыгин И.Ю., Серебрякова М.В., Лайддер П, Шишкин С.С. Новый аллельный вариант триозофосфатизомеразы выявленный в культивируемых клетках рака простаты человека. // Молек. генет., микроб., вирусол. 2011, №1, С.14-19.

Охриц В.Е., Лоран О.Б., Велиев Е.И., Лисицкая К.В., Еремина Л.С., Ковалева М.А., Ковалев Л.И., Шишкин С.С., Обейд А.Х. Изучение белков DJ-1, хроматогранина А и Bcl-2 у больных с раком простаты и доброкачественной гиперплазией предстательной железы.//Медицинский вестник Башкортостана. 2011.6.2. 271-274.

Лисицкая К.В., Еремина Л.С., Иванов A.B.. Ковалева М.А.. Охриц В.Е., Торопыгин И.Ю., Ковалев Л.И., Шишкин С.С. Изучение белка DJ-1 при раке простаты в образцах тканей, в культивируемых клетках и в сыворотке крови больных. // Биомедицинская химия 2011, т. 57, вып. 4. С.392-401.

Ковалева М.А.. Иванов A.B., Ковалев Л.И., Шишкин С.С., Хряпова Е.В., Лисицын А.Б., Чернуха И.М., Вострикова Н.Л. Протеомные технологии в исследованиях белкового состава образцов вареных колбасных изделий// Всё о мясе. 2012. №2, С.48-52.

Ковалева М.А.. Иванов A.B., Ковалев Л.И., Лисицын А.Б., Чернуха И.М., Вострикова Н.Л. Протеомное исследование количества мышечной ткани в образцах вареных колбас. //Все о мясе — теория и практика переработки мяса. 2013. № 1, С.18 -21.

Статьи в тематических сборниках и материалах научных конференций:

Ковалев Л.И., Ковалева М.А.. Макаров A.A., Шишкин С.С., Тихонова О.В., Мошков-ский С.А., Серебрякова М.В. Протеомные технологии в исследованиях проблемы гипертрофии мышечных клеток (возможности тестирования молекулярных эффектов при использовании медико-биологических технологий повышения работоспособности). «Медико-биологические технологии повышения работоспособности в условиях напряженных физических нагрузок». ЗАО «Фон». Москва.2004. С.160-168

Шенкман B.C. Нетреба А.И. Литвинова К.С. Таракин П.П. Вихлянцев И.М. Подлубная З.А. Немировская Т.Л. Ковалева М.А.. Стеханова Т.Н. Попов В.О. Виноградова О.Л. Креатин как метаболический модулятор сократительной функции мышц человека в условиях силовой тренировки. Медико-биологические технологии повышения работоспособности в условиях напряженных физических нагрузок». ЗАО «Фон». М.,.2004, с.102-116.

Шишкин С.С., Макаров A.A., Ахунов B.C., Ковалев Л.И., Ковалева М.А.. Князев А.И., Воронина A.C., Лисицкая К.В., Еремина Л.С. Создание и использование лабораторного регламента для определения биологической активности рекомбинантных ростовых факторов и некоторых других биологически активных веществ. «Медико-биологические технологии повышения работоспособности в условиях напряженных физических нагрузок». ООО «Анита Пресс». Москва. 2006. С. 8 - 22.

Ковалев Л.И., Ковалева М.А.. Торопыгин И.Ю., Шигеев C.B., Шишкин С.С. Полиморфизм ß- енолазы (белкового продукта гена EN03) в скелетной мышечной ткани человека и некоторые проблемы мышечной работоспособности. «Медико-биологические технологии повышения работоспособности в условиях напряженных физических нагрузок». ООО «Анита Пресс». Москва. 2006. С.52-62.

Патент:

Ковалев Л.И., Шишкин С.С., Еремина Л.С., Ковалева М.А.. Дзеранов Н.К., Казаченко A.B., Тотров К.И. Маркер рака предстательной железы. Патент № 2360924 Зарегистрирован в Государственном реестре изобретений Российской Федерации 10 июля 2009г. Опубликован: 10.07.2009, Бюл., №19. С.1-7.

Информационно-методические письма:

Шишкин С.С., Ковалев Л.И., Ковалева М.А.. Крахмалева И.Н., Еремина Л.С., Лисицкая К.В., Дзеранов Н.К, Ощепков В.Н., Кешишгв Н.Г., Тотров К.И. Рак простаты и современные протеомно-биотехнологические подходы к его молекулярной диагностике. (Информационно-методическое письмо). // М. Изд-во ООО «Оригинальная компания» (www.pechatay.ru) 2009. 1-36.

Шишкин С.С., Ковалев Л.И.. Ковалева М.А.. Крахмалева И.Н., Еремина Л.С., Макаров A.A., Лисицкая К.В., Лоран О.Б. Велиев Е.И., Охриц В.Е. Проблемы ранней диагностики рака простаты и возможности применения новых потенциальных биомаркеров. (Информационно-методическое письмо). М. Изд-во ООО «Оригинальная компания» (www.pechatay.ru) 2009. 1-45.

Шишкин С.С., Ковалев Л.И., Ковалева М.А.. Крахмалева И.Н., Еремина Л.С., Лисицкая К.В., Иванов A.B., Лоран О.Б., Велиев Е.И., Охриц В.Е. Протеомные и другие постгеномные технологии в онкоурологии. // М. Изд-во ООО «Оригинальная компания» (www.pechatay.ru). 2012. С.1-38.

Подписано в печать 16.04.2013 г. Формат 60x90/16 Гарнитура «Тайме» Тираж 120 экз. Заказ №32412

Отпечатано в типографии «Печатай .ру» ООО «Оригинальная компания» г. Москва, Ленинский проспект, д. 35

Текст научной работыДиссертация по биологии, доктора биологических наук, Ковалева, Марина Анатольевна, Москва

РОССИЙСКАЯ АКАДЕМИЯ НАУК Институт биохимии им. А.Н. Баха РАН

На правах рукописи

05201350881

КОВАЛЕВА Марина Анатольевна

ПРОТЕОМНЫЕ БАЗЫ ДАННЫХ ДЛЯ ПОИСКА ТКАIIЕСIIЕЦИФИЧ11ЫХ БЕЛКОВЫХ МАРКЕРОВ МЫШЕЧНЫХ ОРГАНОВ

03.01.04 - Биохимия

Диссертация на соискание ученой степени доктора биологических наук

Научный консультант: проф., д.б.н. Шишкин С.С.

Москва 2013

ОГЛАВЛЕНИЕ

Введение 7

Глава 1 Протеомика постгеномного периода в разработках некоторых биомедицинских проблем 13

1 1 Три периода в развитии протеомных исследований белков человека 14

1 2 Основные протеомные технологии и белковые базы данных, гипотетические (hypothetical), безымянные (unnamed) и некоторые другие малоизученные белки человека 26

12 1 Появление и развитие основных протеомных технологий 26

12 2 Компьютерные белковые базы данных и их роль в протеомных исследованиях 36

12 3 Гипотетические (hypothetical), безымянные (unnamed) и некоторые другие малоизученные белки человека 43 1 3 Исследования белкового полиморфизма и роль протеомных технологий 49

13 1 Общие представления о молекулярных основах биохимического полиморфизма белков 49

13 2 Протеомный подход в исследованиях биохимического полиморфизма белков

58

1 4 Протеомные методы в исследованиях белковых профилей при клеточной дифференцировке, в ходе онтогенеза и при злокачественной трансформации клеток человека 64

14 1 Протеомные исследования белковых профилей при клеточной дифференцировке на примере миогенеза 64

14 2 Изучение возрастных изменений белков человека протеомными методами (на примере некоторых мышечных органов) 67 1 4 3 Протеомика и рак (на примере рабдо- и лейомиосарком, а также злокачественных опухолей простаты) 71 1 5 Решение некоторых прикладных биомедицинских задач с помощью протеомных методов исследования 85

15 1 Поиск белковых биомаркеров отдельных физиологических и патологических процессов, а также белков - потенциальных мишеней для химиотерапевтических воздействий . 86

15 2 Определение тканеспецифичных и других белковых биомаркеров в пищевой

(мясной) промышленности 91

Глава 2 Материалы и методы исследований 94

2 1 Биологические материалы 94

2 11 Образцы тканей и других биоматериалов человека 94

2 12 Клеточные культуры 96

2 13 Образцы тканей лабораторных животных 97

2 14 Образцы коммерческой мясной продукции и исходного сырья 97

2 2 Химические реагенты 98

2 3 Протеомные методы исследования 99

2 3 1 Подготовка проб 99

2 3 2 Фракционирование белков двумерным электрофорезом по О Фарреллу 99 2 3 2 1 Фракционирование белков двумерным электрофорезом по О'Фарреллу с использованием изоэлектрофокусирования в амфолиновом градиенте рН (IEF-

PAGE) 100 2 3 2 2 Изоэлектрофокусирование в полиакриламидном геле с градиентом рН,

сформированном амфолинами 100

2 3 23 SDS-электрофорез в пластинах полиакриламидного геля 102 2 3 2 4 Фракционирование белков двумерным электрофорезом по О'Фарреллу с использованием изоэлектрофокусирования в иммоблиновом градиенте рН (IPG-

PAGE) 103 2 3 3 Детекция белков на гелевых пластинах Денситометрия двумерных

электрофореграмм Архивирование гелевых пластин 104

2 3 4 Компьютерная денситомеггрия электрофореграмм 105

2 3 5 Масс-спектрометрическая идетификацня белков 105

2 4 Иммуноферментный анализ 106

2 5 Иммуноблоттинг 107 2 6 Выделение клеточной ДНК, полимеразная цепная реакция, секвенирование

ампликонов 108 2 7 Получение из культивированных клеток линии DU-145 препаратов «Суммарные

фосфопротеины» 109 2 8 Методы получения препаратов клеточных белков, составляющих ядерный

протеом клеток линии DU-145 109

2 9 Статистическая обработка результатов 110

Результаты исследований и их обсуждение 111

Глава 3 Протеомное изучение биохимического полиморфизма белков, обусловленного аминокислотными заменами, в некоторых тканях и культивируемых клетках человека Проблема «конфликтов» в аминокислотных последовательностях некоторых белков 112

3 1 Исследования биохимического полиморфизма белков, обусловленного единичными аминокислотными заменами (single amino acid substitution, SAAS) 113

3 1 1 Изоформы енолазы человека и их полиморфные варианты 113

3 12 Полиморфизм ДЗ,5-А2,4-диеноил-коэнзим А изомеразы (SAAS 41Е—>А) 123

3 13 Новый вариант триозофосфатизомеразы 1 (SAAS 233G—>D) 128

3 2 Проблема «конфликтов» в аминокислотных последовательностях некоторых белков человека, SNP's и SAAS 137 Глава 4 Биохимические проявления дифференциальной генной экспрессии в некоторых мышечных органах человека, а также при клеточной дифференцировке и

в онтогенезе 142

4 1 Протеомное изучение белков сердечной мышцы человека, включающее масс-спектрометрическую идентификацию 80 белковых фракций 143 4 2 Изучение полиморфизма некоторых мажорных белков в отдельных мышечных органах, содержащих поперечнополосатые и гладкомышечные ткани 148 4 3 Протеомные технологии в изучении дифференциальной генной экспрессии белков в культивируемых мышечных клетках человека 153 4 4 Онтогенетические изменения белкового профиля в образцах сердечной мышцы человека 155 4 4 1 Протеомное исследование белков миокарда человека в пренатальном онтогенезе 156

4 2 2 Протеомное исследование белков миокарда человека в постнатальном онтогенезе 162 Глава 5 Разработка общих принципов построения многомодульных протеомных баз данных и создание базы данных «Протеомика мышечных органов» 168

5 1 Разработка принципов построения многомодульных протеомных баз данных и

общие характеристики базы данных «Протеомика мышечных органов» 168

5 2 Общая характеристика комплексного модуля «Белки миокарда» . 174

5 3 Модуль «Белки скелетной мышцы» (ш vastus lateralis) человека» и изучение изменений протеомных профилей у пациентов с мышечной патологией 180

5 3 1 Общая характеристика модуля «Белки скелетной мышцы» (m vastus lateralis) человека» 180

5 3 2 Изменения белковых профилей в скелетной мышце при боковом амиотрофическом склерозе 182

5 3 3 Протеомное изучение аутоантигенов у больных БАС и рассеянным склерозом в скелетных мышцах 184

5 4 Модули органов, содержащих гладкомышечные волокна («Белки миометрия», «Белки средней оболочки аорты», «Белки биоптатов предстательной железы») 188

5 4 1 Общая характеристика модуля «Белки миометрия» 188

5 4 2 Общие характеристики модулей «Белки средней оболочки аорты» и «Белки биоптатов предстательной железы» . 194

5 4 3 Биохимический полиморфизм трансгелинов в трех органах, содержащих гладкомышечные волокна 198

5 5 Дополнительные модули комплексный модуль «Белки недифференцированных и дифференцированных миобластов человека» и модуль «Белки рабдомиосаркомы» 201

5 5 1 Комплексный модуль «Белки недифференцированных и дифференцированных миобластов человека» 201

5 5 2 Дополнительный модуль «Белки рабдомиосаркомы» 203

6 Специализированная база данных «Протеомика рака простаты» (версия 2012 г ) . 206 6 1 Общие характеристики базы данных «Протеомика рака простаты» . 206 6 2 Построение комплексного модуля для белков линии DU-145 208 6 3 Модуль «Белки клеток OKP-GS» 234 6 4 База данных «ПРП» для изучения белкового полиморфизма 238

6 5 БД «ПРП» и поиск потенциальных белковых биомаркеров рака простаты 241

7 Протеомные технологии для выявления гипотетических (hypothetical), безымянных (unnamed) и других малоизученных белков 249 7 1 Выявление гипотетических, безымянных и некоторых других малоизученных

белков в образцах тканей и культивируемых клеточных линиях человека 249

7 2 Использование протеомных технологий для выявления укороченных форм белков 257

8 Использование протеомных технологий для изучения белковых биомаркеров у некоторых лабораторных животных и в мясных продуктах 267

8 1 Протеомное выявление аллельных изоформ белков у линейных животных .. 267

8 2 Протеомное изучение белков в мясных продуктах поиск ткане- и видоспецифичных биомаркеров, а также белков различных немышечных пищевых добавок 270

8 2 1 Исследование образцов мышечного сырья 270

8 2 2 Исследование образцов вареной колбасы сорта «Докторская» 273

8 2 3 Исследование образцов немышечного происхождения и выявление нерегламентированных ГОСТ белков . 276

8 2 4 Разработка протеомной методики количественного определения тканеспецифичных биомаркеров для оценки содержания мясного сырья в образцах вареных колбас 279

8 2 5 Апробация протеомной методики для определения количественного соотношения мясного сырья (говядина / свинина) в колбасных продуктах по белковым видоспецифичным биомаркерами 283

Заключение _ 287

Выводы . 290

Список сокращений 291

Список цитированной литературы . 293

Приложения 333

ВВЕДЕНИЕ

Актуальность темы

Для развития биохимии белков в начале 21-ого века принципиальное значение приобрело широкое применение протеомных и биоинформационных технологий [Арчаков А.И. 2000, Anderson N.G. et al. 2001; Шишкин С.С. 2002; Примроуз С., Тваймен Р. 2008 и др.]. Накапливающиеся результаты, представляющие собой совокупности взаимосвязанных сведений, подлежащих совместной обработке, рассматриваются как соответствующие информационные массивы, на основе которых формируются различные общие и специализированные базы данных, размещаемые в сети «Интернет». Среди них надо особо отметить в базе данных UniProt информационный ресурс, названный «Complete proteome of Homo sapiens», который к середине 2012 года включал более 70 000 аннотаций, однако из них только 25 000 аннотаций (35,2%) представляли результаты прямых исследований соответствующего белка. Таким образом, очевидно, что большая часть (64,8%) созданных аннотаций нуждается в дополнительных экспериментальных материалах, при получении которых решающую роль могут сыграть протеомные технологии и дальнейшее развитие информационных ресурсов, что свидетельствует о высокой актуальности подобных исследований.

В первой декаде 21-го века также поступательный импульс получили протеомные исследования, направленные на выявление полиморфных вариантов белков в мышечных органах и выяснение роли белкового полиморфизма при различных физиологических и патологических процессах [Yip Y. et al., 2008; Wei Y.J. et al. 2009; Manning A. et al., 2012; Gioli-Pereira L et al. 2013 и др.]. Особое внимание при этом уделялось аллельным изоформам, которые характеризуются единичными аминокислотными заменами в аминокислотных последовательностях, поскольку такие замены могут приводить к изменениям функциональных свойств белка (от незначительных до полной потери функции) или не оказывать подобного влияния (так называемые «нейтральные» замены). Уже собранная обширная информация о белковом полиморфизме в различных базах данных (например, в UniProt) включает и сведения о большом числе спорных определений отдельных аминокислот в ряде позиций первичной структуры многих белков, так называемых «аминокислотных конфликтов в последовательности» (Sequence conflict). Соответственно, при исследованиях любого белка разрешение «аминокислотного конфликта» в пользу одного из вариантов представляет

значительный интерес, поскольку итоговая детализация первичной структуры может оказать влияние на формирование представлений о пространственной упаковке его полипептидной цепи и других свойствах, включая функциональные особенности.

Наряду с изучением разных аспектов белкового полиморфизма и других фундаментальных проблем биохимии белков мышечных органов протеомные технологии находят все более широкое применение в разработках биомедицинских проблем, ориентированных на решение многих прикладных задач - от выявления потенциальных диагностических белковых биомаркеров, мишеней фармакологических воздействий [Cummings J. et al. 2008; Principe S. et al. 2012 и др.] до создания методов контроля за качеством различных пищевых продуктов, изготавливаемых из мышечных тканей животных [Zapata I. et al. 2009; de Almeida AM, Bendixen E. 2012; D'Alessandro A et al. 2013 и др.].

Таким образом, направленность данной работы на построение протеомных баз данных, предназначенных для изучения вопросов, относящихся к биохимии белков мышечных органов, а также для решения комплекса прикладных задач, включающих выявление потенциальных белковых биомаркеров различных форм патологии (в частности, рака простаты) в целом, определяет актуальность избранной темы.

Цель и задачи исследования

Основной целью данной диссертационной работы стало построение отечественных биоинформационных ресурсов (баз данных, размещённых в сети «Интернет») о белках ряда мышечных органов для оптимизации поисков новых белковых изоформ и определения тканеспецифичных белковых маркеров.

Для решения этой проблемы были поставлены следующие задачи:

1. Провести изучение протеомных профилей и анализ белкового полиморфизма в различных мышечных органах человека, а также некоторых культивируемых клеточных линиях, направленных на выявление изоформ с единичными аминокислотными заменами.

2. Изучить биохимические проявления дифференциальной генной экспресии при клеточной дифференцировке и в онтогенезе мышечных органов человека.

3. Разработать общие принципы построения многомодульных протеомных баз данных и создать на их основе отечественную базу данных «Протеомика мышечных органов» для определения тканеспецифичных белков и анализа белкового полиморфизма в различных мышечных органах человека.

4. Сформировать новую версию отечественной базы данных «Протеомика рака простаты», включающую комплексные модули, обобщающие результаты протеомного анализа отдельных белковых препаратов, для определения потенциальных биомаркеров этого заболевания

5. Провести с помощью построенных протеомных баз данных поиск так называемых безымянных (unnamed), гипотетических (hypothetical) и других малоизученных белков в образцах тканей и культивируемых клеточных линиях человека.

6. Разработать на основе протеомных исследований метод, пригодный для контроля качества мясной продукции по белковому составу с определением видовой специфичности мышечных белков и выявлением белковых добавок немышечного происхождения.

Научная новизна.

В ходе протеомных исследований в тканях мышечных органов и культивируемых клетках человека выявлены различные варианты биохимического полиморфизма белков, обусловленные единичными аминокислотными заменами (single amino acid substitution, SAAS), включая новый вариант триозофосфатизомеразы 1 (SAAS 233G-»D), определены частоты встречаемости в славянских выборках аллельных вариантов с SAAS 4IE—»A А3,5-А2,4-диеноил-коэнзим А изомеразы и мышечной енолазы с SAAS 71 N—» S, а также разрешены в одну из сторон «конфликтные» определения (по 135 позициям) в аминокислотных последовательностях 59 белков человека.

На основе специально разработанных общих принципов построения многомодульных протеомных баз данных сформирована новая версия отечественной базы данных «Протеомика мышечных белков человека», содержащая новые комплексные модули «Белки миокарда» и «Белки миобластов», а также новая версия (2012 г.) отечественной базы данных «Протеомика рака простаты», содержащая новый комплексный модуль «Белки клеток DU-145», в котором обобщены результаты протеомного анализа суммарных белков этих клеток и отдельных белковых препаратов (ядерные белки, гистоны, фосфопротеины), включая сведения о 78 идентифицированных белках.

Получены новые данные, прямо подтверждающие существование пяти безымянных белков (продуктов локусов ВАС05360, BAG63245, ВАШ 1721, BAG53005, ВАС05009, зарегистрированных в GenBank) в образцах ряда тканей и клеточных линиях человека.

В биоптатах предстательной железы человека, а также в культивируемых клетках линии DU-145 выявлено семь укороченных белковых продуктов, которые соответствуют белкам человека, предсказанным ранее по материалам исследований геномной ДНК и/или соответствующих

мРНК; таким образом, впервые обнаружено существование особых укороченных изоформ у некоторых известных белков (тропомиозина 3, поли (А) связывающего белка 1, фосфоглюкомутазы 3 и др.).

Научно-практическая значимость

Сформированные отечественные информационные ресурсы «Протеомика мышечных белков человека» (версия 2012 г., http://mp.inbi.ras.ru) и «Протеомика рака простаты» (версия 2012 г., http://ef.inbi.ras.ru) доступны пользователям сети Интернет и позволяют оптимизировать соответствующие протеомные исследования, направленные на поиски потенциальных белковых биомаркеров тканевой специфичности. База данных «Протеомика рака простаты» включена в Государственный реестр баз данных (регистрационный номер 2012620676 от 13.07.2012). Результаты этой работы использованы в трех информационно-методических письмах, которые нашли применение в учебном процессе при подготовке врачей-урологов (включены в курс последипломного образования по урологии, кафедра урологии РМАПО), а также в обучении студентов и аспирантов кафедры биохимии РУДН (элективный курс «Клиническая биохимия»).

Показано, что исследования и анализ на основе протеомных баз данных позволяет решать широкий круг биомедицинских вопросов, связанных с обнаружением полиморфных белков, а также с выявлением изменений протеомных профилей в ходе клеточной дифференцировки, онтогенеза мышечных т�