Бесплатный автореферат и диссертация по биологии на тему
Метод количественной обработки результатов цитофлуориметрического анализа хромосом человека
ВАК РФ 03.00.02, Биофизика
Автореферат диссертации по теме "Метод количественной обработки результатов цитофлуориметрического анализа хромосом человека"
МОСКОВСКИЙ ФИЗИКО-ТЕХНИЧЕСКИЙ ИНСТИТУТ ФАКУЛЬТЕТ ФИЗИКО-ХИМИЧЕСКОЙ БИОЛОГИИ г „. л -.КАФЕДРА МОЛЕКУЛЯРНОЙ БИОФИЗИКИ
г 1 о ОМ
1 4 ШОП 1ЯЯ7
На правах рукописи
КРАВАЦКИЙ Юрий Всеволодович
Метол количественной обработки результатов цитофлуориметрического анализа хромосом человека
03.00.02-Биофизика
Автореферат диссертации на соискание ученой степени кандидата физико-математических наук
Москва, 1997 г.
Работа выполнена на Кафедре молекулярной биофизики факультета физико-химической биологии Московского физико-технического института и в Институте молекулярной биологии им. Энгельгардта РАН
Научный руководитель:
кандидат физико — математических наук А.И. Полетаев
Официальные оппоненты:
доктор физико—математических наук, проф. В.А. Печатников
доктор физико-математических наук A.C. Заседателев
Ведущая организация: кафедра биофизики физического факультета Московского Государственного Университета
Защита состоится
1997 года в ч^ часов на заседании Диссертационного Совета К 063.91.10 при Московском Физико—Техническом Институте (141700, Московская область, г. Долгопрудный, Институтский пер., 9, Московский Физико—Технический Институт)
С диссертацией можно ознакомиться в Диссертационном Совете К 063.91.10 при Московском Физико—Техническом Институте
Автореферат разослан
1997 г.
Ученый секретарь
Диссертационного Совета,
кандидат физико — математических наук
В.Б. Киреев
Общая характеристика работы
Актуальность проблемы. Среди различных методов анализа хромосом одним из аиболее современных и эффективных является цитометрия и сортировка в потоке. Этот ме-эд позволяет не только с большой скоростью получать базовые количественные характери-гики всех хромосом, составляющих геном, но и проводить выделение фракций отдельных ромосом, что актуально при проведении работ по созданию хромосом-специфичных клоно-ж. Высокая скорость анализа и его объективность определили быстрое развитие этого ме-зда и его современную популярность.
Данная работа посвящена количественному анализу хромосом человека в потоке. Ин-ормация о хромосомном наборе заключена в экспериментально получаемых статистиче-шх распределениях интенсивностей флуоресценции хромосом. Обработка эксперименталь-ых данных имеет несколько целей: определение относительного размера хромосом, состав-ыощих кариотип; соотнесение пиков на гистограмме (проточном кариотипе) с конкретны-и хромосомами; детекция хромосомных перестроек в исследуемой линии клеток; опреде-ение оптимальных параметров для сортировки хромосом, а также оценка чистоты иолучае-ых хромосомных фракций. В подавляющем большинстве современных работ такой анализ роводится лишь визуально, что не позволяет получить значительную часть потенциально оступной информации. Создание методов количественного анализа проточных кариотипов озволит увеличить информативность подхода и объективность получаемых сведений.
Цель работы - расширение аналитических возможностей метода проточной ци-зфлуориметрии в применении к хромосомам путем создания средств количественной обмотки результатов цитофлуориметрического анализа хромосом, реализованных как серия рограммных пакетов для доступных персональных компьютеров ЮМ. Это позволит полу-пъ объективную количественную информацию о экспериментальных распределениях, и, 1едовательно, расширить как аналитические возможности метода, так и область применена хромосомного анализа для серийных клинических приложений.
Научпая новизна. Создана процедура количественного анализа проточных ка-аотипов, работающая в интерактивном режиме и позволяющая учитывать при анализе ап-иорную информацию об объекте. Процедура, являясь комбинированной, обеспечивает на шдом этапе анализа альтернативные методы обработки данных, что обеспечивает гибкость выработку оптимальной стратегии анализа. При анализе используется принципиально по-ай метод фильтрации примесных сигналов в экспериментальных разложениях с использо-
ванием быстрого преобразования Фурье. Предложена модель изменения формы функции описывающей примесные сигналы, обусловленные наличием в исходной суспензии обломков хромосом и клеточных фрагментов. Принципиальная модификация существующих методов разложения экспериментальных результатов на элементарные компоненты основана па комбинировании существовавших методов анализа с введением физической модели t процесс разложения, что позволило сделать процедуру разложения устойчивой и имеющее физический смысл.
Тестирование процедуры продемонстрировало высокое разрешение комплекса методов анализа (высокая достоверность определения относительных размеров хромосом) и устойчивость процесса разложения. Точность анализа обеспечивает детектирование хромосомных различий н перестроек размером до 500 000-700 ООО пар нуклеотидов, что являете} рекордной точностью. К тому же, примененные методы визуализации двупараметрическш распределений позволяют практически безошибочно идентифицировать пики хромосом.
Практическая ценность. Разработанные методы анализа были применены i анализу экспериментальных данных, полученных на лазерном проточном цитофлуориметр АТС-3000 (Brucker). Практическим результатом работы являются работоспособные про граммные пакеты для персональных компьютеров, что делает анализ хромосом человека i потоке доступным не только для лабораторий, но н для серийных клинических применений Более чем двухлетний опыт использования разработанного подхода показал его эффектив ность и надежность. Программные пакеты переданы пользователям, работающим над про блемой хромосомного анализа в рамках ГНТПР "Геном человека".
Апробация работы. Основные результаты докладывались на Всесоюзных и Все российских научных конференциях "Геном Человека" (1991, 1993); на международных кон грессах: XV Congress of International Society for Analytical Cytology (1991), XVII Congress с International Society for Analytical Cytology (1994). Программные пакеты апробировались использовались в Группе цитометрии и выделения хромосом Института Молекулярной Бис логии РАН (Москва), а также в Институте цитологии РАН (С.-Петербург), и на XV] Congress of International Society for Analytical Cytology (Lake Placid, USA).
Публикации. По материалам диссертации опубликовано 6 работ.
Структура и объем работы. Диссертация состоит из 8 глав, включающих вве дение, выводы, заключение и приложение. Главы 2-4 посвящены анализу результатов одне параметрического анализа, глава 5 - анализу результатов двупараметрического анализа. Ди< сертация содержит обзор литературных данных согласно темам глав. Диссертация изложен на вь страницах, содержит б таблиц и 23 рисунка. Библиография включает 57 наимешж ний.
Содержание работы
{ведение.
Во введении описаны принципы проточной цитометрии, се гепезис и круг совремеп-[ых примепений. Обсуждается актуальность развития аналитических возможностей метода. "лава 2. Цитометрия в потоке: основные принципы и области применения.
Проточная цитометрия базируется па идее подачи объектов исследования в зону ана-шза с помощью гидродинамически сфокусированного потока буфера. При прохождении че->ез узкую освещенную зону у исследованного объекта могут автоматически измеряться одна ши несколько оптических характеристик: величина светорассеяния под определенными уг-гами, интенсивности флуоресценции в заданных интервалах длин волн, а также другие па->аметры. На основе проведенных измерений строятся статистические распределения, кото->ые позволяют проводить объективную классификацию микрообъектов исследуемого образ-1а.
Исследование хромосом человека и животных занимает особое место в проточной ци-;ометрии, поскольку является не только эффективным средством для получения многопара-летрической цитогенетической информации, но также позволяет проводить препаративное наделение фракций индивидуальных хромосом, материал которых затем используется для юздания хромосом-специфичных библиотек рекомбинантных фрагментов ДНК. Объем и (остоверность информации о кариогипах, а также качество (чистота) выделяемых хромо-;омных фракций зависят не только от приборных и методических факторов при проведении жсперимента, но и от корректности процедуры анализа экспериментальных распределений.
Метод доказал свою эффективность при классификации хромосом, выделенных из шеточных линий человека различного типа, таких как: фибробласты, лимфоциты, амниоци-гы и др. Полученные в результате экспериментального анализа так называемые проточные щриотапы позволяют исследовать транслокацшг, делеции, полнсомию (например, синдром Цауна), не говоря уже о выпадении целых хромосом (синдром Тернера).
Приведены характеристики типичного проточного цитофлуориметра-сортировщика и проанализированы приборные факторы, определяющие точность и скорость проводимых измерений, включая оптические и электронные компоненты.
Описаны основные источники для получения суспензии метафазных хромосом ^клеточные линии разных типов) и главные элементы технологии получения хромосомных :успензий. Отдельно рассматриваются факторы, определяющие аналитическое качество поручаемых распределений хромосомных сигналов.
Отдельно рассматриваются требования к ДНК-специфичным флуорохромам, используемым для окрашивапия хромосом. Сюда относятся как критерии, связанные с оптическими
характеристиками: положения полос поглощения и флуоресценции, величина квантовой выхода, - так и параметры комплексообразования с ДНК: специфичность к последовательностям и кинетика комплексообразования.
Описаны также специфические особенности двухпараметрического анализа хромосом, проводимого с использованием двух флуорохромов: специфичных к АТ- и ОС-пара_\ оснований ДНК. Такой анализ осуществляется на двулазсрном проточном цитофлуориметре поскольку флуоресценцию каждого из красителей необходимо возбуждать в отдельном диа пазоне длин волн. Результаты анализа визуализируются в виде цитограмм, на которых каж дому событию соответствуют две координаты: абсцисса соответствует интенсивности ОС специфической флуоресценции, а ордината - интенсивности АТ-специфическсй флуоресцен ции. Таким образом, флуоресцентные интенсивности большого числа хромосом образую' двупараметрическое распределение, каждое сгущение точек которого (пик в изометрическо» отложении) образовано сигналами хромосом одного или нескольких типов. Перекрытие пи ков в распределении зависит от различий между хромосомами, качества хромосомного пре парата и собственно приборного разрешения. Дискриминация хромосом человека при дву мерном анализе выше, чем в случае одномерного распределения, что объясняется располо жением пиков не в одном, а в двух измерениях. Глава 3. Анализ данных проточной цнтометрии. 3.1. Опнсавие объекта апализа
Проточный кариотип состоит из ликов, каждый из которых образован сигналами од ной или нескольких хромосом. Кроме того, практически всегда на "чистый" кариотип на кладывается фон, образованный фрагментами хромосом, остатками ядер, цитоплазмы, также хромосомными агрегатами. Проточный кариотип содержит следующую количествен ную информацию о хромосомах анализируемых клеток:
1. Положение среднего значения для хаждого пика в распределении определяете размером (типом) хромосомы, образующей этот пик.
2. Площадь (или объем в двумерном случае) пика пропорциональна частоте присутс вия данной хромосомы (хромосомной группы) в популяции.
3. Коэффициент вариации, СУ, каждого пика отражает точность цитометрическог анализа и качество хромосомного препарата, а также возможные различия между гомолс гичными хромосомами.
4. Площадь (или объем) фоновых загрязнений определяется как количеством хроме сомных аберраций, так и артефактными загрязнениями, появляющимися в процессе выдел* ния хромосом. Этот параметр может быть информативным при исследовании индуцирова! ных хромосомных повреждений.
Кроме того, эта информация необходима для выбора критериев сортировки хромосом и оценки чистоты получаемых фракций, также как и эффективности самого процесса сортировки. Сам процесс анализа должен состоять из двух основных этапов: процедуры отделения загрязняющих сигналов, а затем определения характеристик отдельных компопент (пиков) "отфильтрованного" распределения. •
Анализ показывает, что сформулированная задача является математически некорректной, так как, во-первых, не существует ее однозначного решения, и, во-вторых, чем большее число кривых будет принято в качестве компонент разложения, тем более точно будет описан ими анализируемый составной пик. Подобный подход лишен физического смысла. Огромное число степеней свободы делает формальное разложение на исходные пики бессмысленным, и полученные таким путем результаты не отражают реальные параметры объекта. Для корректного разложения в основу должна быть положена конкретная физическая модель объекта, которая описывает и связывает реальные физические характеристики объекта (в данном случае - набора хромосом). Наличие модели и характер информации накладывают определенные ограничения на процесс разложения и не только уменьшает число перебираемых вариантов, но и удерживает сам процесс разложения в рамках физической реальности. Точность и реалистичность проводимого разложения определяются адекватностью выбора физической модели.
3.2. Анализ одиопараметричсских проточных карнотитов
На рис.1 приведен пример экспериментальной гистограммы хромосом человека. Кроме набора пиков, соответствующих отдельным хромосомам п группам из нескольких (сромосом, в экспериментальное распределение вносят вклад и "артефактные" примесные компоненты. Во-первых, это хромосомные агрегаты, которые присутствуют в образце в результате нерасхождения хромосом при приготовлении суспензии, а также из-за вторичной агрегации хромосом в процессе хранения суспензии. Хромосомпые агрегаты четко различимы в правой части гистограммы: область С на гистограмме. Во-вторых, фрагменты статиста-тески случайно поломанных хромосом, появляющиеся в процессе приготовления хромосом-яой суспензии, и фрагменты цитоплазмы разрушенных клеток, способные в той или иной ледени неспецифически адсорбировать используемый для окраски хромосом краситель: область В на гистограмме. 3.2.1 Математическое описание проблемы
Фундаментальным предположением, используемым при анализе хромосомных распределений. получаемых при флуориметрическом анализе в потоке, япляется то, что отдел:,-иые пики, соответствующие хромосомам отдельных типов, имеют форму гауссиан. Правомерность этого предположения была проверена экспериментально с использованием флуо-
Рис. 1 Экспериментальное распределение интенсивностей флуоресценции хромосом, полученных из фибробластов человека и окрашенных красителем Н33258. По абсциссе отложены номера каналов накопления, пропорциональные интенсивности флуоресценции проанализированных объектов, по ординате -число событий с интенсивностью, соответствующей данному каналу. Б - арте-фактные сигналы от хромосомных обломков и фрагментов клеточной цитоплазмы, С - сигналы от хромосомных агрегатов.
ресцирующих микросфер как тестового объекта. Экспериментальные распределения хромо
сом могут быть представлены выражением:
Я(х) = 2
А>
( ( \гЛ
1
2 Ч 1 ffJ ))
+ В(х) + С(х),
(1)
где Aj - число хромосом типа j, и: - стандартное отклонение сигнала для j, |iy среднее значение распределения, образуемого хромосомой типа j, В(х) - артефакгаый сиг нал, образованный разбитыми хромосомами и агрегатами фрагментов цитоплазмы, С(х) сигналы от хромосомных агрегатов.
Соотношение между коэффициентом вариации CV и параметрами //, и сг, дается со отношением CV, = <т, //j; что позволяет выражать начальные оценки и результаты в обще принятых в цитологии параметрах. Поскольку применение для аппроксимации эксперимен тальпых гауссиан дает точность аппроксимации в пределах экспериментальной ошибки, т применение других функций для аппроксимации экспериментальных данных не требуете; Анализ хромосомных распределений разбивается на этапы: выделения вкладов В(х)
С (х), вычитания их из суммарного распределения Н (х) и разложения полученного распределения II (х)* на гауссовы компоненты. Деконволюция распределения II(х) * осуществляется с использованием вычислительных методов. 3.2.2 Методы, применяемые при анализе однопараметрических данных
Проанализированы методы, применявшиеся при анализе проточных карнотитов: моментов, графический, преобразования Фурье, отсечения, максимального подобия, наименьших квадратов, наименьших квадратов в частных производных. Выполнено их сравнение в трименении к анализу однопараметрических проточных кариотипов. Показано, что ни один и описанных ранее методов не допускает прямого применения, так как это приведет к неод-гозначности разложения. Прямое применение традиционных подходов представляется нереальным, поскольку адекватная прямая вариация параметров 24 пиков (всего 72 параметра) является задачей, требующей огромного машинного времени даже на ЭВМ высокой производительности.
Проведенный анализ позволил сформулировать основу новой стратегии разложения, [(ля анализа проточных кариотипов предлагается процедура, которая представляет собой -ибрид метода последовательных отсечений с последующей аппроксимацией методом наименьших квадратов с наложением ограничений, вытекающих из физической модели процес-;а. На предварительном этапе используется разработанный оригинальный подход к про-злеме фильтрации примесных сигналов.
Глава 4. Разложение однопараметрических распределений па компоненты. (.1. Предварительная обработка данных
Если объем выборки в экспериментальной гистограмме достаточно велик: 100.000-!00.000 событий или больше, что соответствует не менее 5.000-10.000 событиям на один пик, ■о гистограмма может подвергаться разложению без предварительного сглаживания. При дап.ших объемах выборки целесообразно применять операцию сглаживания статистических >азбросов в массиве для повышения устойчивости процедуры последующего разложения, юскольку анализ базируется на использовании гладких функций. Анализ имеющихся методе сглаживания позволил выработать оптимальный подход для решения этой задачи.
В программном пакете реализованы следующие функции предварительной обработки щнопараметрических проточных кариотипов: масштабирование и сдвиг экспериментально-
0 распределения вдоль обеих осей; нормализация проточного кариотипа вдоль оси абсцисс
1 случае нелинейного искажения во время накопления данных; интерполяция оеуществ-гастся методами Лагранжа, Ньютона, сплайнами третьей и пятой степени; сглаживание оеу-цествляется как линейным методом с изменяемым весом точки, так и Фурье-сглаживанием с «меняемым размером окна сглаживания, а также сглаживанием В-сплайнами с изменяемы-ш параметрами сглаживания.
4.2. Удаление артефактиых сигналов
Удаление сигналов разбитых хромосом и фрагментов цитоплазмы. Удаление ар-тефактных сигналов производится, начиная с вклада В (х) - сигнала, образованного разбитыми хромосомами и агрегатами фрагментов цитоплазмы. В одномерном случае этот сигнал описывается степенной функцией:
В(х)=В1+В2(х-В3)° (2)
Также может использоваться экспонепциальпое приближение:
В(х) =Ве°* (3)
В этих выражениях коэффициенты В, и И - варьируемые параметры. Сигнал В (х) не
только накладывается на хромосомные сигналы, но и простирается в область сигналов более слабых, чем сигналы самых малых хромосом (см рис. 1, область В). Этот факт позволяет проводить аппроксимацию вклада В (х) и выбор аналитической модели в области свободной от хромосомных сигналов.
Удаление сигналов хромосомных агрегатов. После вычитания из массива вклада В (х) производится удаление второй артефактной компоненты С(х) - сигналов от хромосомных агрегатов. Обычно для этого применяется одна из функций
С{х) = а + Ьх + схг (4)
(5)
где 0(х,/ис,(тс,Лс) - гауссова функция, параметры которой аналогичны таковым в выражении (1). Выбор одной из этих моделей производится в соответствии с оценкой специфических особенностей реального массива и результатами его пробной аппроксимации. Процедура разложения позволяет выбирать любую из перечисленных моделей. Выбор конкретного выражения для аппроксимации зависит от величины вклада С (х), которая можез варьировать от образца к образцу. Для оценки качества аппроксимации используется обласп гистограммы правее пиков самых больших хромосом (зона С на рис.1), а также некоторые участки гистограммы между хорошо разделенными пиками.
Кроме того, для учета вклада С (х) был разработан альтернативный подход, не применявшийся ранее для подобных задач. Подход основан на том, что распределение сигнало! от хромосомных агрегатов в Фурье-образе суммарного распределения представляет собсл модификацию Фурье-образа истинного хромосомного распределения. Для восстановление формы "чистого" хромосомного распределения необходимо выполнить интегральное преоб разованне Фурье над экспериментальным массивом Н{х) *, затем отсечь в Фурье-образ частоты, соответствующие хромосомным агрегатам, и восстановить отфильтрованное рас пределение Н{х)* * с помощью обратного преобразования Фурье.
Рассмотрим формально как формируются загрязнения типа С(х), обусловленны слипанием хромосом (см. (1)), через функции, описывающие распределения неслипшихс
а
хромосом. Экспериментально получаемое распределение сигналов можно представить в виде непрсрьпзпой функции #(со), образуемой сигналами единичных хромосом без примесей /(со), и некоторой функции, /*(ю), отражающей вклад слипшихся хромосом (другие примеси сейчас не рассматриваются). Проанализируем происхождение функции слипания /'(о).
Будем исходить из предположения, что процесс слипания случаен и что слипание всех типов хромосом равновероятно. Кроме того, будем рассматривать только парные слипания, а тройные агрегаты ввиду малой вероятности их образования учитывать не будем. Аргументом искомой функции распределения попарно слипшихся хромосом /'{&)■ является интенсивность со. Опа складывается из некоторой интенсивности ¡-й хромосомы в сумме с интенсивностью з-й хромосомы /у т.е. а = /, +1 у Поскольку функция /(со) представляет собой частотное распределите, то частота появления агрегатов с сигналом со пропорциональна произведению: /ц((о) = к-/(/,)"где ^пропорционален вероятности слипания. Обозначим следовательно, тогда /'(а>)~ к-/(со-/(г) Поскольку в дан-
ной точке со наблюдаются агрегаты всех парных комбинаций хромосом, для которых выполняется условие 1, + /. то данное выражение необходимо проинтегрировать по всем значениям / . Следовательно, функция, описывающая распределение слипшихся попарно хромосом, представляет собой свертку функции распределения чистых хромосом с самой собой, и имеет вид: <й
/*(«) = «• |/(ш-0/(()Л (6)
где а - некий числовой коэффициент, определяемый вероятностью слипания и нормировочным множителем. Реально интегрирование дает ненулевой результат только в ограниченной области значений аргумента со. Таким образом, разложение исходного проточного кариотипа к(со), полученного в результате эксперимента, на сумму функции "чистых" хромосом /(со) и примесной функции, можно записать в виде:
£(й))= /(ы) + а- ]да»-0-/(0Л (7)
После проведения преобразования Фурье по теореме о свертке получим для Фурье-образов следующее выражение
= + «■*'<£)*'(£> (8) Выражая С(^) и через компоненты в комплексном виде, получаем для ком-
плексной функции Р(£) = х + /V квадратное уравнение
а,(£)+Ю2(£) = х-И> + а-(х + >у)г (9)
корректным решением которого явлется
2ог1 V ^2 8 а)
(10)
в,
У = | \ ч (11)
4 а
где
ч 2 8«;
Следует отметить, что при реальной обработке данных необходим корректный подбор коэффициента преобразования Фурье-образа а. Как правило параметр а =1-10 6 и может быть подобран в результате проведения сравнительного анализа проточного кариотипа до и после очистки в районе больших хромосом - 1,2. В случае использования большего значения сс (а=М0~!) при обработке реального массива данных со статистическими шумами наблюдается возбуждение схемы обработки, что приводит к появлению после обратного Фу-рье-преобразоваяия периодических компонент высокой амплитуды, полностью маскирующих искомый оригинальный массив.
Удаление сигналов хроматид. На следующем этапе процедура разложения позволяет также выделить из экспериментальной гистограммы еще один тип примесных сигналов: сигналы от хроматид, попадающих в хромосомную суспензию из небольшого процента по-стмитотических клеток. Распределение хроматид по интенсивиостям флуоресценции должно быть копией распределения от митотических хромосом, но с половинными интенсивностя-ми, поскольку хроматиды по содержанию в них ДНК представляют собой половины митотических хромосом (т.е. их распределение будет сжато по абсциссе в два раза). Присутствие подобных сигналов можно заметить на приведенных выше гистограммах (рис.1): у третьего с левой стороны пика имеется небольшое плечо справа. Это плечо можно было бы приписан случайным вариациям при накоплении гистограммы, если бы оно не соответствовало по по ложению деленной на два интенсивности главного пика, образованного сигналами группь хромосом 9-12.
В пакете реализована аппроксимация и устранение сигнала, образованного разбитым! хромосомами и агрегатами фрагментов цитоплазмы, которая осуществляется
1. В случае преобладания малоразмерных фрагментов функцией вида:
(13)
2. В случае преобладания крупных фрагментов функцией вида:
Л(х) = т£т (И)
Ух-Б
Аппроксимация и устранение сигналов, производимых агрегатами хромосом, осуществляет-;я либо параболической функцией, либо методом Фурье-преобразования, Кроме этого, мо-кет выполняться аппроксимация и устранение сигналов от хроматид.
После фильтрации исходного массива II(х) от загрязняющих компонент выполняет-:я основной этап предлагаемой процедуры: разложение отфильтрованного массива Н(х)* * 1а гауссовы полосы, соответствующие сигналам отдельных хромосом. 1.3. Разложение гистограмм ка составляющие пики.
Интегральная схема анализа, представляющая фильтрацию загрязнений и разложение жспериментального распределения на составляющие пики, приведена на рис.2.
Для разложения был разработан гибридный подход, совмещающий в себе метод последовательных отсечений и модифицированный метод наименьших квадратов. Разложение зедется с правой стороны гистограммы, то есть со стороны пиков от больших хромосом. гистограмма разбивается на группы пиков, между которыми пересечение минимально. В минимумах между экспериментальными пиками выбираются точки отсечения, а затем про-юдится аппроксимация гауссианами пиков в пределах выбранного участка. Результат ад-гроксимации вычитается из исходного массива и последовательно проводится разложение ;ледующей группы пиков, расположенных слева. Этот процесс продолжается вплоть до пиков самых мачых хромосом слева.
Если число компонент, составляющих экспериментальный групповой пик, известно, го задача формулируется следующим образом: требуется найти такие параметры компонент разложения, чтобы их огибающая была максимально близка к экспериментальным данным.
Основой физической модели, используемой при разложении, служат априорные цито-генетические данные, а также естественные представления о процессе экспериментального исследования проточного кариотипа. Например, в общем случае интегралы кривых (площади пиков, количество) двух гомологов одной хромосомы должны быть практически идентичны, 1 коэффициенты вариации СУ должны быть величинами одного порядка ввиду высокого физического подобия этих гомологов как объектов.
Результатом использования рассматриваемого подхода является то, что вопросы об однозначности и верности разложения относятся не к математической процедуре, а к физической модели, которая является в достаточной степени наглядной и подлежит обсуждению ; гораздо большей легкостью, чем корректность применяемого математического аппарата.
Если <р(х,!и,£0,о,р) - функция, описывающая один пик экспериментального распределения, где е0 - максимум пика, ц - координата максимума, а - полуширина пика, р - асимметрия, х - абсцисса, то для решения поставленной задачи разложения на составляющие пики требуется найти минимум функционала:
1. Аппроксимация параболой
2. Метод БГТФ
1000 -
500 •■
О 100 200
Рис. 2 В процессе разложения на исходные компоненты используются следующие методы:
1. Метод отсечения для отдельных пиков и/или групп пиков.
2. Метод наименьших квадратов, включающий:
а. использование определенной физической модели
б. минимизацию по схеме сходящихся градиентов Fletcher-Reeves
(15)
где индекс х нумерует каналы гистограммы, для которых известны экспериментальные значения, а индекс / = 1,..., Ь - номер пика в данном распределении. Одним из лучших методов, разработанных для минимизации, является метод сходящихся градиентов, разработанный Флетчером и Ривсом.
Таблица. Результаты разложения распределения шггенсивностей
флуоресценции хромосом человека на гауссовы компоненты
Номер [DNA] Площадь Полуширина CV
хромосомы GO (Jo,(*)Ä) (2,35 о,) К / Ц.)
1а 221.5 504 5.9 0.0111
1Ь 216.9 504 6.0 0.0117
2а 216.9 711 6.0 0.0117
2Ь 212.2 711 6.2 0.0124
За 189.1 712 4.1 0.0091
ЗЬ 187.4 713 3.9 0.0088
4а 186.1 775 4.2 0.0095
4Ь 183.7 776 4.1 0.0094
5а 173.6 993 6.5 0.0159
5Ь 169.9 993 6.7 0.0167
6а 164.3 797 3.7 0.0096
6Ь 161.3 797 3.9 0.0103
X 152.5 1214 6.2 0.0174
7а 150.1 1059 4.2 0.0118
7Ь 147.1 1058 4.1 0.0119
8а 139.3 1638 5.4 0.0165
8Ь 132.9 1638 5.6 0.0180
9-12 127.2 1323 4.6 0.0154
9-12 126.2 1323 4.6 0.0154
9-12 126.6 1322 4.8 0.0162
9-12 122.8 1322 4.4 0.0153
13а 112.5 753 4.8 0.0180
13Ь L 109.9 753 4.4 0.0172
14а 101.3 702 3.4 0.0142
14Ь 99.3 702 3.6 0.0154
13С (?) 96.0 703 3.0 0.0132
15а 91.1 941 3.9 0.0181
15Ь 86.7 941 3.9 0.0193
16а 82.2 846 3.0 0.0156
16Ь 80.4 845 3.0 0.0158
18а 78.6 568 3.4 0.0182
18Ь 76.9 568 3.2 0.0176
17а 72.8 683 2.7 0.0155
17Ь 71.8 682 2.9 0.0169
20а 61.6 570 2.4 0.0166
20Ь 60.5 570 2.3 0.0160
19а 50.8 568 2.3 0.0195
19Ь 51.0 569 2.5 0.0210
21,22 47.5 517 2.5 0.0225
21,22 46.2 517 2.7 0.0250
21,22 44.2 439 2.5 0.0237
21,22 44.1 439 2.3 0.0218
Используя этот метод, на варьируемые параметры налагается ряд ограничений в соответствии со свойствами выбранной модели. Например, па рис. 1-2 правый пик гистограммы гостоит из сигналов двух самых больших хромосом 1 и 2. Поскольку каждая хромосома представлена двумя гомологами, то при разложении этого пика производится поиск параметров четырех гауссиан с попарно близкими коэффицинтами вариации и равными в преде-мх точности площадями.
Результат аппроксимации вычитается из стартового массива и производится разложение следующего пика слева, который соответствует хромосомам 3 и 4 (тоже четыре гауссиа-
ны). Естественно было потребовать, чтобы коэффициенты Л] (относительное число в выборке) для хромосомных гомологов были с высокой точностью близки. Такое же ограничение накладывается на величины а у - ширины пиков (или соотвествующие им коэффициенты вариации). Введение ограничений делает автоматическую процедуру минимизации выражения (15) более устойчивой, обеспечивая сходимость этого процесса.
Таким образом, процедура разложения строится на интерактивном принципе, что позволяет не только решить задачу разложения экспериментального распределения на компоненты по частям, но также учитывать известные особенности конкретного хромосомного набора, подвергаемого анализу. Как видно из рис.2, пики па экспериментальной гистограмме располагаются в виде отдельных групп, что позволяет проводить поэтапное разложение на составляющие компоненты, двигаясь со стороны больших сигналов. Как уже упоминалось выше, этот подход эквивалентен упомянутому "методу отсечений", но при этом используется автоматический режим разложения для пиков выбранной группы. После завершения разложения по всем группам пиков производится реконструкция всего распределения по результатам аппроксимации. Полученное разложение может быть сопоставлено с любым из промежуточных массивов данных // (х). Параметры отдельных компонент, полученные в результате разложения, сводятся в отдельную таблицу (см. Таблица). 4.4. Анализ и проверка достоверности полученных результатов
Анализ приведенных в Таблице результатов конкретного разложения проводится поэтапно: идентифицируются "очевидные" хромосомные пики, а затем области различий с нормальным кариотипом. На рис.3 в виде цифр - номеров хромосом - приведены результаты идентификации для исследованного нами кариотипа. Такого рода анализ показывает, что в исследуемом кариотипе наблюдаются как минимум две аномалии. Во-первых, наблюдается дополнительный пик в области хромосом 14-15, который подтверждает цитогенетическую информацию о данной клеточной линии - кариотип характеризуется трисомией по хромосоме 13. Однако, дополнительная хромосома 13 имеет размер примерно на 25% меньше размера нормальных гомологов. Во-вторых, в области сигналов хромосомы 8 наблюдается завышенное количество хромосом, что может быть связано с транслокацией части дополнительной хромосомы 13 на одну из хромосом группы 9-12. Такая транслокация должна уменьшить сигнал третьего гомолога хромосомы 13 и наоборот - несколько увеличила сигнал хромосомы-реципиента. Проверка сформулированной интерпретации должна производиться в независимом эксперименте другого типа. Следует отметить, что второй из вышеприведенных выводов без количественного анализа гистограммы сделать просто не представляется возможным.
Последний этап процедуры - оценка статистической достоверности проведенной ап-оксимации. Такая оценка производится путем вычисления параметра х2:
г=Е(^(Я(х()-С(х()))2 (16)
где параметр I соответствует номеру капала гистограммы, Н (х,) - эксперименталь-
я амплитуда в канале /, б (ж,) - аппроксимирующая функция, - весовой коэффициент, ^скольку II (х) представляет собой частотное распределение, коэффициенты 1У, соответ-вуют распределению Пуассона и даются выражением: 1
(17)
900 V
450 ..
Рис. 3 Исходная гистограмма, полученная экспериментально, - кривая 1, результат разложения отфильтрованного массива на гауссовы компоненты -кривая 2. Номера над пиками соответствуют номерам хромосом по результатам проведенной идентификации.
ычисление выражения (17) позволяет получать сравнительную оценку качества проведен-
ого разложения и оптимизировать стратегию самой процедуры в соответствии с характером
онкретных экспериментальных данных. Анализ серии однотипных гистограмм полученных
ля одного и того же объекта показал, что статистический разброс положения пиков имеет
орядок 0.3%-0.5%. Это свидетельствует о точности в определении размера хромосом 0.2-0.8
[иллиона пар оснований.
Глава 5. Анализ авупараметрических проточных кариотипов 5.1. Постановка проблемы
На рис.4 приведены экспериментальное и синтезированное в результате анализа дву-параметрические распределения. Кроме набора пиков, соответствующих отдельным хромосомам и группам из нескольких хромосом, в экспериментальное распределение вносят вклад и артефактные примесные компоненты. Предполагается также, что отдельные двупарамет-рические пики, соответствующие хромосомам отдельных типов, имеют форму двупарамет-рических гауссиан. Это предположение также было проверено экспериментально с использованием флуоресцирующих микросфср, и показало что получаемые двупараметрические пики по форме соответствуют гауссовым распределениям с точностью большей, чем статистическая точность разложения. Таким образом, экспериментальный двупараметрический набор данных может быть представлен выражением:
где VJ - число хромосом типа ], ах] - стандартное отклонение сигнала по оси х для типа}, ая - стандартное отклонение сигнала по оси у для типа ]ху - среднее значение распределения по оси х, - среднее значение распределения по оси у, образуемого хромосомой типа]. Параметр р является коэффициентом корреляции между переменными х и у и может принимать значения от-1 до+1. Если р*О, то считается, что х и у коррелируют в некоторой степени, иначе они являются независимыми (некоррелирующими) друг от друга. Физически ненулевое значение корреляции означает, что экспериментальные данные получены некорректно, например использованы неподходящие оптические фильтры, что приводит к смешению сигналов обоих красителей. В(х,у) -артефактный сигнал, образованный разбитыми хромосомами и агрегатами фрагментов цитоплазмы, С(х,у) - сигналы от хромосомных агрегатов. Аналогично однопараметрическим данным, процесс анализа экспериментальных распределений должен состоять из нескольких этапов: определения вкладов 13(х,у) и С(х,у), вычитания их из суммарного распределения Н(х,у) и разложения полученного распределения Н(х,у) * на гауссовы компоненты.
5.2. Методы, применяемые при анализе дву параметрических данных
В данном разделе рассмотрены: простой региональный, метод наименьших квадратов и метод наименьших квадратов в частных производных. Сделаны следующие выводы:
+ В(х,у) + С(х,у)
(18)
\
'ис. 4 Экспериментальное и синтезированное в результате анализа распределения интен-ивностей флуоресценции хромосом человека. Хромосомы окрашены красителями Н33258 в пнцентрации 2 мкг/мл и хромомицином АЗ в концентрации 20 мкг/л. По абсциссе - номера аналов накопления, пропорциональные интенсивности флуоресценции САЗ, по ординате -юмера каналов накопления, пропорциональные интенсивности флуоресценции Н33258, а по дпликате - число событий с интенсивностью, соответствующей данному каналу. В - регион ртефактных сигналов от хромосомных обломков и фрагментов клеточной цитоплазмы, С -игналы от хромосомных агрегатов.
Во-первых, в отсутствие фоновых загрязнений все три метода дают схожие оценки дяя относительного числа хромосом. Простой региональный метод дает результаты, согласованные с более "тяжелыми" вычислительными методами, что объясняется высоким разрешением двупараметрического проточного кариотипа и отсутствием фоновых загрязпеннй. Действительно, в случаях, когда пики перекрываются (большие хромосомы человека) или фоновые загрязнения велики, простой региональный метод привод ит к неверным оценкам.
Во-вторых, в случаях значительных фоновых загрязнений только метод наименьших квадратов в частных производных дает корректные значения аппроксимируемых параметров. Так, прямое применение оригинального метода наименьших квадратов к хромосоме 21 человека приведет к неверной оценке объема, и, вследствие, к пршшсаншо исследуемому ка-риотилу трисомии по этой хромосоме
В-третьих, средние значения распределений с высокой точностью могут быть оценены любым из методов. Анализ эмулированных данных подтверждает, что средние значения распределений являются наиболее стабильными аппроксимированными значениями для метода наименьших квадратов и метода наименьших квадратов в частных производных.
Таким образом, можно сделать вывод, что простой региональный метод является хорошим методом для получения начальных приближений для методов наименьших квадратог и метода наименьших квадратов в частных производных. Кроме того, использование методов как таковых без ликвидации фоновых загрязнений нецелесообразно, так как это приводит к получению неадекватных результатов аппроксимации. Следовательно, в сложной системе анализа ириючных карксткнсв применение стандартного метода наименьших квадратов следует признать более целесообразным, так как вычислительные затраты этого метод; мепьше, а реализация проще и подразумевает, как правило, модификацию стандартных, уж( реализованных алгоритмов.
5.4. Методы представления двупараметрических данных
Исследованы разные типы представления как экспериментальных данных, так и результатов их обработки. Сделан вывод, о том, что стандартное представление в виде контур ных карт или поточечной двуцветной карты явно недостаточно для проведения адекватной анализа кариотипа. Решение предложено в виде плоских карт 16-цветной плоской карты с оптамизнрованной серой шкалой. При этом возможно применение методов повышения цве тового разрешения с целью восстановления мелких деталей изображения без потери пространственного разрешения представления данных.
При построении трехмерных реалистичных изображений показана целесообразносп применения заливки по Гуро с простой моделью освещения с диффузным отражением ка1 обеспечивающих наилучшее соотношение качество/скорость построения.
Проблему устранения ступенчатости при передаче цвета предлагается решать аппрок-:имацией полутонами. При этом применяется метод улучшения визуального разрешения изображения с использованием нескольких дополнительных, искусственно созданных уровней интенсивности.
Трехмерные изображения двупараметрических проточных кариотипов, построенные с использованием этого метода, показали, что эффективное введение дополнительных 16 уровней интенсивности в дополнение к 16 стандартным позволяет восстанавливать даже мелкие детали изображения. Наилучшее качество трехмерного изображения дает комбинаты закраски Гуро с простым диффузным освещением с последующим применением метода тсевдослучайного возбуждения.
5.5. Разложение двупараметрических распределений на компоненты.
5.5.1. Предварительная обработка двупараметрических данных
Аналогично одпопараметрическому распределению в случае недостаточного объема шборки в экспериментальной гистограмме целесообразно применение операции сглажива-шя статистических разбросов в массиве для повышения устойчивости процедуры последующего разложения, а также применение операции интерполяции, которая обеспечит для госледующего анализа необходимую непрерывность функций, образующих проточный ка-эиотип.
5-5.2- Удаление артефактных сигналов из двупараметрических проточпых кариотипов
Удаление артефактных сигналов производится, начиная с вклада В(х,у) - сигнала, эбразованного разбитыми хромосомами и агрегатами фрагментов цитоплазмы. В двупара-нетрическом случае данный сигнал, как правило, описывается аналогично однопараметриче-жому случаю степенной функцией:
4 ' (* + Ь)(у + с)
которая является частным случаем двуполостного гиперболоида вращения. Максимум сигнала В(х,у) находится в области сигналов более слабых, чем сигналы самых малых хромосом см рис.4, область В). Этот факт позволяет проводить аппроксимацию вклада В(х,у) и вы-5ор аналитических параметров модели в области, свободной от хромосомных сигналов. Аналогично простому региональному методу выбирается регион интереса, в котором производится аппроксимация экспериментальных данных функцией вида (19).
После вычитания из массива вклада В(х,у) производится удаление второй артефакт-згой компоненты С(х,у) - сигналов от хромосомных агрегатов. Обычно для аппроксимации этого загрязнения применяется функция
С(х, y) = a + bx + cy + dxy + ex2 + f у2 (20)
В двупараметрическом кариотипе данный метод оценки фоновых загрязнений дает более удовлетворительные результаты, чем для однопараметрических данных. Тем не менее, эта стандартно применяющаяся при аппроксимации сигналов от агрегатов функция является физически некорректной, давая при некоторых наборах параметров отрицательные значения, что является физически некорректным (сумма двух гауссиан в принципе не может дан отрицательное значение). Исходя из этого, в работе была применена физически корректная аппроксимация трехмерной гауссианой.
Кроме того, повышение пространственного разрешения двупараметрического проточного. кариотипа, а также меньшая (относительно однопараметрических данных) степень переживания пиков позволяют в некоторых случаях применять простой, но эффективньй метод выкалывания пиков из загрязняющего фона, суть которого заключается в следующем.
Как известно, в пределах области 3 а от среднего значения распределения заключено 99,97% точек данного распределения, что позволяет применить для устранения фоновых за грязнений следующий алгоритм. Сначала определяются средние значения и стандартные от клоненяя всех распределений, составляющих кариотип (например, при помощи простого ре гионального метода или одной из его модификаций). Затем производится выкалывание дан ных из исходного кариотипа на расстоянии 3 а от каждого среднего значения распределения после чего на краях выколотых зон выполняется интерполяция для восполненния данных дс полного набора на регулярной сетке. После этого полученный набор данных, представляю щий фоновые загрязнения, вычитается из исходного проточного кариотипа. Следует отме тить, что применение для восполнения данных в выколошх регионах методов, обеспечи вагощих высокую степень гладкости интерполируемых данных (интерполяция сплайнами полиномами Лагранжа, бикубическая), нецелесообразно, так как происходит самовозбужде ние на границах выколотых регионов, что связано со стохастическим характером интерпо лируемых данных, включающих в себя белый приборный шум, хорошо заметный по сравне нию с другими загрязнениями кариотипа. Следовательно, в данном случае наилучшие ре зультаты обеспечивает тривиальная двумерная линейная интерполяция.
Выбор метода производится в соответствии с оценкой специфических особенносте: реального массива и результатами его пробной аппроксимации простым региональным ме тодом. Процедура разложения позволяет выбирать любую из перечисленных моделей. Выбо конкретного выражения для аппроксимации зависит от величины вклада С(х,у), которы может варьировать от образца к образцу. Для оценки качества аппроксимации используете область гистограммы правее и выше пиков самых больших хромосом (зона С на рис.4), также некоторые участки гистограммы между хорошо разделенными пиками.
Аналогично однопараметрическим проточным кариотипам в двупараметрических отсутствуют сигналы от хроматид, попадающих в хромосомную суспензию из небольшого -юцента постмитотических клеток. Распределение хроматид по интенсивпостям флуорес-ищии является копией распределения от митотических хромосом, но с половинными ин-¡нсивностями, поскольку хроматиды по содержанию в пих ДНК представляют собой полоты митотических хромосом (и, следовательно, их распределения будут сжаты по абсциссе ординате в два раза). Присутствие хроматид впервые было доказано именно для двупара-етрических проточных кариотипов, когда хроматиды группы 9-12 образуют не плечо пика щи вообще входят в него), а формируют отдельное двупараметрическое распределение, начала этот пик приписывали различным хромосомам с мутацией с образованием третьего )молога.
В программном пакете реализовали следующие функции удаления артефакгных сиг-алов из двупараметрических проточных кариотипов: аппроксимация и устранение сигнала, эразованного разбитыми хромосомами и агрегатами фрагментов цитоплазмы, осуществляйся, согласно (19), частным случаем двуполостного гиперболоида вращепия. Аппроксима-ия и устранение сигналов, производимых агрегатами хромосом, осуществляется: параболи-гской функцией, методом выкалывания, методом Фурье-преобразования. Кроме этого, моет выполняться также аппроксимация и устранение сигналов от хроматид. .5.3 Разложение двупараметрических гистограмм на составляющие пики.
После фильтрации исходного массива Н(х,у) от загрязняющих компонент может ыть проведен основной этап анализа: разложение отфильтрованного массива Н(х,у)** на 1уссовы распределения, соответствующие сигналам отдельных хромосом. Для достижения гой цели также возможно применение гибридного метода, совмещающего в себе метод по-недовательпых отсечений и модифицированный метод наименьших квадратов. Разложение гдется с правой верхней стороны двупараметрического распределения, то есть со стороны иков от больших хромосом. Гистограмма разбивается на группы пиков, между которыми ересечение минимально. Для двупараметрических данных этот процесс реализуется гораздо роще, что повышает точность анализа. В минимумах между экспериментальными пиками ыбираются точки отсечения, а затем проводится аппроксимация гауссианами пиков в пре-елах выбранного участка. Результат аппроксимации вычитается из исходного массива и по-педовательно проводится разложение следующей группы пиков, расположенных слева, тот процесс продолжается вплоть до пиков самых малых хромосом слева. [риложение
В Приложении приведены структурные схемы и характеристики программного пакета нализа однопараметрических распределений Laser Sorter -1, а также программного пакета
нализа двупараметрических распределений Laser Sorter - II.
21
Оба пакета разработаны для IBM-совместимых ЭВМ типа РС-АТ, работающих по; управлением MS-DOS, хотя возможна работа в MS-DOS Box таких операционных систем, как Windows 95, Windows NT, OS/2.
Программный пакет Laser-Sorter I разработан на следующих компиляторах: Borlanc С++ 3.1, Turbo Assembler 3.1, требует около 300К оперативной памяти и занимает околс 400К диска.
Возможности, предоставляемые пакетом Laser-Sorter I: первичный статистически! анализ данных (определение среднего, стандартных отклонений, коэффициентов вариации г, пиковых значений в пределах выбранной зоны интереса); масштабирование экспериментальных распределений по обеим осям; установление порогов и отсечения части шкалы ; первичных данных; сглаживание эсперименталышх массивов одним из нескольких методов интерполяция массивов различными методами; аппроксимация в рамках различных авали тических моделей артефактных сигналов, накладывающихся на хромосомные распределенш (хромосомные обломки и куски цитоплазмы), вычитание этих сигналов; аппроксимация сиг налов от хромосомных агрегатов различными методами, вычитание этих сигналов; учет сиг палов от разошедшихся хроматид и их вычитание; разложение отфильтрованных массиво] на гауссовы компоненты в интерактивном режиме с использованем гибкой системы ограни чений на параметры разложения; определение статистической достоверности получешюп разложения по критерию ^; запоминание "протокола" процедуры для его автоматическог воспроизведения; оформление протокола результатов в виде таблицы.
Разработанный пакет производит обработку экспериментальных массивов за время с 20 мин (АТ386/387/40мгц) до 1,5 часов (АТ28б/287/12мгц) в зависимости от быстродействи. использованной ЭВМ и сложности исходных данных.
Программный пакет Laser-Sorter II разработан на следующих компиляторах: Watcoi C/C++ 9.5b, Turbo Assembler 3.1, среда DOS Extender DOS4GW 1.95+, требует около ЗЛ оперативной памяти и занимает около 1М диска.
Возможности, предоставляемые пакетом Laser-Sorter II: послойное плоское предста!
ление трехмерных данных, позволяющее строить двумерные одпопараметрические сечепия
профили обрабатываемых данных; плоские и трехмерные изолинии с возможностями ynpai
ления частотой, законом, и высотами проведения изолиний; трехмерная графика в изометри
с представлением данных на равномерной сетке с возможностями распределения ошибк
дискретности и применил закраски по Гуро; трехмерная графика в изометрии с предстшш
нием данных в виде сечений но осям абсциссы и ординаты; первичный статистический аш
лиз данных (определение среднего, стандартных отклонений, коэффициентов вариации
пиковых значений в пределах выбранной зоны интереса); масштабирование экспсримы
тальных распределений но всем осям; установление порогов и отсечения части шкалы у не]
22
гчных экспериментальных данных; сглаживание экспериментальных массивов одним из ¡скольких методов; интерполяция массивов различными методами; аппроксимация в рам-IX различных аналитических моделей артефактных сигналов, накладывающихся на хромо->мнью распределения (хромосомные обломки и части цитоплазмы), вычитание этих сигна->в; аппроксимация сигналов от хромосомных агрегатов различными методами, вычитание их сигналов; учет сигналов от разошедшихся хроматид и их вычитание; разложение от-альтрованных массивов на гауссовы компоненты в интерактивном режиме с построепием язической модели процесса образования обрабатываемых данных, что обеспечивает адек-ггпость полученных в процессе проведенного разложения параметров; определение стати-тгческой достоверности полученного разложения по критерию запоминание
гротокола" процедуры для его автоматического воспроизведения; оформление протокола :зультатов в виде таблицы.
Разработанный пакет производит обработку экспериментальных массивов за время >рядка 1-1,5 часа (АТ486/133МГц) в зависимости от быстродействия использованной ЭВМ сложности исходных данных. Основное машинное время уходит на этап разложения гисто->амм на гауссовы компоненты.
Выводы
1. Анализ существующих методов фильтрации и аппроксимации экспериментальных определений, получаемых при цитофлуориметрическом анализе хромосом человека в по->ке, позволил создать новую стратегию количественного анализа этих данных, основанную I учете свойств формулируемой физической модели объекта.
2. Создана процедура анализа однопараметрических статистических распределений, мучаемых в процессе флуориметрического апализа хромосом в потоке. Процедура преду-мтривает фильтрацию загрязняющих компонент и разложение распределений на состав-ле компоненты на основе модифицированных методов аппроксимации методом наимень-их квадратов и минимизации Флетчера-Ривса. В процессе анализа вводятся дополнительно 01раничения и связи, вытекающие из априорной цитогенетической информации об ана-вируемом объекте, что позволяет сделать процесс разложения физически реальным и дос-шерным.
3. Показаны эффективность и устойчивость созданной процедуры путем анализа кон-зетных экспериментальных распределений, получепных в результате анализов хромосом гловека в потоке. Статистическая проверка точности определения относительного размера эомосом дает разброс менее 1% (0.3-0.5% для некоторых экспериментов), что является жордной точностью, не обеспечиваемой ни одним из альтернативпых подходов.
4. Построена процедура анализа двупараметрических распределений, получаемых при флуориметрическом анализе хромосом в потоке на двулазерных проточных цитометрах, базирующаяся на тех же принципах. Она позволяет проводить существенно более точную идентификацию хромосомных пиков и учет загрязняющих компонент.
5. Процедуры реализованы в виде программных пакетов "Laser Sorter-I" и "Laser Sorter-II" для персональных ЭВМ. Оба пакета обеспечивают работу в интерактивном режиме и позволяют проводить полный анализ распределений хромосомных сигналов для решения ряда задач: выявления хромосомных аббераций, количественного сопоставления различий как гомологичных хромосом, так и хромосомных наборов в целом.
6. Продемонстирована эффективность разработанных процедур анализа посредством практической эксплуатации созданных программных средств, реализованных на персональных ЭВМ. Программные пакеты переданы лабораториям-пользователям.
Основное содержание диссертации опубликовано в работах:
1. Ю.В. Кравацкий, А.И. Полетаев. "Количественная обработка результатов однопара-метричсского флуоресцентного анализа хромосом человека в потоке". 1994, Молекулярная Биология, т. 28, вып. 4, стр. 887-899.
2. Ю.В. Кравацкий, A.B. Кузнецова, Т.В. Наседкина, А.И. Полетаев. "Обработка результатов однопараметркческого флуоресцентного анализа хромосом человека в потоке". 1996, Молекулярная Биология, т. 30, вып. 1, стр. 192-208.
3. Ю.В. Кравацкий, А.И. Полетаев. ''Дву параметрический флуоресцентный анализ хромосом человека в потоке. Количественная обработка результатов," 1997, Биофизика, в печати.
4. Y.V. Kravatsky, A.Kuznetsova, A.I. Poletaev "Program package for flow karyotype analysis using PCs". 1994, Cytometry, Suppl 7, p. 46 (XVII Congress of The International Society for Analytical Cytology, Lake Placid, USA, October 15-22, 1994)
5. T.V. Nasedkina, S.A. Poltorychin, A.B. Buevich, S.I. Slezinger, Y.V. Kravatsky and A.I.Poletaev: "Monovariate Flow-Analysis of Chromosomes from Human Fibroblasts by means of Lazer Cell-sorter ATC-3000". 1991, Cytometry, Suppl 5., p.775 (XV Congress of the International Society for Analytical Cytology, Bergen, Norway, August 25-30,1991)
6. Ю.В. Кравацкий, B.O. Чехов, B.A. Боковой, А.И. Полетаев. "Программа для количественной обработки однопараметрических результатов хромосом человека в потоке". Всесоюзная конференция "Геном Человека - 91", pp. 14-15.
- Кравацкий, Юрий Всеволодович
- кандидата физико-математических наук
- Москва, 1997
- ВАК 03.00.02
- Исследование пространственной структуры хромосом методом тритиевой планиграфии
- Полиморфизм гетерохроматических районов хромосом человека
- Хромосомная организация геномов растений с хромосомами малых размеров или малоинформативным рисунком дифференциального окрашивания
- В-хромосомы восточноазиатской мыши (Apodemus peninsulae). Изменчивость и поведение в мейозе
- Молекулярно-цитогенетический полиморфизм гетерохроматиновых районов хромосом у детей с недифференцированными формами умственной отсталости