Бесплатный автореферат и диссертация по биологии на тему
Диагностика и прогнозирование опухолевого роста по иммунологическим данным с помощью методов синдромного распознавания
ВАК РФ 03.00.02, Биофизика

Автореферат диссертации по теме "Диагностика и прогнозирование опухолевого роста по иммунологическим данным с помощью методов синдромного распознавания"

л

российская академия наук

ИНСТИТУТ ХИМИЧЕСКОЙ ФИЗИКИ им.акад. н.н.Семенова

О Т

На правах рукописи

КУЗНЕЦОВА Анна Викторовна

ДИАГНОСТИКА И ПРОГНОЗИРОВАНИЕ ОПУХОЛЕВОГО РОСТА ПО ИММУНОЛОГИЧЕСКИМ ДАННЫМ С ПОМОЩЬЮ МЕТОДОВ СИНДРОМНОГО РАСПОЗНАВАНИЯ

03.00.02 - Биофизика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

Москва 1995

Работа выполнена б Отделе кинетики химических и биологических процессов Института химической физики РАН им. Н.Н.Семенова

Научный руководитель:

доктор физико-математических наук член-корреспондент Российской Академии Естественных Наук В.А.КУЗНЕЦОВ Официальные оппоненты:

доктор физико-математических наук В.А. НАМИОТ;

доктор биологических наук Т.В. КРУТОВА

Ведущая организация: Институт вычислительной

математики РАН.

Защита состоится " А/" Я/с^/Х/и? часов на

заседании диссертационного совета Д.002.26.07 в Институте химической физики РАН по адресу: Москва, ул.Косыгина, 4.

С диссертацией можно ознакомиться в библиотеке Института химической физики РАН.

Автореферат разослан " .9

Ученый секретарь диссертационного совета кандидат химических наук

iKCiXCiM 1995 г.

М.А.Сыотряева

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы.

Проблема исследований состояния иммунной системы "в норме и при различной патологии - одна из центральных и нерешенных в иммунологии человека и животных. Анализ иммунологических данных в клинике часто носит только вспомогательный характер. Трудности в объективном использовании иммунологических данных связаны с наличием длительного бессимптомного периода опухолевого процесса, с особенностями ренгирования иммунного гомеостаза, с многомерностью, неполнотой, разнообразием форм информации и ее косвенным характером. Сложность данной проблемы еще более возросла с появлением вирокой панели моноклональных антител к двфференцировочным антигенам лимфоцитов человека и автоматизированных цитофлюориметров, что резко расширило спектр популяций и субпопуляций лимфоцитов, определяемых у пациентов и позволило сделать процесс проведения исследований высокопроизводительным и стандартизированным.

С помощью традиционных статистических методов не удается эффективно использовать ату информации для понимания фундаментальных процессов, происходящих в иммунной систёме и формирования объективных иммунологических критериев диагностики, прогнозирования и выбора оптимальной терапий. Для повышения эффективности использования данных клинической иммунологии в онкологической практике становится актуальной разработка комплекса интеллектуальных алгоритмов, использующих современные методы распознавания образов.

Цель и задачи исследования.

Целью работы является разработка мотодологии анализа иммунологических данных для диагностики и прогнозирования опухолевых заболеваний. Для этого предложена схема исследований этих данных современными методами системного анализа, методами многомерной математической статиспЬй! в комплексе с комбинаторно-логическими алгоритмами распознавания, основанными на поиске информативных сочетаний признаков и визуализации данных.

Качественная особенность данных исследований заключается в разработке компьютерных реализаций и использовании комплекса

Я

методов, работающих с малым количеством объектов, большим числом признаков и отсутствием. части измерений.

Для выполнения поставленной цели работы были сформулированы следующие задачи:

1. Подготовить базу данных для клинико-тмунологических параметров в динамике измерения и сделать переходный модуль для стыковки базы с компьютерным комплексом.

2. Создать адаптированный для пользователя единый комплекс для анализа медико-биологической информации, объединяющий программы статистической обработки данных, программы градации признаков, поиска наиболее информативного их набора и метода синдромного распознавания, программу конъюнкций на базовых множествах.

3. С помощью методов синдромного распознавания провести анализ гематоиммунологических данных для системы естественной резистентности организма и решить задачу диагностики инфицированности вирусом лейкоза крупного рогатого скота.

4. Разработать методологию системного анализа данных цитофлюо-риметрических измерений, проводимых на широкой панели монокло-нальных антител к дифференцировочным антигенам лимфоцитов.

5. На примере остеогенной саркомы человека показать возможность прогнозирования по субпопуляционному спектру лимфоцитов крови эффективности химиотерапии, диагностики метастазов, определения взаимовлияния иммунной системы и параметров опухоли.

6.'С помощью разработанного комплекса установить количественную зависимость между онкологическими заболеваниями членов семей с синдромом Ван-Хиппел-Линдау и признаками, характеризующими состояние противоопухолевого иммунитета.

Научная новизна. Разработана новая компьютерная технология иммунодиагностики, мониторинга и прогнозирования при опухолевом росте. Впервые данные цитофлюориметрических измерений широкого спектра дифференцировочных антигенов на лимфоцитах человека анализировали с помощью новых методов распознавания образов, основанных на поиске информативных сочетаний признаков с помощью принцип?) статистически взвешенного голосования.

В работе найдени индивидуальные решающие правила и интегральные критерии на небольшой совокупности признаков, которые позволили: 1 ) пропусти диагностику инфицировянности

вирусом лейкоза крупного рогатого скота при использовании гематоиммунологических показателей; 2) определить состояние иммунного статуса и его резервных возможностей при- "Прогрессии таких опухолей, как остеогенная саркома человека; зюхарак-теризовать особенности некоторых состояний при опухолевом росте и сделать прогнозы ближайших и отдаленных последствий (в случае метастазирования)} 4) дать иммунологическое описание ключевых этапов заболевания <от раннего до распространенного), 5>сократить число измерений, проводимых у одного пациента, ь)сделать прогноз заболеваемости при чм_-синдромв по показателям противоопухолевого иммунитета.

Научно-практическая значимость диссертационной работы

Разработана база данных и программное обеспечение для системного анализа клинино-иммунологических параметров, которые могут быть адаптированы для системного анализа различной медико-биологической информации в условиях малых выборок с большим числом показателей и отсутствием части измерений.

Найденные решающие правила могут быть применены в клинической иммунологии опухолей человека и ветеринарной иммунологии для решения задач индивидуальной диагностики.

Выявленные закономерности изменений иммунитета в зависимости от клинических показателей дадут возмолиость прогнозировать заболевание и в связи с этим разработать методы иммунокоррекции и иммунотерапии при опухолевых заболеваниях.

Апробация работы. Материалы диссертационной работы были представлены на 2-м Международном рабочем совещании "Современные методы в аналитической морфологии" (Флорида (США), 1994), Конференции по распознаванию образов (Одесса (Украина), 1994), на 15-м Международном Конгрессе по анти-раковой химиотерапии (Париж (Франция), 1995), Международной конференции по микроокружению опухоли - прогрессия, терапия и профилактика (Тиберия (Израиль), 1995), Конференции ВЦ РАН "Математические методы распознавания образов" (Пущино, 1995).

На 1-м Всероссийском конкурсе молодых иммунологов (1994 г.) работа была отмечена дипломом т степени.

Материалы по работе докладывались на семинарах лаборатории математической иммунобиофизики ИХФ РАН и лаборатории

клинической радиоиммунологии ОНЦ РАМН, на ежегодных конкурс; научных работ отдела кинетики химических и биологически: процессов ИХФ (1993-1994 годы), на конкурсе молодых ученых в стипендию им. Н.М. Эмануэля этого же отдела (1995 год).

Публикации. Результаты выполненных исследований опубликованы в 3 работах, 2 работы находятся в печати.

Структура и объем работы. Диссертация состоит из введения пяти глав, заключения, выводов и списка литературы. Работ; изложена на страницах машинописного текста, содержит ZZ рисунка • и таблицы. Список цитируемой литературы состоит и: i?P названий, из нихiC$на русском и£5~на иностранных языках.

Основные положения, выносимые на защиту.

1. Разработана новая компьютерная технология, основание* на методах синдромного распознавания и ориентированная т анализ медико-биологических нечетко структурированных систем.

2. Предложен алгоритм иммунодиагностики инфицированное« вирусом лейкоза крупного рогатого скота с использованием небольшого числа гематоиммунологических параметров.

3. Создана методология анализа цитофлюориметрических измерений, проводимых на широкой панели моноклональных антите к дифференцировочным антигенам лимфоцитов при остеогенной саркоме человека на разных этапах прогрессии заболевания.

4. Установлена связь заболеваемости при и^-синдроме с показателями противоопухолевого иммунитета.

Содержание работы. Во введении к диссертации обоснована актуальность темы исследования, сформулированы основные задач исследования. В нем также отражены научная новизна и научно-практическая значимость работы.

В первой главе представлен обзор литературы по анализу иммунологических данных, полученных с помощью цитофлюориметро; и применения моноклональных антител к дифференцировочным антигенам лимфоцитов человека. Дается обзор литературы по развитию теории распознавания образов и нечетких множеств.

Во и-й главе описывается принцип работы компьютерного комплекса и алгоритма статистически взвешенных синдромов (СВС), На рис. I приведена схема работы комплекса, включающего в себя базу данных, модуль стыковки базы с анализирующими программами,

Оценка коэффициента корреляции, подсчет ошибок и отказов

по нечеткому порогу |-

_V__

Решавдее правило

Рис.1. БЛОК-СХЕМА ОБУЧЕНИЯ КОМПЬЮТЕРА РАСПОЗНАВАНИЮ ОБРАЗОВ ПО МЕТОДУ СТАТИСТИЧЕСКИ ВЗВЕШЕННЫХ СИНДРОМОВ

Звездочкой отмечены блоки, разработанные автором работы.

_V___

Процедура статистически взвешенного голосования

программы стандартной статистической обработки, визуализации данных, конъюнкций по базовым множествам, обучения компьютера по обучавдей выборке и формирования решающего правила для распознавания по наборам информативных признаков.

Основная идея алгоритма СВС базируется на гипотезе о том, что в пространстве признаков существуют подобласти (синдромы), в которые более часто попадают объекты одного из исследуемых классов, и поэтому такие подобласти предоставляют информацию для построения эффективного решающего правила (основанного на статистически взвешенном голосовании по подобластям) для отнесения исследуемого объекта к тому или иному классу. Процедура "голосования" таких компьютерных синдромов имитирует процесс постановки диагноза врачом и поэтому описываемый алгоритм был назван методом статистически взвешенных синдромов.

Обучение компьютера методом СВС осуществляется по этапам:

1. Преобразование данных из непрерывных значений признаков в дискретные и построение одномерных и двумерных, подобластей в пространстве признаков. Сначала для каждого из признаков по обучающей выборке осуществляется разбиение интервала между минимальным и максимальным значениями на несколько интервалов (градаций). Были использованы две процедуры оптимального разбиения. Первая основывается на минимизации энтропии (энтропия минимальна при наличии в интервалах объектов только одного класса и максимальна при полном перемешивании объектов двух классов внутри интервала), вторая - на максимизации точности прогноза номера класса на интервалах разбиения (алгоритм "'пчорт"). В результате градации значения каждого признака заменяются на целые значения, равные номеру того интервала, в котором лежит значение данного признака.

2. Результатом метода статистически взвешенного голосования будет функция номера класса (ФНК), стохастически зависящая от набора признаков и характеризующая принадлежность объекта определенному классу. Процедура голосования, осуществляется по наборам базовых множеств, а именно, по всем одномерным и двумерным подобластям в пространстве признаков, полученным с помощью оптимальных границ градаций. Учитываете двумерных подобластей при голосовании позволяет расширить

Рис.2.

Прогноз принадлежности к первому классу (*, здоровые животные, п = 29) ИЛИ ко второму КЛЗССу

(+, инфицированные вирусом лейкоза, п=25). Пунктирной линией отмечена область отказов (1.35-1.5).

ПРОГНОЗ («НЮ

КЛАСС:

—I___

1

II

описание классов за счет бинарных сочетаний признаков.

На рис.2 по оси абсцисс показаны истинные номера классов для объектов обучаодей выборки, по оси ординат - прогноз функции номера класса для этих же объектов, полученный после проведения скользящего контроля.

Результаты распознавания оцениваются по коэффициенту линейной корреляции г между вычисленными ФНК и истинными значениями номера класса объектов обучающей выборки.

3. Область отказов - это эмпирически определяемый интервал значений [р1,рЭ], содержащий оценку границы между классами, рассчитываемую по формуле:

Р= (К1 *И1+К2*М2)/ (N1 +N2), где кг V кз - номера прогнозируемых классов, т, ¡¡2 - число объектов в первом и втором классе соответственно. В случае попадания значения ФНК в указанный интервал считается, что прогноз для данного объекта не определен.

4. Поиск оптимального набора признаков осуществляется путем достижения максимального значения коэффициента линейной корреляции между истинными номерами классов и их предсказанными значениями.

5. Метод диаграмм рассеяния заключается в том, что для

э

всех пар отобранных признаков строятся диаграммы рассеяния (Рис.3). На диаграммах (с помощью программы "млс") уточняются оптимальные границы градаций. Метод диаграмм рассеяния позволяет использовать экспертные знания.

6. Оценка робастности процедуры обучения распознаванию (т.е. устойчивости результатов обучения к малым отклонениям от первоначальной выборки) проводилась с помощью метода скользящего контроля, который осуществляется путем поочередного удаления объектов из обучающей выборки, построении на оставшихся объектах решаюцего правила и последущего распознавания удаленного объекта методом взвешенного голосования.

В работе использовали две реализации процедуры скользящего контроля: с "фиксированными" и с "плавающими" границами градаций. В первой из них сначала определяют границы градаций на всей обучающей выборке, затем эти границы используются неизменными при скользящем контроле. Во второй процедуре после удаления очередного объекта из обучающей выборки для отобранных информативных признаков находят новые оптимальные градации градаций признаков, после чего для удаленного объекта проводят вычисление его ФНК.

7. Достоверность результатов обучения распознаванию контролировали при получении решающего правила и оценке коэффициента корреляции на выборках после стохастического изменения номеров класса у объектов (рандомизации). Повторение такой процедуры достаточное число раз позволяло оценить среднюю величину порога "случайности" правильного распознавания и его дисперсию и сопоставить эти оценки с результатом распознавания для исходной выборки.

Важная информация для анализа данных была получена при работе программы конъюнкций по базовым множествам до 4 порядка, позволяющая оценить достоверное преобладание объектов одного из классов и выявляющая сочетания от 2 до 4 признаков.

Алгоритмы были реализованы в виде программного комплекса на языках СИ, Турбо-Паскаль и Ф0РТРАН-90 в среде мэг-б для 1 км-совместимых персональных компьютеров.

Глава ) 11 содержит решение задачи определения инфшдгоовэнкости животных вирусом лейкоза крупного рогатого

БГЛ.Ж

20 ! 8 1 Г, 1 1 1 2 1 0 8

"1-Г'

Г

"Т"

"Т---Т—Г~Т-т-1-1-Г-Т---1-г

X г

оо Г II оо о

IV

*

*

* о *

*

v г о о

*

3 1

**

о о о о

VII

* *

о *

* *

* V111; 1.x

I* *

Л___1___±___±_±_Л_I_I_I__I.--1-1__

15 10 15 20

а. эозюгофилы.л

Р0Лтф-кл/ыкл

lf.ni) I то 3 100 ' 2 50 1 000 350 ■»о о

100

^ о

-г-рт--Г-

I I

I * I

* * * * * *

Т-1-1-1-Т-1-г

11 *

*

*о о

I

I о* *1 о

I» *

( I

о

III о

о *

О О I *0 1

IV * V ° ! ° VI

о

I о о

I *1

1_X__1.___X___J__1111'

> 0 '.00 I 000 1500

I I '

б.

2000 Р0Ллев'

Рис.3. ДИАГРАММЫ РАССЕЯНИЯ ДЛЯ ЗДОРОВЫХ ЖИВОТНЫХ (о) И ДЛЯ ИНФИЦИРОВАННЫХ ВИРУСОМ ЛЕЙКОЗА КРУПНОГО РОГАТОГО СКОТА (*).

о

V

о

о

о

о

о

и

скота по гематоиммунологическим данным с помощью метода СВС.

Осуществляли разделение двух групп коров: неинфицированных вирусом лейкоза (РИД-, 29 животных) и инфицированных вирусом лейкоза (РИД+, 25 животных), у которых определяли в общей сложности 45 гематоиммунологических показателей.

Для исследования диагностических возможностей разных групп признаков из набора измерений выделяли 3 группы тестов: I) розеткообразования (РОЛ); 2) фагоцитоза (ФН); 3) лейкограммы (ЛГ) крови. На каждом наборе признаков были получены решавдие правила с числом информативных признаков 6, 4 и 5 соответственно, и точностью от 69 до 93 % правильных распознаваний. На следующем этапе работы по распознаванию здоровых и инфицированных животных использовался полный набор признаков.

В табл. I показаны наиболее информативные признаки, участвунцие в работе итогового решающего правила, а также минимальное и максимальное значения признаков и границы оптимальных градаций. Римскими цифрами в таблице указаны номера класса, объекты которого преобладают в данном интервале.

На рис.2 приведены результаты распознавания нормальных и ньу-инфицированных животных. Оказалось, что только 7 из 45

Таблица I. ИНФОРМАТИВНЫЕ ПРИЗНАКИ ДЛЯ РЕШАЮЩЕГО ПРАВИЛА

ПРИЗНАК мхм ГРАДАЦИИ мах

- эозинофилы, % 1.2 4.9 (ii) 8.2 21.6

- БГЛ, % 1.6 (ii) 6.15 15.65 20.4

- РОЛ (левамизол,

10"7мг/мл), кл/мкл 156 328 (ii) 723 2062

- ФН (левамизол,

10~бмг/мл), % 1 2.5 20.5 (ii) 65

- Р0Л(30 мин,ср.199).

кл/мкл 135 998 (i) 1267 (ii) 2205

- ФН (Т-активин,

10 бмг/мл), % 4 41 (i) 46 (ii) 67

- РОЛ (теофшишн,

1.8 мг/мл), кл/мкл 164 214 (i) 670 1617

признаков достаточно для правильного распознавания з режиме скользящего конттюля 51-го из 54-х обследованных животных. Этот результат был получен при фиксированных границах градаций. Для никоторых информативных признаков на диаграммах рассеяния (рип.З) показаны распределения объектов и двумерные субобласти. Объект .ч34 на рис.3,6 находится в субобласти ш, где объекты двух классов перемешаны, но на рис.3,а тот же объект попал в субобластъ V с объектами только класса инфицированных животных (значит голоса здесь будут выше), поэтому данный объект был правильно распознан.

Для группы БИД-отрицательных животных распознавание было верным в 935 случаев, для группы РИД-положительных животных - в 86% случаев (без учета отказов).

Найденное решающее правило позволяет решать задачи иммунодиагностики инфицированности вирусом лейкоза крупного рогатого скота без использования традиционных специфических диагностикумов на антигены вируса ни.

Глава 1 у посвящена решению задач диагностики и прогнозирования по оубпопуляционному спектру лимфоцитов крови при оетеогекной саркоме человека.

В п.1У.1 проводили определение наличия или отсутствия отдаленных метастазов по иммунологическим данным. Применяя метод СВС, создали решающее правило, позволяющее осуществить разделение двух групп первичных больных остеогенной саркомой: без метастазов (23 человек) - I группа и при наличии метастазов в легкие (3 человек) - 2 группа. Определяли в общей сложности 46 иммунологических показателей. Из них в решающее правило вошли 7 наиболее информативных.- процент смбяа* -лимфоцитов, число спза1"-лимфоцитов в I мкл, процент св5о+-лимфоцитов, процент и число -мл i1"-лимфоцитов, процент сб4+- и число сб1с+-лимфоцитов в I мкл. Признаки перечислены в порядке уменьшения их информативности.

На этом наборе признаков при скользящем контроле с фиксированными границами градаций в первой группе один больной был отнесен в группу больных с метастазами, больные второй группы были распознаны алгоритмом без ошибок, коэффициент корреляции - 0,87.

При проведении скользящего контроля с "плавающими" границами градаций коэффициент корреляции составил 0,69, при этом больные с метастазами распознавались без ошибок, а среди больных без метастазов - I ошибка и I отказ. За вычетом отказа процент верных предсказаний во второй группе составляет 96«. Ошибочное распознавание в первой группе может объясняться наличием у части больных субклинических метастазов, т.к. существует большая вероятность наличия микрометастазов уже в момент постановки диагноза.

Контроль, проведенный на 22 больных остеогенной саркомой без клинически определяемых метастазов, прошел без ошибок.

Вариабельность информативных признаков оказалась выше в группе больных без метастазов. Больные с метастазами локализуются преимущественно в компактных зонах, тогда как больные без метастазов расположены хаотично вне этих зон (рис.4). Возможно, такая закономерность является отражением неспособности иммунной системы к ответу на опухолевый рост при метастазах.

П.1У.2. Решали задачу прогнозирования возникновения метастазов при остеогенной саркоме в течение 2-х лет с момента постановки диагноза. Было выделено три группы пациентов: 1-я -больные, у которых метастазы не возникли в течение 2-х лет от постановки диагноза (12 человек), 2-я группа - пациенты с метастазами, возникшими в первый год (21 человек), 3-я - группа больных, у которых метастазы возникли на 2-м году наблюдения (II человек).

Решающее правило было сформировано при обучении на первой и второй группах. В него вошли ¿'признаков из 44 (см. табл. 2). Контроль решающего правила проводили на 3-й группе. При этом больные, у которых метастазы возникли ближе по времени к одному году, были отнесены ко второй группе, а больные с метастазами, возникшими ближе к 2 годам, считались принадлежащими к 1-й группе. В результате экзамена коэффициент корреляции ФНК с истинными номерами класса был 0,65. Для 7 человек из II прогноз был верен, ошибочно распознаны 2, в область отказа попали 2 человека. Это доказывает наличие линейной зависимости между прогнозируемой функцией класса и истинными номерами класса с уровнем значимости 0,95.

соьо,

0 0

-> о

7 0

6 0

1 1 33 1 1 1 1 > 1 1 0 1 1 1 о

| (1 п 0 0 О 0 | 0

> о о о 1 ° о

' о 32 ' о

I 1 0 II | III о

,29 1 О

1 'о О О

1 34 1

1 35 '

IV 1 V 1 VI

| Зо 36 1

О | 1 °

° VI 1 1 VII 1 | VIII

1 1 О

г 31 1 1

1 1 1 1 1 1° 1 I I 1 I I

/ /—

■ 0 112

•>0 0

763

/ /1300 с о 3 8;кл/ыкл

СП4*Г%

90 _

/5

50

15

10

" -1 1 ■ Т" "Т I '133' „' 1 1 III 1 1

о 1 о

о 1 34 О о

IV 1 V о 1 0 о о VI 0

О 1 1 О

31 о I 36 О 00 321 о о

о 1 1 1 1 о о 35

VI I 1 VIII 1 1 Зо | о IX

о 1111 1 .. 1. 1. I ) . 1 1 1 1

б.

10

20

30

40

С045йД;%

бис и. ДИАГРАММЫ РАССЕЯНИЯ ДЛЯ ПАЦИЕНТОВ С ОСТЕОГЕННОИ САРКОМОЙ ДО ЛЕЧЕНИЯ, о - ПАЦИЕНТЫ БЕЗ МЕТАСТАЗОВ, ЧИСЛА - я я ПАЦИЕНТОВ С МЕТАСТАЗАМИ; ПУНКТИРОМ УКАЗАНЫ ГРАНИНЫ ГРАДАЦИИ, а: по оси абсцисс гпзв+-лимфоциты/мкл, по оси ординат - процент сп5о+-лиыфоцитов. б: проценты С04511АЦ- И СП4 ¿лимфоцитов.

В П.1У.З выявляли характерные изменения в спектре ди^ференцировочных антигенов лимфоцитов крови, в зависимости от объема опухоли при остеогенной саркоме. Для этого 73 пациента были разделены на 3 группы: первая группа (26 чел.)- объем опухоли менее 300 см3, вторая (23 чел.)- от 300 до 600 см3, третья .(24 чел.) - более 600 см3. Ранее у пациентов с остеосаркомой при использовании традиционных статистических методов анализа были обнаружены умеренные различия в средних значениях для некоторых субпопуляций лимфоцитов в зависимости от объема опухоли. Однако вопрос о возможности индивидуального определения взаимовлияния опухоли и иммунной системы на основе таких сдвигов не ставился. При попарном анализе указанных групп для пациентов со средним объемом опухоли не удалось найти достаточно эффективного решающего правила.

Разделение пациентов с малым и большим объемом опухоли оказалось более успешным. Коэффициент корреляции между прогнозом ФНК и истинным номером класса при использовании процедуры распознавания с фиксированными границами градаций был высоким (г = 0,8). Разделение пациентов с малыми и большими опухолями осуществлялось при использовании данных о числе I'-') 10+-, ш.л -1+-, сс1+-лимфоцитов в I мкл крови и активности щелочной фосфатазы. В каждой группе оказалось по два ошибочно распознанных больных. При использовании процедуры скользящего контроля с плавающими границами градаций коэффициент корреляции был ниже (г=0,67). В первой группе было I ошибочное распознавание и 4 отказа; в третьей группе - 6 ошибочных распознаваний, 4 отказа. Таким образом, правильный прогноз в группе с малым объемом опухоли был получен для 90% пациентов, а в группе с большим объемом опухоли - для 75% (с вычетом отказов).

Заметим, что во всех трех наборах информативных признаков присутствует один общий иммунологический показатель - число шд-1+-лимфоцитов в I мкл. Статистически достоверные различия по этому признаку имели место только при сравнении первой и третьей групп (в третьей группе его значение понижается).

На следующем этапе исследования из всех трех групп были ' исключены больные с метастазами, обнаруженными к моменту лечения. После этого в первой группе осталось-25, во второй -

17, в третьей - 20 человек. Результаты распознавания пациентов получились следующими: при сравнении групп больных.с малыми и со средними объемами опухоли коэффициент корреляции вырос с 0,49 до 0,6Э (информативные признаки м-1дм+кл/мкл, процент •то''-клеток, ' ¡и 1Ьь-клеток в I мкл, индекс стимуляции РБТ, активность щелочной фосфатазн), при распознавании пациентов со средним и большим объемом опухоли с 0,44 до 0,66 (количество лейкоцитов, «:ля1 , ичио1-, ни-1 со45на^- клеток в I мкл, процент ее;1-, клеток, сывороточный 1дм). Результаты

для малого и большого объема опухоли приведены в таблице 2.

Был проведен контрольный эксперимент: группа пациентов со средним объемом опухоли . была разделена пополам. После распознавания на решающем правиле, полученном при разделении групп с малым и большим объемами опухоли, коэффициент корреляции между прогнозом и номером группы составил 0,46, что говорит о линейкой зависимости с уровнем значимости 0,93.

В п.ду.4 рассматривается взаимосвязь иммунной системы и степени васкуляризации опухоли, которая также входит в ряд важных прогностических факторов выживаемости онкологических больны/. В случае обильной васкуляризации опухоли двухлетний безметастатический период и трехлетняя выживаемость больных после лечения достоверно более продолжительны.

Больные были разделены на две группы со слабой и сильной степенью васкуляризации. В режимах скользящего контроля на фиксированных и на плавающих границах градаций признаков было найдено решающее правило, которое дало безошибочное предсказание принадлежности больных к первой или ко второй группе. Оно состояло из трех признаков: уровня сывороточного гдА, процента свВ1"- лимфоцитов, числа сс5о*"- лимфоцитов.

В . п.IV.5 приведена попытка индивидуального прогноза предоперэционкрй химиотерапии для больных остеосаркомой.

Проблема прогноза эффективности химиотерапии в онкологии до настоящего времени не решена, несмотря на свою актуальность. Наиболее важным показателем для оценки эффективности химиотерапии и для предсказания выживаемости является уровень лекарственного некроза опухоли (так называемый "патоморфоз").

Для анализа использовали данные 31 больного остегенной

саркомой, полученные до начала лечения. После операции у больных определили степень некроза опухоли, и в зависимости от нее были сформированы две группы (25 человек с "плохим" патоморфозом и 6 - с "хорошим"). Такое разделение связано с двукратным увеличением 5-летней выживаемости больных с 3 и 4 степенями некроза опухоли.

В первый набор информативных признаков вошли уровень 1дм, абсолютное число ссв+-несущих лимфоцитов и процентное содержание ':вз+-несущих лимфоцитов. При их использовании все пациенты были распознаны алгоритмом безошибочно. Контроль, проведенный на 5 больных с плохим патоморфозом был безошибочен.

Затем эти признаки были удалены из выборки, и на оставшихся был проведен аналогичный поиск. Второй набор состоял из 8 признаков: в-клетки, д -цепь 1д+-не сущих клеток, св22+-лимфоциты ,СБ45ИА+-, СБ7+~, СБ4+ЛИМФ0ЦИТЫ- ПРИ использовании метода СВС на втором решающем правиле только один пациент с "хорошим" лекарственным патоморфозом оказался ошибочно отнесенным в группу с "плохим" патоморфозом.

Таким образом, предложенные методы позволили выделить по два набора информативных признаков для предсказания эффективности предоперационной хемиотерапии. Относительно высокая вариабельность информативных иммунологических маркеров для пациентов с хорошим патоморфозом отражает колебательный динамический характер иммунной системы при опухолевых заболеваниях и ее способность к активному ответу на опухолевые антигены. Совместно с химиотерапией такая иммунная система способна к подавлению небольшой опухоли и небольших метастазов.

IT.iv.6. Решали задачу иммунодиагностики остеогенной саркомы по спектру субпопуляций лимфоцитов. Группу здоровых составили доноры в возрасте, соответствующем среднему возрасту больных - 16-20 лет: 41 юноша и 20 девушек. Группа больных состояла из 40 человек.

Было решено сформировать два решающих правила отдельно для обследуемых с числом лимфоцитов больше 2000 и менее 2000. При первом условии группа здоровых насчитывала 42 человека, группа больных - 28 человек. Найденное решающее правило состояло из 7

Таблица 2. Результаты распознавания пациентов с остеогенной саркоыой в режимах скользящего контроля с фиксированными (I)

и плавающими (и) г заницаыи градаций

Группы сравнения, п Режим Процент верных прогнозов Число ошибок Число отказов Коэффициент корреляции Информативные признаки

ПРОГНОЗ ВОЗНИКНОВЕНИЯ МЕТАСТАЗОВ В ТЕЧЕНИЕ ГОДА: 1 - труппа без метастазов, 2 - группа с метастазами

1-я (12) 2-я (21) I 92 (92) 87 (91) 2 2 0 I 0,8 ЧИСЛО Н|_А-0|-Т С038+- клеток в 1 мкл крови, процент ц.1дм+-клеток, С045ИА -клеток, число со7+- клеток в 1 мкл крови

1-я (12) 2-я (21) II 81 . (90) 59 (75) I 6 4 4 0,6

РАСПОЗНАВАНИЕ ПАЦИЕНТОВ С МАЛЬМ И БОЛЬШИМ ОБЪЕМАМИ ОПУХОЛИ: I - малые опухоли, 2 - большие опухоли

1-я (25) 2-я (20) I 88(100) 85 (94) 0 I 3 2 0,83 количество лейкоцитов, Процент С01с+—, С071 лимфоцитов, число С050+—, С04+-,С022+- клето.к в 1 мкл, активность щелочной фосфатазы '

1-я (25) 2-я (20) и 76(100) 50 (59) 0 7 6 3 0,56

РАСПОЗНАВАНИЕ ЗДОРОВЫХ ДОНОРОВ И ПАЦИЕНТОВ С ОСТЕОСАРКОМСЙ, абсолютное число лимфоцитов меньше 2000, I- доноры, 2- больные

1-я (42) 2-я (28) I 86(100) 83 (92) 0 2 6 3 0,78 "А <' СГ) 7 - СО Гч СР45^ С05+-ЛИМф0ЦИТ0В, ЧИСЛО С022+-КЛ6Т0К

1-я (42) 2-я (28) и 88(100) 86 (86) 0 4 5 0 0,76 В 1 МКЛ, 1дБ, количество лейкоцитов

« Число перед скобками - процент больных, правильно распознанных в каждом классе, от общего числа пациентов в классе; •гасло в скобках - то же при исключений отказов.

признаков (см. табл. 2). Коэффициент корреляции ФНК с истинным номерами классов составлял 0,78 на фиксированных и 0,76 не плавающих границах градаций. При рандомизации коэффициен' , корреляции в 6-и процедурах получился следующим: 1 - 0,69, 2 -0,71, 3 - 0,57,4 - 0,32, 5 - 0,52, 6 - 0,59. В решающем 4 правиле он значительно выше, что говорит о наличии линейно{ зависимости между прогнозируемой функцией класса и истинным номерами класса. Контроль, проведенный на 6 донорах, не участвовавших в обучении, был успешным: 5 из них были правильна отнесены в группу здоровых, 1 - попал в зону отказов.

Второе решающее правило для распознавания по иммунологическим данным здоровых доноров и больных остеогенно саркомой было найдено для случая, когда абсолютное число лимфоцитов больше 2000. Из 43 признаков выделили 6 наиболее информативных. Коэффициент корреляции ФНК с истинными номерам классов составлял 0,93 на фиксированных и 0,76 на плавающих границах градаций.

В главе у была сделана попытка установить количественную зависимость между онкологическими заболеваниями членов семей < синдромом Ван-Хиппел-Линдау (ш_) и признаками, приведенными в статье Ортальдо и др. (1992), а именно: хромосомное сцепление (определяемое по анализу связи \м. с полиморфизмом длины ограниченных фрагментов, объединенным с клиническими скрининговыми тестами и/или историей семей); экспрессия рецептора м<-клеток (г*«п) - нормальная или ненормальная; признаки по функциональной активности клеток, эффекторных па отношению к клеткам-мишеням (м<-клетки, лимфокин активированные киллеры (|_дк), антитело зависимая клеточная цитотоксичность («гс), возраст обследованных членов семей; их статус по отношению к заболеванию; тип заболевания. Было отмечено отсутствие статистически достоверных различий между признаками

40 членов семей с синдромом были разделены на классы: 1-й класс (26 человек) - индивидуумы без проявления заболевания, 2-й класс (14 человек) - индивидуумы с опухолевыми заболеваниями. Коэффициент корреляции при фиксированных границах градаций был равен 0,84. В решающее правило вошли 6 признаков, из которых самыми информативными были хромосомное

сцепление и экспрессия рмш. При этом в классе незаоолевянх все индивидуумы оыли распознаны без ошибок, а в классе с проявившимся заболеванием I человек был отнесен в другой класс.

При проведении распознавания в режиме с плавапрши границами градаций результаты оыли следующими: коэффициент корреляции - 0,72, в первом классе - 3 ошиоочно распознанных человека, во втором классе I ошибка при распознавании. Причем в случае гипердиагностики все три человека имели небольшой возраст (один из них - 12 лет, двое - 15 лет}. В данном случае ошиока при распознавании указывает на оолыюй риск заоолевания у данных членов унь-семей.

Предлагаемая методология анализа медико-оиологических данных может оыть рассмотрена как новый перспективный инструмент, который позволяет: I) решать задачи индивидуального выявления ранних 1скрытых) изменений во взаимоотношениях хронических патологических агентов (опухоли, хроничсгкой инфекции) с организмом; 2) определять подмножество патогномичных признаков системы, которые вовлечены в процессы системной адаптации или прямого взаимодействия организма с патологическим агентом.

Описанный в раооте метод анализа может оыть использован при построении экспертных систем в биомедицинских науках и других ооластях исследований, имеющих дело со слабо структурированной информацией, малым числом ооъектов для обучения и частичным отсутствием информации для признаков.

ВЫВОДЫ

I. Разраоотвна новая технология анализа клинико-иммунологических данных, основанная на теории нечетких множеств и использовании современных компьютерных технологий (метод статистически взвешенных синдромов - СВС). Данный подход позволяет раоотать с малым количеством ооъектов, оольшим числом признаков и отсутствием части информации в данных.

г. Установлено, что на основании неоольшого числа гематологических и иммунологических признаков возможно осуществлять диагностику инфицированное™ животных вирусом лейкоза крупного рогатого скота. Степень надежности

распознавания составляет У4Ж.,

Ö. На основании данных фенотипирования лимфоцитов крови с помощью широкой панели моноклональных антител созданы алгоритмы распознавания ряда характеристик остеогенной саркомы: ооъем и степень васкуляризации опухоли, чувствительность к химиотерапии, наличие метастазов.

4. Установлено, что для прогнозирования возникновения метастазов при остеогенной саркоме достаточно пяти иммунологических признаков; наиоольшей информативностью ооладают процент и аосолютное значение соз8+-лим$оцитов (активированные т-клетки и ык-клетки).

5. Показана возможность распознавания сольных остеогенной саркомой и здоровых лиц по иммунологическим признакам; наиоолее информативным признаком является разность ою7',"-свз+-лимфоцитов, в группе здоровых лиц значение этого признака в среднем значительно выше.

6. С помощью алгоритма распознавания доказана количественная зависимость возникновений неоплазий у лиц с синдромом ван-Хиппел-линдау от состояния естественной противоопухолевой резистентности.

7. Описанный методический подход позволяет осуществлять скриннинг иммунологических показателей, выявлять закономерности поведения иммунной системы, а также уменьшать число неоОходимых для анализа исследований. Разработанная компьютерная технология может найти применение в широком спектре задач диагностики и прогнозирования в онкологии, иммунологии и других ооластях медицины.

СПИСОК РЛБиТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Кузнецов в.л., Ившина A.B., Кузнецова a.b., Оенько и.В. Анализ фенотипа лимфоцитов крови в прогнозировании метаста-зирования у оольных остеосэркомой. Подход, основанный на распознавании нечетких систем. // иммунология. 1УУ5. N 5. С.52-58.

2. Ившина A.D., Кузнецов В.А., Кузнецова A.B., Мачак Т.Н., Оенько и.В. Фенотип лимфоцитов крови в определении ооъема опухоли и степени ее взскуляризации при остеогенной саркоме. Подход, осноплшпш ня распознавании нечетких систем. //

IL

Иммунология. 1995. N 6. С.56-64.

3. Раманаускайте Р.Ю., Абронина И.Ф., Иешинэ А.В., Кузнецова А.В., Ананьев B.C. Действие бета-каротина на показатели клеточного иммунитета онкологических больных при комбинированной терапии основного заболевания. // Вестник ОНЦ АМН России. 1995. N2. С. 13-18.

4. Кузнецов В. А., СенькоО.В., Кузнецова А.В., Семенова Л.П., Алещенко А.В., Гладышева Т.Б., Ившина А.В. Распознавание нечетких систем.по методу статистически взвешенных синдромов и его применение для иммуногематологической характеристики нормы и хронической патологии. // Химическая физика. 1996. n l.T.^S]С,Si-iCC.

5. Kuznetsov V.A., Ivchina A.V., Senko O.V., Kuznetsava A.V. Syndrome Approach for computer rpcogniticri of fuzzy systetis and its application to immunological diagnostics and prognosis of human cancer. // Matlen. and computer modelling. 1996. vol.25.

6. Kiiznetsov V.A., Qusev Yu.V., Senko O.V., Kurnetsova A.V., Ivchina A.V., Dooley w.c. Application of novel pattern recognition (retted to image cytometry and morphometry data to differentiate normal and tu/rcr cells. // In: Proceedings of The 2-d International Workshop: t-fadem Methods in Analytic Morphology. April 4-5. 1994. Orlando Harriot, Florida. P.8.

7. Ivshina A.V., Mate ha!; G.N., Solovjev Yu.N., Kuzretsov V.A., Kuznetsova A.V. A new approach to the individual prognoses of osteosarcoma response to neoadjuvant chemotherapy. // 15 Intern, (ingress on Anti—cancer Chemotherapy (Meoadjuvant, Adjuvant and Experimental), Jan. 31st- Feb. 3rd.1995. Paris - France. P.279.

8. Кузнецов В.A., Сенько O.B., Кузнецова А.В., Семенова Л.П., Алещенко А.В., Гладышева Т.Б., Ившина А.В. Распознавание нечетких систем высокой размерности по методу статистически взвешенных синдромов и его применение для иммуногематологической диагностики вирусной хронической патологии. // 7-я Конференция ММРО. 1995. ВЦ РАН. Пущино. С,.89.

9. Jackson A.M., Kuznetsov V.A., Sen'ko O.V., Dcrmel, Ivchina A.V., Alexandroff F.V., Uaznetsova A.V., Clinton, Frescott, James k. Prognosis of the BCS-treatment of patients with blad- der caficer by urine iirirune molecules based en tie statistical weighted sindr cme. // 7Я КОНф. ММРО ВЦРАН. 1995. г1ущин0. С.III.