В наш век развития междисциплинарности мы часто можем наблюдать, как различные отрасли науки делают фантастические успехи в областях, с которыми они раньше, казалось бы, никак не ассоциировались. Недавно прошла информация о том, что молодые математики, выпускники мехмата МГУ, работая в столь же молодой компании НТЦ «БиоКлиникум», решают вопросы, связанные с ранней диагностикой и лечением онкологических заболеваний. Мы встретились с руководителем этого направления Владимиром Владимировичем Галатенко.

 

- С одной стороны, онкология, с другой – математика. Где связь?

- Связь достаточно прямая. Математика часто рассматривается как отдельная абстрактная наука, живущая своей жизнью и не имеющая никаких приложений, кроме стандартных задач для седьмого-восьмого классов. Но это не так. Математика и создавалась, и развивалась именно как прикладная наука, хотя, конечно, ее теоретические направления тоже очень интересны.

- Но на практике найти им применение достаточно сложно.

- Это сейчас. В перспективе они все будут востребованы. Вопрос в удаленности этой перспективы. Судьба теоретических направлений различна. Стандартные конические сечения – эллипсы, гиперболы, параболы, – которые были известны еще древним грекам, нашли серьезное, можно сказать определяющее, применение в работах по астрономии. Часть теоретических исследований не сразу входят в нашу жизнь. Тем не менее в ХХ и начале XXI в. развивались и продолжают развиваться множество теорий, в которых доля прикладной составляющей достаточно высока. Это связано с тем, что в последнее время копится огромный объем самых разнообразных данных, которые надо анализировать, а в голове одного человека – пусть даже суперпрофессионала – они не укладываются. Требуются специальные автоматизированные средства машинного анализа и обучения.

Биология, медицина – одни из областей, которые сравнительно недавно благодаря исследованию генома и транскриптома (т.е. полного набора транскриптов (молекул РНК) в данном организме или специфического набора, представленного в клетках определенного типа) начали давать огромный объем данных. Поэтому современным биологии и медицине без математики тяжело. А для математики это еще одно интересное приложение.

- С геномом понятно, но каким образом с помощью математики можно просчитать онкологический диагноз?

- С помощью анализа того же генома. В рамках онкологии использование современных методов очень разнообразно. Во-первых, речь идет о ранней диагностике, точнее, о выявлении предрасположенности к заболеванию. Вспомните Анджелину Джоли, которая предприняла радикальные упреждающие меры, обнаружив мутацию в одном из генов, который статистически значимо связан с раком, – BRCA1 (Breast Cancer Susceptibility Gene). Так что ранняя диагностика – это одно из приложений, основанное на возможности измерять множество дополнительных параметров: особенности генома, а также транскриптома. В этой области известная статистика и средства машинного обучения могут помочь найти признаки, характеристики, маркеры, которые люди могут не заметить просто потому, что им нужно просматривать десятки и десятки тысяч генов для разных образцов.

Второе приложение относится уже не к диагностике, а к подбору оптимальной схемы лечения. Это связано и с геномными, и с транскриптомными особенностями. Анализ генома позволяет понять, будет ли эффективным применение того или иного лекарственного средства или лучше от него отказаться, потому что преимущество сомнительно, а побочный эффект может оказаться очень сильным.

- Сейчас врачи часто действуют методом подбора: попробовали одно лекарство, не подошло – пробуем другое. А если никак не получается – возьмем средство широкого действия, которое способно уничтожить опухоль вместе с ее носителем. Насколько я понимаю, вы впервые предлагаете систему высокоточного наведения, когда минимальной дозой определенного препарата можно достичь максимального эффекта в необходимой точке.

- Можно сказать и так. Только не впервые. Стандартно это уже применяется в мировой практике, в частности в США. Речь идет о транскриптомных тест-системах, информация от которых в случае рака молочной железы позволяет врачу решить, использовать химиотерапию или не использовать. С их подсказки онколог определяет, высок риск развития рецидива без химиотерапии или нет.

- Но если речь идет об индивидуальной геномной информации, значит мы идем к персонифицированной медицине?

- Да, оценка геномной, транскриптомной информации, для анализа которой нужны современные методы, – это движение к персонифицированной медицине, причем обеспечивающее решение всех подзадач: и ранней диагностики, и прогнозирования хода течения заболевания, и выбора оптимальной терапии. Хотя, конечно, говорить, что математические методы единолично позволят решить все проблемы, нельзя. Математика в данном случае – лишь один из инструментов, который не может использоваться в отрыве от фундаментальной и практической биологии, медицины. Это часть единой исследовательской программы.

 

О ТОНКОСТЯХ КОМАНДНОЙ ИГРЫ

- В чем состоит ваш метод тестирования?

- На текущем этапе речь пока не идет о сформированном, клинически применяемом методе исследования - скорее о математическом, информационном подходе к отбору самых информативных с точки зрения решения той или иной задачи генов.

- Тогда как проходит такой «математический отбор»?

- Рассказать можно на примере уже упоминавшегося прогноза риска развития рецидива при раке молочной железы. Есть внешне идентичные пациентки с абсолютно одинаковыми параметрами: возраст, форма заболевания, стадия и т.д. Врачу для эффективного лечения нужно понять, каким будет риск развития рецидива при отсутствии химиотерапии. Если риск высокий, имеет смысл ввести химиотерапию в курс лечения, если риск низкий, то введение может быть нецелесообразным.

- Чтобы неизбежные и весьма мощные побочные эффекты не нанесли больший урон, чем сама болезнь?

- Совершенно верно. Ведь первая заповедь врача – не «Вылечи», а «Не навреди». Это лишь один из примеров, на котором удобно обсуждать задачу. В рамках простой ситуации достаточно найти один признак, один параметр, маркер, информации от которого более чем достаточно для принятия решения. Сверхинформативный ген, которого одного хватит, чтобы не смотреть на оставшиеся десятки тысяч генов. Но в рамках сложных задач одного параметра, одного признака недостаточно, а обсуждаемый вопрос, заключающийся в предсказании того, что произойдет с пациентом через пять, семь, десять лет, – один из сложных. Имеется стандартный способ, используемый для отбора нескольких признаков, на основе сочетания которых принимается решение. Именно этот способ применялся при разработке востребованных сейчас в мировой клинической практике тест-систем Oncotype DX и MammaPrint.

Суть заключается в следующем. На первом этапе ищутся самые индивидуально высокоинформативные гены, признаки-чемпионы. Потом эти признаки объединяются и строится некий математический аппарат – функционал, своеобразный «черный ящик», который выдает общее решение на основе полученной об этих генах информации. Подход, с одной стороны, абсолютно логичный, с другой стороны – небесспорный. Можно привести футбольную аналогию. У нас есть геном – набор всех футболистов в стране. Надо собрать сборную команду из 11 игроков. Мы посмотрели на игроков, которые индивидуально играют сильнее всего, абсолютно не думая о том, как они могут играть вместе, какое у каждого из них амплуа, собрали этих самых индивидуально сильных игроков и заставили их играть вместе, не подумав о том, что, может быть, все они – нападающие. Понятно, что если мы эту команду разбавим хотя бы одним вратарем, пусть не самым сильным, то она начнет играть значительно лучше.

С учетом этого на одном из научно-исследовательских семинаров основатель и научный руководитель научно-технического центра «БиоКлиникум» профессор Александр Григорьевич Тоневицкий поставил перед нами в виде конкретной научной задачи вопрос о возможности эффективного использования генов с невысокой индивидуальной прогностической способностью.

- Может быть, они обеспечат высокое качество командной игры?

- На двух генах анализ получилось провести с помощью полного перебора.

- Ну, это не сложно.

- С идейной, содержательной точки зрения задачка действительно несложная. Но тяжелая с точки зрения вычисления. Она потребовала привлечения суперкомпьютера. Были параллельно задействованы ресурсы МГУ – суперкомпьютеры «Ломоносов» и «Чебышев». Чтобы получить необходимые результаты, потребовались десятки тысяч процессоро-часов. Удивительная вещь: оказалось, что большинство пар, которые позволяют довольно достоверно предсказывать рецидив, состоят из генов, которые сами по себе очень низкоинформативны. Не нашлось ни одной пары, состоящей из двух высокоинформативных генов. Было порядка 10% пар, где один ген высокоинформативен, а второй индивидуально не очень значим, и 90% пар, где оба гена индивидуально незначимы.

Причем интересно, что статистически значимая достоверность классификации, которая обеспечивается такими парами, не различается.

- То есть уровень командной игры не равен сумме индивидуальных качеств?

- Да, командная составляющая важна не только в футболе, но и в работе генома.

Для больших множеств генов, даже троек, к сожалению, уже не получается применить полный перебор. Такой подход требует слишком значительных ресурсов – это уже миллионы процессоро-часов. На текущем этапе это невозможно даже с использованием суперкомпьютеров. Хотя, возможно, в ближайшей перспективе задача будет решена. Но все равно оказалось, что двойки могут еще быть уточнены за счет добавления третьего, четвертого гена, и эти гены тоже чаще всего не высокоинформативны с индивидуальной точки зрения.

Выяснилось, что уже на уровне пар генов получается достичь качества прогнозирования риска рецидива, не уступающего, а может быть, даже опережающего известные и широко применяемые в мировой практике тест-системы Oncotype DX и MammaPrint.

Таким образом, на текущем этапе речь идет не о какой-то уже устоявшейся технологии прогнозирования риска или ранней диагностики, а именно о методике построения тест-систем, которая апробирована на озвученном примере, но может быть применена и к широкому классу других задач.

- Но если уже есть опробованные методики, зачем нужна еще одна?

- Наши преимущества – широкий спектр применения метода и высокая достоверность получаемых транскриптомных тест-систем. Однако пока все-таки рано говорить о готовом для клинического применения результате, а именно о теоретическом методе, хотя первые шаги по внедрению этой теории в клиническую практику уже делаются.

- То есть это начало очень перспективного пути?

- Мы в это верим и на это надеемся.

 

ШАГ ЗА ШАГОМ

- Вы находитесь на самой передовой линии интеграции наук. Как к вашим работам относятся биологи, химики, генетики?

- В рамках современных исследований граница между науками очень расплывчата - как и граница между математикой и не математикой, между биологией и не биологией. Сейчас идет глобальная тенденция к созданию общих групп, которые непременно включают в себя представителей разных ветвей науки. То же самое и здесь: есть единые группы, которые включают в себя математиков, биологов, медиков. Это нормальная практика, от которой мир вряд ли откажется в течение ближайшего времени. Напротив, все говорит о том, что она будет еще больше развиваться. Раньше разные ветви науки пытались максимально обособиться и жить своей жизнью. Сейчас, как мне кажется, идет обратное движение: науки, которые еще совсем недавно казались очень далекими друг от друга, сегодня объединяются и работают вместе. Это взаимовыгодное, взаимополезное и взаимоприятное сотрудничество.

- Предположим, ваша работа удачно прошла все стадии и вошла в общую практику. Что это значит для простого человека: увеличатся ли достоверность исследования, доступность, цена? К чему это все приведет и в какой срок?

- Вопрос о сроках сложный. Медицина работает с живыми людьми, поэтому она вынуждена быть довольно консервативной наукой, не допуская в себя не до конца проверенные вещи. По оптимистичным прогнозам в рамках российской медицины речь идет о сроках около пяти-семи лет. Но реально это может быть и десять лет, и больше. Хотя транскриптомные системы уже апробированы и применяются в рамках клинической практики в разных странах. Про США мы уже говорили.

Ну а результат – это удешевление лечения в тяжелых случаях, в том числе и в случае онкологии. Естественно, экономический эффект - не единственный. Речь идет и об улучшении качества подбора лекарственных препаратов за счет меньшего числа ошибок, и о сокращении времени, необходимого для оптимального подбора препаратов. Уменьшаются также время, необходимое для принятия обоснованных врачебных решений, и продолжительность реабилитации. Наконец, как мы надеемся, внедрение такой технологии приведет если не к снижению количества заболевших, то по крайней мере к меньшему количеству нежелательных последствий онкологических и, возможно, других заболеваний. Как я уже сказал, речь идет о методе, который применим не только к онкологии.

Микрочипы Affymetrix позволяют одновременно измерить экспрессию десятков тысяч генов (вверху); точность дозирования проб обеспечивают автоматические дозаторы (справа)- В том же направлении, в области исследования неинформативных генов, где-нибудь еще проводятся такие работы?

- Насколько нам известно, полных аналогов подобных работ нет. Есть работы, которые обсуждают неинформативные и низкоинформативные гены, но с точки зрения не тест-систем, а других приложений. Скажем, исследуются наличие корреляции, взаимосвязи экспрессии генов в одной группе и отсутствие этой взаимосвязи в другой группе, с тем чтобы сделать какие-то фундаментальные выводы, например об отличии работы генома или транскриптома в клетке в случае наличия или отсутствия заболевания.

Но если речь идет именно про создание тест-систем, то нам такие целенаправленные исследования неизвестны.

- В рамках перехода от теории к клинической практике: сотрудничаете ли вы с какими-либо медицинскими центрами?

В России наш партнер — Онкологический институт им. П.А. Герцена, где апробируется созданная нами ранее тест-система для рака молочной железы – «ОнкоПро-М1», состоящая из 128 генов. Совместно с онкоцентром разработана и находится в ранней стадии апробации аналогичная система, которая предсказывает рецидив в случае рака простаты. Онкоцентр крайне заинтересован в объективном прогнозировании и оптимальном подборе схемы терапии. Они очень многое умеют, но при этом не останавливаются на достигнутом, а развиваются и дальше.

В рамках международного сотрудничества нашим стабильным партнером стала Университетская клиника Гамбург-Эппендорф, которая с удовольствием нам помогает, в частности с экспериментами на мышах, на ксенографтных моделях. Они активно участвуют и в теоретической, и в практической апробации наших исследований.

 

ЗАГАДКИ НА ОТВЕТЫ

- Если ваша работа поможет ранней диагностике или выявлению предрасположенности исходя из индивидуального генома, может быть, стоит уже всем людям делать в принудительном порядке расшифровку генома и смотреть на возможные перспективы? Создавать такие генетические паспорта...

- На текущем этапе это точно рано.

- Дорого?

- Не только. Несмотря на то что проект по расшифровке генома считается законченным, геном продолжает оставаться скорее чем-то неизвестным. Загадок он дал больше, чем решений. Изначально считалось, что основная задача генома – кодировать белки, которые производят клетки, а все остальное, более 90% – это мусор. Сейчас ученые потихоньку приходят к пониманию, что все-таки это не так. Если грубо: 1% генома кодирует белки, несет уже понятную информацию. Но остальные тоже постепенно приобретают смысл. Сейчас, если оценивать приблизительно, то для нас 3%, может быть, 5% генома имеют понятный смысл. Но большая часть - по-прежнему нечто непонятное. И абсолютно неясно, когда же наука поймет, что там скрывается, и поймет ли она это вообще.

Говоря о тест-системах, в том числе об информативных парах, которыми мы занимаемся, можно заметить, что во многом это игра в ловлю черного кота в темной комнате. Находятся признаки, которые дают возможность отвечать на те или иные вопросы достаточно достоверно, но детального понимания механизмов – как именно эти признаки связаны с результатом прогноза – нет. Аналог – система выключателей, которые где-то включают и выключают свет. Мы понимаем, что, играя с выключателями, можем как-то управлять лампочками, но все-таки это не приближает нас к пониманию природы электричества.

То же самое и здесь. До фундаментального понимания происходящего, очевидно, еще очень далеко. Пока мы находимся на первом этапе этого пути. Даже хотя формально проект по расшифровке генома считается законченным, это еще только самое начало.

- Вы уже более или менее отработали математический аппарат. Что еще предстоит сделать?

- Если говорить именно о клинических приложениях, уже определены малые сочетания генов, в частности пары, которые обладают наибольшей предсказательной способностью при прогнозирования риска рецидива для ER-положительной формы рака молочной железы. Уже проведена валидация, апробация на независимых наборах данных.

Следующий этап, если говорить о клиническом внедрении, - это уже прохождение формальных процедур, связанных с апробацией на реальных больных, без использования общедоступных банков, баз данных. Апробация эта не быстрая, потому что целевая функция – возможный рецидив через пять лет. В научно-техническом центре «БиоКлиникум» накоплена коллекция из нескольких сотен образцов. Но чтобы понять, хорошо или плохо работает система, нужно подождать как минимум пять лет, когда появится информация, для какого процента пациентов предсказание оказалось правильным.

- Пробы берутся из самого ракового образования? Или достаточно кусочка кожи человека?

- Речь идет о транскриптоме, т.е. об активности генов в конкретных клетках, поэтому в рамках этого исследования изучаются биопсии из самой опухоли. Если говорить о пациентах с уже диагностированным заболеванием, которым все равно делается операция по удалению метастазов, образец берется из того материала, который был удален. При других применениях транскриптомных тест-систем, связанных в частности с ранней диагностикой, зачастую используется и анализ транскриптома крови. В этом направлении мы тоже работаем.

Беседовал Валерий Чумаков