Распределенные системы - против СПИДа и рака

В этой статье речь пойдет о довольно известном проекте распределенных вычислений - "Find-a-Drug". Если кратко описать суть проекта, то любой желающий может переписать и установить на свой компьютер небольшую программу-клиент, которая в минуты бездействия вашего компьютера будет заниматься поиском лекарства от определенного заболевания. Меня лично всегда интересовала эффективность и целесообразность такого подхода в принципе: ведь распределенных проектов много, почти каждый из них пытается избавить человечество не от чего иного как от СПИДа или рака, а чтобы кому-то уже хоть чего-то удалось добиться, я никогда не слышал. Недавно подвернулся случай напрямую пообщаться с ученым, который разбирается не только в самих распределенных вычислениях, но и в научной компоненте проекта. Представляем вашему вниманию интервью с Китом Дэвисом, руководителем проекта "Find-a-Drug" (далее - без кавычек).


Кит Дэвис, научный директор проекта Find-a-Drug, отвечает на наши вопросы.


Алексей Доля: Кит, расскажите немного о себе.

Кит Дэвис: Я химик по образованию, работаю с программным обеспечением уже 20 лет - с тех самых пор, как оставил Исследовательское Общество Оксфордского Университета (Research Fellowship at Oxford University) и основал Chemical Design. Мы были одной из первых компаний в области вычислительной химии. В 1996 году мы стали открытым акционерным обществом, а в 1998 завоевали Королевскую награду за Экспорт (Queen's award for Export). Я управлял компанией вплоть до 1997 года, после чего мы решили ее продать Oxford Molecular (ныне часть Accelrys). С тех пор я продолжал заниматься исследованиями в области разработки программного обеспечения для отыскания лекарств. Благодаря научному проекту, который United Devices предложила Оксфордскому Университету, я обратил внимание на распределенные вычисления. Именно тогда я предложил использовать THINK software для отыскания лекарства от рака.


Алексей Доля: Расскажите подробнее о THINK software?

Кит Дэвис: Сведения о человеческом геноме позволяют совершенно по-новому взглянуть на создание лекарств. 20 лет назад мы имели представление о структуре и предназначении всего лишь нескольких белков. Сегодня мы владеем информацией о более чем 20 тыс. белковых структур, а также имеем программное обеспечение, которое может моделировать такие структуры. Компьютерные программы могут вычислить, какие молекулы будут взаимодействовать с белками, а какие - нет. При этом стоимость компьютерного исследования намного меньше аналогичного лабораторного испытания. Более того, для компьютерных расчетов вовсе не нужна физическая модель, это снижает не только стоимость, но скорость проведения исследования.
Пожалуй, самым захватывающим аспектом использования THINK является та скорость, с которой компьютер может рассчитывать способность молекулы соединяться с белком. Большое количество ПК позволяет проверить миллиарды молекул потенциального лекарства, тогда как лабораторные методы обычно исследуют 100 тыс. молекул. Очевидно, что возможности ПК позволяют находить более безопасные и эффективные лекарства.


Алексей Доля: Что собой представляет проект Find-a-Drug?

Кит Дэвис: Find-a-Drug - это проект, не предназначенный для извлечения прибыли. Он финансируется моей консультационной компанией Treweren Consultants, которая разработала THINK software. Мы сотрудничаем в основном с учеными, которые могут помочь в выборе целей исследования (то есть белков). Проект много выиграл благодаря моему предыдущему опыту, полученному от United Devices и Intel. Мы расширили область исследуемых заболеваний и свое сотрудничество с группами ученых и биотехниками. На практике мы все время используем компьютеры, это позволяет корректировать наши действия и делать их более эффективными (у нас нет лишней рабочей силы, и мы можем постоянно следить за результатами работы).


Алексей Доля: Каковы масштабы проекта Find-a-Drug?

Кит Дэвис: Оценить масштабы проекта можно несколькими способами: по количеству закачек с нашего сайта, по числу ПК или по количеству отдельных пользователей. Общая картина сложнее, чем кажется: у одного пользователя может быть 10 или 100 компьютеров, зато другой пользователь может переписать себе ПО и через несколько дней стереть его. Сегодня у нас более 13 тыс. зарегистрированного ПО для 3700 пользователей (у каждого - свой уникальный адрес).
Есть хороший способ оценить с научной точки зрения результаты нашей работы - это подсчитать количество молекул, которые мы обрабатываем. Этот показатель составляет от 2 до 5 миллионов молекул в день (точный результат зависит от конкретного исследуемого белка). Стоит отметить, что наш результат лучше, чем у других проектов распределенных вычислений, которые насчитывают намного большее число членов. Таких хороших показателей нашему проекту удалось достичь благодаря высокой скорости THINK software и отсутствию излишек вычислительных ресурсов (члены проекта проделывают одни и те же вычисления несколько раз, чтобы проверить результаты работы друг друга).


Алексей Доля: Чем еще Find-a-Drug отличается от других распределенных проектов?

Кит Дэвис: Есть несколько других проектов распределенных вычислений, занимающихся медицинскими исследованиями. Исследование белков является основным для вычислительной химии, разработка программного обеспечения для таких проектов занимает годы. Лишь после этого исследования могут принести существенный вклад в создание лекарств путем моделирования сложных белковых структур.
Если сравнивать Find-a-Drug с другими проектами, имеющими виртуальный картинки, то наш проект охватывает более широкий спектр заболеваний и обладает более быстрым ПО. Мы также прилагаем много усилий к отображению результатов работы в любой момент времени. С точки зрения членов проекта, Find-a-Drug не загружает сеть, имеет несколько интернет-серверов и не требует много ресурсов памяти. То есть наш проект, работая в фоновом режиме, никак не мешает пользователю взаимодействовать с другими программами.


Алексей Доля: Какой смысл кому-то участвовать в вашем проекте?

Кит Дэвис: Люди, которые потеряли своих родственников или друзей в результате неизлечимой болезни, могут помочь найти лекарство и спасти тех, кто еще жив. Многие пользователи просто получают удовольствие, участвуя в проектах подобного рода. Например, они могут посмотреть сколько молекул обсчитал их компьютер и т.д.


Алексей Доля: Какова ваша роль в проекте?

Кит Дэвис: Я являюсь научным директором проекта, то есть занимаюсь им день ото дня. К тому же я модифицирую THINK software, когда требуется. Также я отвечаю на вопросы в форуме, разъясняю особенности нашего ПО и т.д.


Алексей Доля: Какая техническая основа заложена в проект Find-a-Drug?

Кит Дэвис: Суть проекта в том, чтобы отыскать молекулы, которые могут взаимодействовать с конкретными белками. Такие молекулы могут являться лекарством, если они соответствующим образом воздействуют на нормальные функции белков. Например, белки рака приводят к росту опухоли, а нам удалось отыскать молекулы, которые ему препятствуют. Подробности доступны здесь: http://www.find-a-drug.org/press5a.html. Те же самые принципы лежат в основе ВИЧ, атипичной пневмонии, рассеянного склероза, чумы и т.д.


Алексей Доля: Вы не могли бы подробнее объяснить биологическую суть проекта? Я, например, не очень понимаю, как молекулы, взаимодействующие с белками, могут быть чем-то полезны.

Кит Дэвис: Чтобы понять принцип работы лекарства, часто используют аналогию "замок и ключ". Белок в таком случае является замком, контролирующим какой-то биологический процесс, а молекулы лекарства - не что иное, как ключ. Если с помощью ключа открыть замок, то биологические функции белка активируются и усиливаются. Если же все сделать наоборот, то есть закрыть замок, то активность функций белка снижается. На данный момент мы ищем такие лекарства, которые обязательно должны препятствовать активности белка и останавливать рост опухолей.


Алексей Доля: Какова вероятность того, что проект сможет как-то помочь медицине?

Кит Дэвис: Вычислительная химия уже внесла большую лепту в открытие многих современных лекарств. Чтобы превратить молекулу, которая недавно была открыта и которая нужным образом воздействует на белок, в лекарство, которое можно продавать на рынке, требуется проделать большую работу. Анализы показывают, что 90% молекул, проявляющих активность в лабораторных условиях, позже оказываются абсолютно непригодными из-за внешних воздействий (например, токсичности) или еще каких-то факторов, не предусмотренных в тестах. Наша основная цель - выбрать из огромного числа молекул только те, которые имеют наивысшие шансы пройти лабораторные испытания и которые соответствуют проводимому исследованию. Если говорить словами практика, то при достаточном финансировании и качестве проводимых нами исследований очень вероятно, что мы откроем лекарство в самые ближайшие годы.


Алексей Доля: Есть ли уже случаи, когда распределенные вычисления, проводимые различными компьютерами через Интернет, открыли какое-нибудь лекарство?

Кит Дэвис: Системы на основе полуавтоматического виртуального моделирования (известного как создание лекарств на основе структур) смогли построить молекулы, которые противодействуют некоторым белкам, например, ВИЧ. Метод, который мы используем, является автоматизированным полностью, но в его основе лежит та же научная база, что и во всех системах виртуального моделирования. Тем не менее, нам может потребоваться 5-10 лет, чтобы понять, как использовать некоторые молекулы.


Алексей Доля: Как я понимаю, клиентская часть устанавливается на компьютерах пользователей. Именно она перебирает разные молекулы и проверяет их реакцию с белком. Правильно?

Кит Дэвис: Да, клиент THINK software генерирует сотни тысячи или миллионы различных 3D-форм или структур и каждую из них он тестирует на реакцию с белком.


Алексей Доля: Получается, что для каждого заболевания нужен свой клиент?

Кит Дэвис: Один и тот же клиент используется для всех белков. Иногда надо просто выбирать различные опции в программе, но внутренний код одинаков для всех случаев.


Алексей Доля: А что означают цветные шарики рядом с каждым названием заболевания (http://www.find-a-drug.org/projects.html)?

Кит Дэвис: К сожалению, у нас нет локализованных сайтов и программного обеспечения. Тем не менее, участниками нашего проекта являются люди более чем из 50 стран мира. Мы стараемся использовать графические иконки вместо слов, чтобы облегчить пользователю навигацию и получить информацию о статусе проекта. Это помогает. Например, цветные шарики информируют о статусе проекта и наличии запросов. Зеленые шарики показывают, что молекулы еще исследуются.


Алексей Доля: Участие в вашем проекте может помочь всему миру и всем людям?

Кит Дэвис: Наша цель найти лекарство для жизненно опасных заболеваний. Применение стандартного лечения для них ограничено или неудовлетворительно. Случаи заболеваний малярией, туберкулезом или ВИЧ постоянно увеличиваются в Африке. Медицинское лечение там слишком дорогое или удалено от жителей. В западном мире каждый четвертый человек более раком, но смертность очень маленькая. Это происходит потому, что здесь лучше медицина, и меньшее число людей - курит. Тем не менее, рак остается одной из главных причин смерти.


Алексей Доля: Если наши читатели хотят участвовать в проекте, что им надо сделать?

Кит Дэвис: Подробная информация об этом есть здесь: www.find-a-drug.org. Здесь же можно скачать ПО. При этом автоматически перепишется информация о 10 тыс. молекул (работа для ПК на 10 часов). Результат потом автоматически возвращается к нам на сервер, а данные по новым молекулам снова переписываются. Пользователи могут выбрать сами: использовать ли ПО в фоновом режиме без графики, установить его в качестве screen-saver или отображать молекулы в маленьком окне внизу экрана.


Алексей Доля: А клиентская часть маленькая?

Кит Дэвис: Скачивать придется 1.5 Мб, на диске клиент займет 8 Мб. То есть даже самые старые ПК могут участвовать в процессе поиска лекарства.


Алексей Доля: Какое соединение с Интернетом требуется клиенту?

Кит Дэвис: ПО проектировалось таким образом, чтобы максимально эффективно использовать соединение dial-up. Стандартный размер запроса о белке равен 50 Кб, а пакет с данными о 10 тыс. молекул составляет 5 Кб. Обычно пользователи исследуют несколько пакетов, соответствующих одному белку, одновременно. Результат работы во многом зависит от количества отысканных молекул, но обычно не превышает 1 Кб.


Алексей Доля: Большое спасибо за интервью. Удачи вам и вашему проекту!