Суперкомпьютерное облако помогает в разработке инновационных генетических тестов

Компания "Кномикс", входящая в биомедицинский холдинг персонализированной медицины “Атлас”, запустила вычисления на облачной платформе суперкомпьютеров HPC Hub для масштабирования своего R&D и развития научной базы проекта генетических тестов.

Ранее в этом году “Кномикс” уже завершил успешный пилот с HPC Hub, запустив на облачной платформе суперкомпьютеров по требованию вычисления для своего проекта по изучению кишечного метагенома, то есть совокупности геномов всех микробов, обитающих в кишечнике человека. По словам Дмитрия Алексеева, директора по R&D биомедицинского холдинга "Атлас", команда ученых-микробиологов и биоинформатиков “Кномикс”, вошедшая в декабре 2016 года в состав "Атласа", провела большое исследование, в ходе которого было проанализировано несколько тысяч российских образцов биоматериала или более 10 ТБ данных. В результате сложных вычислений, делегированных мощностям платформы HPC Hub, удалось сформулировать целый ряд новых научных гипотез, согласно которым микрофлора кишечника в значительной степени определяет не только физическую составляющую человеческой жизни, но и психическую. К примеру, было обнаружено, что отходы жизнедеятельности бактерий в кишечнике могут непосредственно влиять на мозг, провоцировать депрессию и даже аутизм. Для обеспечения успешного выполнения данного исследования специалисты HPC Hub перенесли метагеномный пайплайн (набор ПО для обработки метагеномных данных, разработанных исследователями Knomics) в облако и ускорили его работу более, чем в 8 раз за счёт оптимизации процесса записи данных на разделяемое хранилище. Помимо прочего тесное сотрудничество компании “Кномикс” с HPC Hub позволило опубликовать ряд научных статей в журнале PLOS ONE.

Сотрудничество “Кномикс” и HPC Hub не ограничилось этим одним проектом. Для целей расширения исследовательской программы компании было закуплено собственное вычислительные оборудование для осуществления накопления геномных данных и первичное тестирование своих пайплайнов, которые впоследствие должны будут применяться на суперкомпьютерной инфраструктуре. Для настройки и формирования оптимального вычислительного окружения компания обратилась в HPC Hub. Специалисты HPC Hub провели ревизию оборудования, помогли купить недостающие комплектующие и более эффективно настроить уже имеющееся. В итоге, была развёрнута высокопроизводительная конвергентная среда (функция хранилища и вычислителя совмещаются в единой серверной архитектуре) с элементами Private Cloud организации. Данный подход органично согласуется с сервисами HPC Hub, что позволит компании “Кномикс” легко масштабировать распределенную обработку данных в облаке HPC Hub, реализуя гибридный сценарий: подготовка на собственных мощностях, а ресурсоемкая распределенная обработка данных - в HPC облаке.. “Подобный гибридный сценарий позволяет значительно более гибко подходить к решению наукоемких задач и проводить исследования с огромным количеством данных, не перерасходуя средства в период накопления данных и апробации алгоритмов обработки данных”, - говорит генеральный директор HPC Hub Вильгельм Битнер.

Среди других примеров сотрудничества Knomics и HPC Hub - помощь в настройке на распределённой архитектуре необходимого исследователям ПО (в т. ч. пакета Qiime), оптимизация параллельных алгоритмов, например, алгоритма де-ново сборки Trinity, использование которого легло в основу серии исследований.

По словам сооснователя HPC Hub, Евгения Протасенко, одной из основных целей работы компании является избавление потребителей счёта не только от необходимости покупать, настраивать и управлять сложной высокопроизводительной инфраструктурой, но и от задач, связанных с настройкой и оптимизацией прикладного кластерного ПО. “По большому счёту, нашим клиентам необходим результат счёта, довольно нерационально заставлять их приобретать для этого компетенции по управлению вычислительными кластерами. В нашем облаке не только вычислительный ресурс, но и необходимое прикладное ПО оптимально настроены и доступны по модели аренды” - добавляет Евгений.

Сообщается, что с помощью решений HPC Hub “Кномикс” ускорит разработку своей ИТ-системы анализа данных микрофлоры кишечника человека. В перспективе врачи с помощью данной технологии получат возможность точнее диагностировать развитие различных заболеваний, включая онкологию, а фармацевтические компании смогут создавать более эффективные лекарства.

Вице-президент, исполнительный директор кластера биологических и медицинских технологий Фонда "Сколково" Кирилл Каем считает, что сегодня на глобальном биомедицинском рынке не хватает решений, которые бы позволили собрать и проанализировать в одном месте всю информацию об исследованиях микробиоты, чтобы на выходе эти обширные данные могли использовать все - от пациентов и врачей до бизнеса. Продукт команды на стыке big data и биомедицины будет крайне востребован как в России, так и по всему миру.

Биомедицинский холдинг «Атлас» занимается развитием сети частных медицинских центров и биомедицинскими разработками в области молекулярной генетики и биоинформатики. Миссией Биомедицинского холдинга «Атлас» является создание и внедрение в клиническую практику инструментов персонализированной медицины.

HPC Hub представляет собой облачную суперкомпьютерную платформу по требованию (HPC as a service / HPCaaS) для решения задач наукоемкого бизнеса. HPC Hub в несколько кликов дает доступ к суперкомпьютерной вычислительной мощности с предустановленным прикладным ПО, что позволяет бизнесу экономить не только десятки миллионов рублей на покупке и обслуживании суперкомпьютерного кластера и на лицензиях коммерческого ПО, но и время на интеграцию и подготовку инфраструктуры. По словам Евгения Протасенко, проект особенно востребован в связи с тем, что собственные вычислительные кластеры используются бизнесом обычно не более, чем на 30%, а остальное время простаивают, существенно снижая эффективность инвестиций в основные средства. При этом покупка типового кластера на 1,000 ядер и его обслуживание в течение 5 лет обходится примерно в 100 млн рублей. Эквивалентное время счёта в профессиональном суперкомпьютерном облаке стоило бы в 2 раза дешевле при значительно более высоком удобстве, безопасности расчетов, надежности хранения данных. У клиентов публичного облака HPC Hub есть возможность платить только за то время, в которое реально задействуются вычислительные ресурсы, при этом сохраняя настроенное окружение для последующего использования во время простоя.

Автор: Александр Абрамов.

Тематики: Интеграция

Ключевые слова: облачные технологии, информационные технологии в здравоохранении