Член-корреспондент РАН, заместитель директора по науке Научно-исследовательского вычислительного центра МГУ им. М.В. Ломоносова (НИВЦ МГУ) Владимир Валентинович Воеводин рассказал о работе современных суперкомпьютеров - информационных заводов, которым под силу решить самые сложные задачи в эпоху цифры
- Что собой представляет современный суперкомпьютер?
- С точки зрения компьютерной сферы – это обычный компьютер. Только разница между компьютерами, к которым мы привыкли, и суперкомпьютерами колоссальная. Это касается и возможностей компьютера, инфраструктуры и других параметров, на первый взгляд не научных – веса, цены, энергопотребления. Эта разница чувствуется во всём.
Конечно, главное здесь это те вычислительные возможности, которые дает суперкомпьютер по сравнению с обычными машинами – персональными компьютерами, ноутбуками и смартфонами, которые также являются компьютерными устройствами и выполняют множество задач.
- Почему в современном мире возникла потребность в таких суперкомпьютерах?
- Потребность возникла достаточно давно. Дело в том, что возможности вычислительных технологий привели к тому, что сегодня практически всё можно смоделировать, спрогнозировать и воспроизвести на компьютере. Но для того, чтобы сделать это с высокой точностью, необходимо выполнить очень много операций. На это способны современные суперкомпьютерные системы.
"ЗАХОДЯ В АПТЕКУ, ЧТОБЫ КУПИТЬ ЛЕКАРСТВО, МЫ МОЖЕМ И НЕ ЗНАТЬ, ЧТО ОНО ПОЯВИЛОСЬ БЛАГОДАРЯ СУПЕРКОМПЬЮТЕРНОМУ ДИЗАЙНУ ПРЕПАРАТА"
Они используются практически везде – в автомобильной промышленности, в авиастроении, в космической отрасли, в фармацевтике, во всём, что связано с информационной безопасностью, в экологии и прогнозировании климатических изменений. Этот список можно продолжать и продолжать. Посмотрим в окошко, и нашему взгляду будет сложнее зацепиться за то, где нет суперкомпьютерных технологий.
Часто мы даже не подозреваем этого. Заходя в аптеку, чтобы купить лекарство, мы можем и не знать, что оно появилось благодаря суперкомпьютерному дизайну препарата. Для многих фармацевтических компаний это серьезное направление исследований. Потому что первичный этап выбора того или иного вещества, который станет основой для будущего лекарства, ускоряется, прежде всего, за счет использования суперкомпьютерной техники.
- В чем отличия суперкомпьютера от обычного ноутбука или смартфона?
- Отличия, прежде всего, в возможностях, которые заложены в этой приставке «супер». Что собой представляет суперкомпьютерный комплекс Московского университета? Суперкомпьютер «Ломоносов-1» занимает тысячу квадратных метров. Во всем мире суперкомпьютеры – это действительно огромные установки. Это целые информационные заводы, которые работают без перерывов и выходных.
Для некоторых суперкомпьютеров строят многоэтажные здания, и это абсолютно нормально. Параметры суперкомпьютерных установок таковы, что их нужно аккуратно сопровождать, аккуратно проектировать, и при этом их не так просто использовать.
Поэтому исключительно важны вопросы о суперкомпьютерном образовании. На первый взгляд может показаться, что суперкомпьютеры – это небожители, которые где-то существуют, но мало кто про них что-то знает. И вроде бы, зачем это нужно массово преподавать… Но когда мы говорим о суперкомпьютерном образовании, мы должны дать ребятам знание о том, как работает эта техника, и каким огромным потенциалом она обладает для решения тех задач, с которыми они столкнутся в своей будущей профессиональной деятельности. При этом также важно донести, что суперкомпьютеры с самого начала были параллельными вычислительными системами. И этот параллелизм компьютерного мира сегодня распространился на все устройства.
У каждого из нас в карманах смартфоны и мобильные телефоны. Эти устройства стали многоядерными, а это и есть параллелизм. Поэтому студентам необходимо знать, как работать с подобными параллельными устройствами, что такое параллельные вычисления, как проектировать параллельные алгоритмы, как создавать приложения для параллельных платформ. 50 лет назад нас учили последовательному программированию, и это было основой IT-индустрии. Сегодня нужно учить параллельному программированию − основе современной индустрии высоких технологий.
- Как работает этот параллелизм?
- Если взять устройство, работающее в последовательном режиме, то я потрачу много времени на решение одной задачи. Но если я возьму 10 устройств и распределю между ними эту задачу, то я решу ее в десять раз быстрее. И это именно то, что мне нужно. Это именно то, что реализовано с помощью суперкомпьютеров.
Суперкомпьютер «Ломоносов-1» состоит из 12 тысяч процессоров. Это значит, что если вы сможете распараллелить свою задачу на 12 тысяч кусочков, вы решите ее в 12 тысяч раз быстрее. Подобные технологии особенно важны для промышленности. Продукция становится дешевле за счет отработки моделей, перехода к новым эффективным и менее затратным методам производства за счет сокращения сроков вывода изделий на рынок.
В США существует Совет по конкурентоспособности. Это правительственная организация, которая отслеживает тенденции развития науки во всех сферах. И если где-то появляется что-то важное и инновационное, Совет должен об этом сообщить. Так вот один из девизов работы этого органа – «В конкурентной борьбе побеждает тот, кто победит в вычислениях». Они уже давно поняли, что вычислительные технологии имеют колоссальный потенциал.
- Математику тоже нужно преподавать по-новому?
- Я бы не сказал, что ее нужно преподавать по-новому. Хорошо бы ее преподавать просто на достаточно высоком уровне, и сегодня это очень важный вопрос. Частенько, математику рассматривают как второстепенный предмет, но без нее никуда! Математика – это база и основа для суперкомпьютерных технологий и для всего, что касается математического моделирования.
Сегодня все говорят о цифровой экономике и цифровой индустрии. В этих сферах математика и математическое моделирование имеют особое значение. Это фантастически интересная область.
Появились такие новые понятия как цифровая модель и цифровая тень. Что они означают? К примеру, у вас есть двигатель – физический объект, который работает по своим законам. Его обвешивают огромным количеством датчиков и во время работы собирают информацию о том, как работают отельные части двигателя. С помощью этого можно сформировать цифровую тень реального двигателя. Анализируя полученные данные, вы можете спрогнозировать, когда та или иная деталь выйдет из строя, вы видите возникающие сбои в режимах функционирования. Такой объем данных, а это реально большие данные, нужно уметь обрабатывать.
Собирая реальные данные мониторинга в цифровую тень, мы можем заложить эти данные в цифровую модель. Цифровая модель − это набор алгоритмов, уравнений и математических моделей, которые описывают реальный двигатель.
Мы получаем данные, формируем цифровую тень и используем цифровую модель, чтобы спрогнозировать поведение изделия и что-то поменять. Эта цепочка как раз составляет основу проектирования современных сложных устройств – автомобилей, двигателей, реакторных установок и других систем. Это и есть то самое цифровое будущее, о котором все говорят.
- Обычно, когда говорят о производительности компьютера, имеют в виду количество операций, которые этот компьютер может выполнить за секунду. И это огромные числа. Зачем обычному пользователю столько операций, и что это за операции такие?
- Это те самые арифметические операции, которые нужны для моделирования любого устройства. К примеру, при проведении краш-теста автомобиля строится модель, описываются параметры всех материалов и взаимодействия отдельных частей между собой. Дальше можно поэтапно следить, что происходит при столкновении. Это предполагает решение большого количества уравнений, причем с высокой степенью детализации во времени, поскольку процесс происходит очень быстро.
Вы можете рассчитать деформацию, разрывы и любое изменение конструкции той или иной детали, если вы знаете, как всё устроено. Для расчета необходимо выполнить те самые операции. Можно попытаться сделать это на обычном компьютере, если операций не так много. Но, как правило, это под силу только суперкомпьютерам.
Их производительность оценивается в количестве операций в секунду. Сегодня эта величина настолько огромна, что приходится использовать сокращения: 10 в 15 степени – это «пета», а 10 в 18 степени – это «экза».
Современные суперкомпьютеры – это компьютеры петафлопсного диапазона. Они могут выполнить более 1 000 000 000 000 000 (квадриллиона – прим. «Научной России») операций в секунду. Это невероятно много. Такая величина с трудом укладывается в голове. Особенно если подумать, сколько операций в секунду может выполнить человек. Вроде бы напрашивается аналогия, что компьютер силен, а человек слаб. Но мы сильны в другом, и сравнивать наверно не приходится.
Производительность современных серверных компьютеров или ноутбуков ниже на 5-6 порядков. Они, конечно, слабее и не могут посчитать то, что может посчитать суперкомпьютер. Я уже не говорю, про мобильные телефоны.
Кстати говоря, подобные вопросы нам постоянно задают школьники. Мы регулярно проводим экскурсии для школьников по суперкомпьютерному комплексу Московского университета. Каждый год к нам приходят около 600-700 человек. Для того, чтобы ребята могли сравнить свои смартфоны или планшеты с суперкомпьютерами, мы создали специальное мобильное приложение, которое измеряет производительность вычислительных устройств. Приложение сравнивает производительность смартфона с производительностью суперкомпьютеров и выдает результат – «Ваше устройство в миллион раз медленнее, чем суперкомпьютер, стоящий там-то».
С другой стороны, важно понимать, что компьютерный мир настолько быстро развивается, что современные мобильные телефоны работают в десятки и тысячи раз быстрее, чем первые суперкомпьютеры, например, известная российская машина БЭСМ-6, которая выполняла миллион операций в секунду. После наших лекций, когда школьники видят развитие компьютерных технологий, они мгновенно понимают, зачем нужны эти «железные монстры».
- Расскажите, что собой представляет современный суперкомпьютерный комплекс?
- Суперкомпьютерный комплекс Московского университета состоит из суперкомпьютера «Ломоносов-1» с производительностью 1,7 петафлопс и «Ломоносов-2» с производительностью порядка 5 петафлопс. На факультете вычислительной математики и кибернетики установлена система IBM Blue Gene/P и система IBM Polus. Эти две системы, в основном, ориентированы на использование в учебном процессе.
Суперкомпьютерный комплекс очень большой, и его возможности действительно велики. Сегодня это самый большой суперкомпьютерный комплекс в России, у которого несколько тысяч пользователей из самых разных организаций, университетов и институтов Академии наук. Это реально работающий центр коллективного пользования. При этом каждый человек пользуется суперкомпьютером со своего рабочего места с помощью интернета, соблюдая правила информационной безопасности.
"В ЭТОЙ ОБЛАСТИ АКТУАЛЬНЫ СЛОВА ИЗ «АЛИСЫ В СТРАНЕ ЧУДЕС» − ДЛЯ ТОГО, ЧТОБЫ СТОЯТЬ НА МЕСТЕ, НУЖНО БЕЖАТЬ"
Следующий важный момент – а как на нем работать? Первый шаг – перейти от последовательной программы к параллельной. На первый взгляд, это сложно, но сложен лишь первый шаг. С другой стороны, без этих технологий никуда – любое современное компьютерное устройство опирается на параллельные вычислительные технологии.
- Насколько мне известно, суперкомпьютер «Ломоносов-2» является самым мощным компьютером в России и входит в сотню самых мощных в мире. Как это было достигнуто?
- Конечно, «Ломоносов-2» далек от первых позиций. В 2009 году, когда мы начали работать над суперкомпьютером «Ломоносов-1», это была первая машина петафлопсного диапазона. Мы были на 12 месте в ТОП-500. Эта самая высшая позиция, которую Россия когда-либо достигала. Сегодня от этой позиции мы очень далеки. Далеки потому что те вложения, которые делают Япония, Китай, Америка и страны Европы, колоссальные. Это позволяет странам двигаться тем темпом, которым движется мировая компьютерная индустрия.
"НУЖНО ПОСТАВИТЬ ЦЕЛЬ ПРАВИЛЬНО ВОСПОЛЬЗОВАТЬСЯ ПОТЕНЦИАЛОМ ЭТИХ ТЕХНОЛОГИЙ И РЕШАТЬ АКТУАЛЬНЫЕ ЗАДАЧИ"
В нашей стране внимания к этой области явно недостаточно, хотя раньше вложения были. «Ломоносов-1» создавался по распоряжению правительства. «Ломоносов-2» был полностью сделан за средства Московского университета. Ни один университет в России не может себе такого позволить. И всё это благодаря тому, что Виктор Антонович Садовничий прекрасно понимает огромный потенциал вычислительных технологий и значение суперкомпьютерных технологий для развития науки.
Примерно два года назад «Ломоносов-2» был в районе 60 позиции. Мы добавили еще 2 петафлопса, и казалось, что это достаточно много. Но когда вышла очередная редакция, мы увидели, сколько мир туда всего «надобавлял». В результате, мы не то, что поднялись, а откатились назад. В этой области актуальны слова из «Алисы в стране чудес» − для того, чтобы стоять на месте, нужно бежать.
- В сентябре этого года состоится международная конференция «Суперкомпьютерные дни в России». Насколько я знаю, она посвящена вашему отцу – академику Валентину Воеводину. Продолжаете дело отца?
- Это скорее счастливое стечение обстоятельств. Я работал с папой в одном коллективе бок о бок в течение 20 лет. Именно он начал работать над моделью параллельных вычислений с точки зрения математики. Я же, в большей степени, занимался компьютерами. И этот симбиоз оказался очень полезным. Мы многое сделали вместе, особенно в области исследования структуры параллельных программ и алгоритмов применительно к архитектурам современных компьютеров.
Можно сказать, что он был у истоков параллельных вычислений, поэтому, конечно, такую дату как 85 лет со дня рождения Валентина Воеводина, мы не могли оставить без внимания. И в главной российской конференции по суперкомпьютерной тематике это, безусловно, должно быть отражено.
- Кому еще, помимо людей, работающих в этой сфере, будет интересна такая конференция? На мой взгляд, очень важно донести людям, что суперкомпьютерные технологии очень важны в современном мире.
- Вы правы, мы стараемся рассказать людям об универсальности подобных технологий. Я уже упомянул о том, что суперкомпьютерные технологии используются практически везде, поэтому на конференции мы стараемся собрать всех, кто, так или иначе, связан с этими технологиями или применяет их в своей работе.
- Какое будущее ожидает отрасль суперкомпьютерных технологий?
- Невероятно интересное. Оно и не может быть другим. Мы решаем все больше и больше задач, умеем прогнозировать, моделировать и предсказывать благодаря возможностям суперкомпьютеров и развитию математики.
- Есть ли надежда, что мы когда-нибудь догоним первые позиции в ТОП-500?
- Наверно, не нужно ставить цели догнать первые позиции. Нужно поставить цель правильно воспользоваться потенциалом этих технологий и решать актуальные задачи. Быть может, мы не попадем в первую пятерку или в первую тройку, но если у нас будет правильная инфраструктура – несколько крупных национальных центров, мы добьемся многого.
Инфраструктура – это сложное понятие, которое подразумевает создание не только «железа», но программного обеспечения. Для России это исключительно актуальный вопрос не только в плане импортозамещения, но и национальной безопасности, поскольку речь идет о лицензировании. Где гарантии, что нам будут продолжать продавать лицензии на наукоемкое программное обеспечение? И здесь, конечно, эту работу нужно начинать в срочном порядке.
Безусловно, существует тесная связь между суперкомпьютерными технологиями и большими данными (big data). Это направление сегодня на слуху у всех, и многие компании реально используют большие данные в свою пользу. Если посмотреть список Fortune 500 самых мощных компаний мира, то можно заметить, что первая десятка компаний использует технологию больших данных для своей работы. Кто номер один? Walmart – розничная сеть. Казалось бы, ну с какой стати в этой области используются big data? Но благодаря этим технологиям компания может отследить среди десятков тысяч магазинов по всему миру, что в каком-то одном или двух магазинах с реализацией конкретного продукта что-то не так.
И это как раз результат аналитики больших данных, про которые все говорят. А где больше данные – там и суперкомпьютеры.