Главный редактор еженедельника «АН» Андрей УГЛАНОВ в интервью с академиком РАН Игорем КАЛЯЕВЫМ обсуждает текущее состояние и перспективы развития в России суперкомпьютерных технологий, искусственного интеллекта и квантовых вычислительных систем. Сегодня первая часть беседы.
– Уважаемый Игорь Анатольевич! На наших глазах во всём мире продолжается бум применения так называемого «искусственного интеллекта» – ИИ. Создавать программы, на которых работают эти нейросети, или просто нейронки, можно только с помощью суперкомпьютеров. Какие основные характеристики отличают суперкомпьютеры от обычных компьютеров и какое место занимает наша страна в списке государств, в которых развиваются суперкомпьютерные технологии?
– Несмотря на то что компьютерные технологии развиваются уже более 70 лет, до сих пор отсутствует какое-либо общепринятое определение суперкомпьютера (СК). Подспудно под СК понимается вычислительная система, значительно превосходящая по своим техническим параметрам большинство существующих на данный момент вычислительных машин. При этом возникает вопрос: а по каким параметрам она должна их превосходить? Есть шуточные определения СК как вычислительная машина, весящая больше тонны или стоящая больше 1 миллиона долларов. Но если говорить серьёзно, то основным техническим параметром, который определяет, относится ли система к классу суперкомпьютеров, является её производительность, т.е. число вычислительных операций, выполняемых системой в единицу времени.
Дважды в год публикуется так называемый рейтинг топ-500, включающий в свой состав 500 наиболее производительных вычислительных систем (ВС) мирового сообщества. При этом для оценки производительности той или иной вычислительной системы используются эталонные (тестовые) наборы программ LINPACK – решение системы линейных алгебраических уравнений с плотной матрицей (матрицы 100х100, 300х300, 1000х1000). Именно по результатам этих тестов и определяется положение той или иной ВС в рейтинге топ‑500. Поэтому, с моей точки зрения, к классу СК следует относить те ВС, которые входят сегодня в этот рейтинг топ-500. При этом следует отметить, что этот список быстро меняется, и тот СК, который в 2008 году занимал первое место в этом рейтинге, сегодня даже не попадёт в этот список.
В последний список топ-500 входят всего лишь семь российских СК, вернее сказать, СК, работающих на территории России, поскольку российскими их можно назвать с большой натяжкой. По числу СК мы занимаем 13-е место в мире и отстаём не только от ведущих научно-технических держав, но и от Бразилии, Саудовской Аравии, Нидерландов. По суммарным суперкомпьютерным мощностям Россия занимает 10-е место, причём по этому параметру мы отстаём в 30–40 раз от лидеров – США и Китая.
Суперкомпьютер – как база всего сущего
– Вы сказали, что в мировом рейтинге топ-500 есть только семь российских суперкомпьютеров, лидируют Китай, США и Япония. Производительность российских суперкомпьютеров в 30–40 раз ниже, чем у ведущих стран. Почему? У нас же одни из самых лучших математических школ в мире. Как преодолеть отставание?
– К сожалению, как я уже сказал выше, российскими наши СК можно назвать с большой натяжкой, поскольку они собраны в основном из зарубежных комплектующих. Соответственно, самые современные комплектующие, особенно сейчас, нам никто не поставит. И тут никакая математическая школа не поможет. Надо просто развивать отечественные технологии создания микроэлектронной компонентной базы. Современные зарубежные микроэлектронные производства работают по технологическим нормам 5–7 нм, а у нас наиболее продвинутое микроэлектронное производство на «Микроне» работает по нормам 65–90 нм. И до тех пор, пока мы не догоним Запад по этим производственным возможностям, мы так и будем отставать.
Но проблема ещё и в том, что наиболее производительные российские суперкомпьютеры принадлежат коммерческим компаниям – «Яндексу», Сбербанку и задействованы в первую очередь для решения их корпоративных задач. Поэтому по удельным показателям обеспеченности российских учёных и исследователей суперкомпьютерными ресурсами, мы отстаём от мировых лидеров на два порядка. Удельное значение производительности суперкомпьютеров в области науки и образования на одного исследователя в США, Японии, Европе и КНР составляет около 2, 5, 1, 2, 1, 0, 0, 15 Тфлопс соответственно. В России значение этого показателя всего лишь 0, 012 Тфлопс.
Частично проблема нашего отставания от ведущих мировых держав в области суперкомпьютинга, с моей точки зрения, может быть решена путём создания Национальной суперкомпьютерной инфраструктуры (НСКИ), объединяющей в единую вычислительную сеть все российские СК. Отсутствие такой единой суперкомпьютерной инфраструктуры уменьшает доступность суперкомпьютерных ресурсов для исследователей в России. А это, в свою очередь, тормозит развитие профессионального сообщества пользователей высокопроизводительными ресурсами в стране. Кроме того, необходимо создать отечественные облачные сервисы, в том числе на основе технологий искусственного интеллекта, обеспечивающие доступ к суперкомпьютерным ресурсам такой НСКИ широкому кругу пользователей из организаций науки, образования и промышленности, работающих в различных регионах страны. Такая сеть суперкомпьютерных центров должна обеспечивать магистральную связность не менее 400 Гигабит в секунду. Подключение центров к магистрали со скоростями не менее 10 Гбит/с. Это позволит реализовать высокопроизводительный обмен данными между суперкомпьютерными центрами, что необходимо для организации эффективных распределённых вычислений.
Создание Национальной суперкомпьютерной инфраструктуры позволит нам не только решить задачу кратного увеличения суперкомпьютерных мощностей, поставленную президентом, но и существенно сократить наше отставание от Запада в части обеспечения науки, образования и промышленности высокопроизводительной вычислительной техникой.
Следует отметить, что создание такой НСКИ полностью отвечает Стратегии научно-технологического развития страны, утверждённой президентом. Им поставлена приоритетная задача поддержки создания и развития уникальных научных установок класса «мегасайенс». Так вот НСКИ как раз и будет представлять собой такую уникальную научную установку класса «мегасайенс» национального уровня с широким спектром отечественных и, возможно, зарубежных пользователей. Концепция создания такой НСКИ была разработана ведущими учёными страны ещё в 2019 году, прошла всестороннее рассмотрение и была одобрена Советом по приоритетному направлению Стратегии научно-технологического развития. К сожалению, с тех пор ничего не изменилось. Этот документ продолжает ходить по различным чиновничьим инстанциям без всякого практического результата, в то время как за рубежом, например в Китае, такая суперкомпьютерная инфраструктура, реализующая те же принципы, активно создаётся.
– Много говорят о квантовых компьютерах. Помню, моя газета писала, что мы в этой сфере находимся в лидерах. И он у нас вот-вот появится. Как на самом деле?
– Пока я достаточно скептически отношусь к утверждениям, что в ближайшее время появятся квантовые компьютеры (КК), способные конкурировать с классическими СК при решении практически важных задач. Теоретические преимущества квантовых компьютеров основаны на том, что в них для обработки данных используются не классические логические элементы, которые могут находиться только в двух состояниях – 0 или 1. А так называемые кубиты (qubit, quantum bit), представляющие собой квантовые объекты, состояние которых может быть произвольной суперпозицией этих двух значений. Теоретически, если все кубиты связаны (запутаны) между собой, то квантовый компьютер может одновременно (параллельно) обрабатывать сразу 2N данных, где N – число вычислительных элементов – кубитов, в то время как в классическом компьютере подобная операция потребует выполнения 2N последовательных шагов. Однако за более чем 20-летний период развития этого направления реальные прикладные достижения не столь впечатляющие. Никаких признаков закона Мура, который до последнего времени определял темпы развития классических кремниевых компьютеров, здесь пока что не наблюдается и близко. Основными проблемами создания квантовых компьютеров являются: чрезвычайная подверженность шумам, причём чем больше число кубитов, тем сильнее эта зависимость, а также сложности ввода-вывода информации, поскольку любое внешнее воздействие может приводить к разрушению квантового состояния кубитов. Поэтому, когда появляются громогласные заявления, что мы создали КК на 20, 30, 50 кубитов, – надо в первую очередь выяснить, а какая точность вычислений обеспечивается на каждом таком кубите, о чём разработчики, как правило, скромно умалчивают. Если, например, точность вычисления на одном кубите 0, 9, то на двух кубитах она уже будет составлять 0,8, а на трёх 0,7. Ну и какой смысл тогда создавать такой КК на 20 кубитов, если точность вычислений на нем будет практически нулевая?
Для повышения точности вычислений необходимо использовать дополнительные кубиты для квантовой коррекции ошибок. При этом, по оценкам специалистов, решение практически значимых задач потребует создания квантового компьютера с числом логических кубитов (эффективно участвующих в вычислениях) как минимум в диапазоне от 500 до 2000. А для квантовой коррекции ошибок потребует ещё больше дополнительных кубитов (примерно на 2-3 порядка). Поэтому создание квантовых компьютеров с таким количеством устойчиво работающих кубитов в ближайшие 10 лет, с моей точки зрения, маловероятно.
– Илон Маск занят вживлением управляющего чипа, или микросхемы, в мозг человека. Он об этом открыто заявил. Уверен, что такие исследования не афишируются, но давно проводятся в Китае, США да и в Европе. Может в финале таких разработок человеческий мозг быть переписан и загружен в «железо», как в фантастических фильмах? Таких фильмов много. Дело за малым? За чем?
– Открою небольшой секрет, о котором сейчас уже можно говорить. Ещё 20 лет назад мы уже проводили подобные исследования. Вживили в мозг черепахи специальные электроды и через них с помощью специально созданного нейростимулятора смогли управлять её движением, как движением автомобиля, подавая команды «вперёд», «вправо», «влево» и «стоп». Есть видеофильмы, которые демонстрируют такое внешнее управление черепахой.
Что касается возможности создания «железного» аналога человеческого мозга, то пока что это научная фантастика. По моим оценкам, для моделирования 100% активности человеческого мозга в реальном времени нам понадобится суперкомпьютер с производительностью 10 в 21 степени Флопс. Если исходить из сегодняшних технологий, такой суперкомпьютер будет занимать около 4·106 м3 объёма, что эквивалентно зданию 300х300 метров в основании и 50 метров высотой. Он будет потреблять около 15 ГВатт электроэнергии, что сравнимо с тремя Саяно-Шушенскими ГЭС. В то же время человеческий мозг занимает всего лишь 0,0015 м3 объёма и потребляет около 20 Ватт. То есть попытки создания аналога человеческого мозга с помощью современных компьютерных технологий – это путь в никуда. Он уводит нас от конечной цели – создания искусственного аналога человеческого мозга, поскольку мозг работает по совершенно другим, до сих пор непонятным нам принципам. Даже если гипотетически когда-нибудь мы создадим полный «железный» аналог человеческого мозга, то он всё равно, с моей точки зрения, останется «грудой железа» и не более того. Должна быть ещё какая-то, до сих пор непонятная нам составляющая. Назовите её «душа» или как-то по-другому, без которой эта «груда железа» мыслить по-человечески не сможет.
Чем ChatGPT отличается от суперкомпьютера?
– Пару лет назад наступила эра практического применения ИИ. Я сам увлёкся нейронками и вовсю пользуюсь чатом GPT‑4. В том числе и его составляющей DELL-A, которая генерирует изображения. Может, как раз нейронки, а их уже тысячи, в том числе и созданные у нас в стране, – и есть «суперкомпьютер будущего»?
– Суперкомпьютеры – это вычислительные системы, способные решать самые разнообразные вычислительные задачи, в то время как нейронные сети ориентированы на решение класса плохоформализуемых задач классификации, прогнозирования, принятия решения и т.д. При этом сложные нейронные сети физически реализуются на суперкомпьютерах. Например, упомянутый ChatGPT, физически «живёт» на суперкомпьютере Azure AI, содержащем 285 тысяч процессорных ядер и 10 тысяч GPU и имеющем производительность 30 Пфлопс.
– То есть для создания нейронок нужны суперкомпьютеры?
– Безусловно. Сегодня наблюдается экспоненциальный рост объёмов задач машинного обучения искусственных нейронных сетей, который в пять раз превышает рост производительности компьютеров согласно закону Мура. Например, последним широко разрекламированным достижением в области ИИ является большая языковая модель ChatGPT (Generаtive Pre-Trained Transformer), которая использует более 175 миллиардов варьируемых параметров и прошла обучение на 420 Гбайт текстовых данных. Для сравнения: все творения Шекспира «весят» всего 5,5 Мбайт, а если вы будете читать по 1 странице текста в минуту 24 часа в сутки, то вам понадобится 400 лет, чтобы достичь уровня «образованности» ChatGPT. Такие возможности ChatGPT, как я уже сказал выше, достигаются в первую очередь за счёт использования при его реализации специального суперкомпьютера Azure AI. Однако, даже несмотря на использование такого мощного суперкомпьютера, как Azure AI, обучение ChatGPT заняло несколько месяцев и стоило около 1,5 миллиона долларов. Причём затраты электроэнергии при этом были эквивалентны трёхнедельному потреблению Нью-Йорка.
Поэтому в настоящее время всё более актуальной становится проблема поиска альтернативных путей создания суперкомпьютерных систем для ускоренного машинного обучения, в том числе основанных на иных физических принципах. В настоящее время такие технологии активно разрабатываются во всём мире, в том числе и в нашей стране.
Например, одним из перспективных подходов к проблеме ускоренного машинного обучения является использование реконфигурируемых вычислительных систем (РВС), построенных на базе вычислительных полей ПЛИС, который развивается у нас в Таганроге. В отличие от классических вычислительных машин, архитектура которых закладывается на этапе их создания, архитектура РВС может изменяться и адаптироваться под решаемую задачу.
Ещё один перспективный подход к проблеме ускоренного машинного обучения связан с использованием вычислительных систем, работающих на иных физических принципах. Если проанализировать весь спектр различных вычислительных операций, выполняемых при решении задачи машинного обучения нейронной сети, то можно заметить, что их львиную долю, около 90%, составляют операции перемножения вектора на матрицу. Отсюда можно сделать вывод, что для снижения времени машинного обучения необходимо в первую очередь ускорить выполнение именно данных вычислительных операций. И здесь нам могут помочь технологии создания фотонных и нейроморфных мемристорных вычислителей, которые в настоящее время у нас успешно разрабатываются в рамках научной программы.
Вообще, можно смело утверждать, что большинство из приведённых выше достижений в области ИИ напрямую связаны с ростом производительности суперкомпьютеров. Если проанализировать историю развития суперкомпьютерных технологий и ИИ в совокупности, то наглядно видно, что появление суперкомпьютера с производительностью 1 Тфлопс (1012 операций с плавающей запятой в секунду) совпало с созданием программы Deep Blue, которая впервые победила чемпиона мира по шахматам. Появление суперкомпьютера с производительностью 1 Пфлопс совпадает с моментом создания программы Watson, которая победила в игре «Своя игра». А суперкомпьютера 10 Пфлопс – с моментом создания программа AlphaGo, которая обыграла чемпиона мира по игре го. Появление суперкомпьютера с производительностью в 30–100 Пфлопс коррелирует с созданием чат-ботов GPT.
Отсюда можно сделать вывод, что большинство достижений ИИ связаны не с каким-либо повышением «интеллекта» машин, а просто с ростом их быстродействия и, как следствие, возможностями обработки всё больших массивов данных. Например, суперкомпьютер Deep Blue, впервые обыгравший в 1997 году чемпиона мира по шахматам, был способен анализировать до 200 миллионов шахматных позиций в секунду и прогнозировать развитие ситуации на шахматной доске до 20 шагов вперёд. Очевидно, что человеческий мозг с этим справиться просто не в состоянии.
– В мозге человека порядка 80 миллиардов нейронов. Скоро в мире будет столько же компьютеров – аналогов нейронов человеческого мозга, который может быть объединён в одном супероблаке. Это может стать полным аналогом человеческого мозга? Зачем такой аналог может потребоваться? Или тут проявится новое свойство супермозга – эмерджентность. Расскажите об этом понятии подробнее.
– Действительно, на начало 2020 года к Всемирной сети Интернет было подключено около 25 миллиардов компьютерных устройств, причём их число в последнее время возрастает экспоненциально и в недалёком будущем достигнет 80 миллиардов, т.е. будет сопоставимо с числом нейронов в мозге человека. Однако говорить, что «супермозг» создан, по-моему, преждевременно, поскольку это будет всего лишь очень сложная компьютерная сеть, работающая по принципам, никоим образом не соответствующим принципам работы человеческого мозга, либо какого-то другого живого существа. Например, в мозге собаки около 500 миллионов нейронов, а в мозге кошки – всего лишь 250 миллионов нейронов. И хотя Всемирная сеть содержит на порядок больше компьютерных устройств, тем не менее до сих пор с её помощью не созданы их искусственные мозги.
Другое дело – всемирная компьютерная сеть становится настолько сложной, что любой непредвиденный сбой или дефект отдельного устройства, подключённого к ней, может гипотетически привести к лавинообразному эффекту. И, как следствие, к возникновению в ней непредвиденных свойств, то есть возникновению так называемого эмерджентного интеллекта. По определению, эмерджентный интеллект - это проявление новых свойств системы, которыми не обладает ни один входящий в неё элемент. Наглядными примерами эмерджентного интеллекта являются колонии муравьёв или пчелиные ульи, где каждый отдельный элемент системы (муравей или пчела) обладает крайне ограниченными возможностями, но их коллективное взаимодействие приводит к проявлению значительно более сложных свойств и возможностей системы в целом.
В настоящее время в мире всё чаще наблюдаются различного рода техногенные аварии и катастрофы, которые зачастую списывают на каких-то мифических хакеров. А возможно – это первые проявления возникновения эмерджентного интеллекта во Всемирной сети, и к этому необходимо готовиться.
«Чёрный ящик» экономики ИИ
– Лидером в области ИИ является Китай, на который приходится около 60% мировых инвестиций в исследования и разработки в области ИИ. Причём в фундаментальные и прикладные исследования Китай вкладывает около 20 миллиардов долларов в год, а в смежные отрасли – более 150 миллиардов долларов. В США федеральные ассигнования в области ИИ в настоящее время составляют более 1 миллиарда долларов в год, а суммарные затраты крупнейших корпораций и венчурных фондов – около 25 миллиардов долларов в год. Самое бы время спросить – а как у нас? Но это, скорее всего, закрытые цифры.
И вот что интересно. В 2019 году вы дали такой прогноз: внедрение технологий ИИ может обеспечить к 2025 году удвоение темпов роста ВВП ведущих государств мира и увеличение мирового ВВП на 15 триллионов долларов. Но уже меньше года до указанной даты, а ВВП всех стран Запада растёт меньше чем на 2% в год. Прогноз пока не сбылся. В чём причина? Быть может, в переоценке возможностей ИИ? Лично я вижу некий прорыв только в медицине и образовании. А если взять технику и промышленность, то американская авиационная фирма «Боинг», к примеру, просто погрязла в неких проблемах. Я имею в виду её гражданский сектор пассажирских самолётов. Так каким видится сегодня будущее применения ИИ? К примеру, как я ни стараюсь, не может ChatGPT написать статью лучше меня. А мне так хотелось разгрузить себя, чтобы нейронка клепала статьи тысячами и каждый час. Но этого не произошло. А картинки, которые генерирует другой лидер в области ИИ – Midjourney, – нужны только для развлечения, и этот процесс уже многим надоел. Так какое будущее применения ИИ вы видите сегодня, в 2024 году?
– Я не экономист. Поэтому мой прогноз об удвоении ВВП ведущих мировых держав за счёт использования технологий ИИ к 2025 году основывался на данных из статей специалистов в экономических науках. К сожалению, экономические прогнозы зачастую оказываются ошибочными, поскольку не могут учесть многие субъективные факторы, в том числе политические решения. Тем не менее можно смело утверждать, что ИИ всё сильнее входит во все сферы человеческой жизни. Но что это даёт с точки зрения экономического эффекта – вопрос к экономистам.
Если говорить честно, то я считаю, что никакого ИИ нет. Всё, что сегодня понимается под ИИ, – это компьютерные программы, созданные человеком. Да, эти программы становятся всё сложнее и сложнее. Зачастую человек уже не может понять, почему данная программа выдаёт то или иное решение. При этом внешне создаётся впечатление, что компьютер мыслит. Но уверяю вас, что компьютер – это груда железа, которая самостоятельно мыслить не может, а может только реализовывать алгоритм, заложенный в него программным способом человеком-программистом. А программа – это жёсткая инструкция: делай раз, делай два, и за её рамки компьютер выйти не может.
Есть так называемый парадокс Сёрла, суть которого заключается в следующем. Два человека находятся в комнате, разделённой перегородкой с маленьким окошечком. Один человек знает китайский язык, а другой – нет. Тот, кто знает китайский язык, пишет на бумажке вопросы на китайском и передаёт через окошечко человеку, который по-китайски ни бельмеса не понимает. Но у него есть инструкция, что на такой набор иероглифов он должен написать на ответном листочке другой набор иероглифов. Что он и делает – передаёт ответный листочек через окошко обратно человеку, знающему китайский. И у последнего создаётся впечатление, что он ведёт беседу с человеком, который в какой-то мере знает китайский язык. Именно так и работает современный ИИ. В частности, пресловутый ChatGPT.
Современный ИИ – это инструмент, такой же как, например, молоток. Но если молоток усиливает физические возможности человека, то подобные компьютерные программы усиливают интеллектуальные (умственные) возможности человека. В основном за счёт огромного быстродействия компьютера. При этом ИИ не способен создать что-то новое, отличное от того, чему он был обучен. Именно поэтому он и не может заменить вас при написании оригинальной статьи. А вот использовать ИИ для написания студенческого реферата вполне возможно, чем недобросовестные студенты сегодня повсеместно и пользуются. ИИ может заменить человека там, где не надо думать, а надо действовать по инструкции (алгоритму). Думающего человека, способного создавать что-то новое, ИИ заменить не способен. По крайней мере пока.
Окончание в следующем номере