Генеральный директор Института искусственного интеллекта AIRI, профессор РАН Иван Оселедец — о семье, математике и о том, что ждет область искусственного интеллекта в самом ближайшем будущем
— Из вашей биографии я узнал, что вы потомственный математик сразу по обеим линиям. Казалось бы, в такой ситуации сложно стать кем-то еще, кроме как математиком. И все же, если бы не математика, где бы вы хотели и могли себя реализовать?
— Я всегда как-то целился в сторону математики. Но сейчас мне кажется, что у меня довольно неплохо получается менеджерить, управлять какими-то вещами. То есть это некая менеджерская работа, но точно не связанная с гуманитарными областями — тут точно нет. Организационная работа мне вполне подходит.
— Я также читал про вас, что поступление в МФТИ было непростым. Вы можете немного рассказать об этом?
— История была такая: в 2000 году был рекордный конкурс, по ряду причин, в частности потому, что в 1983 году был бэби-бум, а я как раз тогда и родился. В Советском Союзе тогда разрешили женщинам уходить в декрет с сохранением рабочего места, и все пошли рожать. И вот я попал в число уроженцев этого бума. В общем, был очень высокий конкурс. Я поступал, конечно же, на мехмат МГУ. Поступление шло в три волны. В первые две я не поступил, стал думать, какие еще есть варианты, и на всякий случай подал документы в Физтех (МФТИ). По результатам поступил и на мехмат, и в Физтех, и в итоге выбрал последний. Вот и вся история.
— А если бы вы все-таки поступили на мехмат, вы бы продолжили заниматься той же тематикой, которой занимаетесь сейчас?
— Как известно, у истории сослагательного наклонения не бывает. Но, в общем, мне очень повезло, что я попал в Физтех, потому что — если смотреть, куда попали ребята, которые пошли на мехмат, — Физтех оказался существенно более мобильным, интересным и дающим более сложные задачи, нежели МГУ. Отвечая на ваш вопрос: скорее всего, нет.
— Про вас еще пишут, что вы самый молодой доктор наук по своей специальности, в 29 лет получили степень. Так ведь?
— Ну да. Защищался по вычислительной математике[1].
— Насколько я понял, вам пришлось столкнуться с некоторыми трудностями и сопротивлением во время защиты. Что бы вы, может быть, могли посоветовать современным молодым исследователям, которые сейчас защищаются и оказались в сходной ситуации? Как вы с этим справились? Какие качества вам потребовались?
— Это была обычная академическая история: если есть сопротивление, то это обычно значит, что то, что вы делаете, либо очень плохо, либо очень хорошо и вызывает зависть. Соответственно, если вы с таким столкнулись, проведите аналитику, не все ли у вас совсем плохо, и не делаете ли вы ерунду. Если нет, то можно только за себя порадоваться и сохранять спокойствие. Ничего особенного. То есть это неприятно, но и не смертельно.
— Ваша супруга Екатерина тоже занимается вычислительной математикой, все верно? Вы даже ведете совместные исследования?
— Сейчас уже нет. Она занимается искусственным интеллектом, профессор, руководитель лаборатории.
— Каково это, когда ваша супруга соавтор ваших статей? Насколько сильно работа проникает в семейную жизнь? Удается ли вам разграничивать: семья здесь, работа здесь?
— Конечно, работа проникает в семейную жизнь. В этом есть и плюсы, и минусы. Академические семьи — всегда отдельная история, и такое встречается нередко. Ну у нас есть то, что есть, и в целом мы с этим хорошо живем. Не жалуемся особенно. Хотелось бы, конечно, отключаться от работы, но не всегда получается. С другой стороны, можно дома решить какие-то рабочие вопросы.
— В каких направлениях вы сейчас ведете исследования и почему выбрали именно эти тематики?
— Сейчас я руковожу большой научной группой, в рамках которой я помогаю талантливым ребятам развиваться, и мы работаем в целом ряде направлений. Есть направление, связанное с тензорами, — оно дало группе основную научную известность. Это применение тензорных методов для ускорения методов машинного обучения, для сжатия, построения новых моделей.
Много работы с эффективными методами обучения и инференса (инференсом называют процесс работы уже обученной нейросети — прим.ред.), как их ускорить, сжать и сделать точнее. Большая работа ведется с диффузионными моделями, большими языковыми моделями.
Есть еще одно направление, связанное с ускорением классических методов моделирования. Там уже много чего в последнее время предложено, например гибридные методы. Сейчас искусственный интеллект проникает во все сферы, где необходимо моделирование, и мы стараемся развивать такие алгоритмы.
В общем, работы могут быть абсолютно разные. Сейчас очень сложно сказать: я работаю в одном направлении и буду это делать пять лет. Так поступать невозможно. Все время что-то меняется. Все время возникает что-то новое. Надо подстраиваться.
— Насколько вам удается следовать мировым трендам в этих направлениях?
— Стараемся. Не мне судить, но в некоторых вещах мы показываем себя достойно. Хотя всегда есть желание и ощущение, что нужно делать больше, некая неудовлетворенность. Но интересные результаты есть, статьи публикуются, прикладные проекты делаются. В этом смысле все довольно неплохо.
— Как вы думаете, в будущем вы продолжите заниматься этими направлениями? Будут ли они развиваться? Или скоро дойдут до каких-то пределов насыщения, и надо будет переключаться?
— Я думаю, конечно же, все будет развиваться. Пока предела не видно никакого. Идет очень быстрое развитие, немного необычное. Но, опять же, ничего страшного в этом нет. Насыщения не будет.
— Над какими еще проблемами вам хотелось бы поработать в обозримом будущем?
— Сейчас мы начали работать над генеративным проектированием. То есть это применение генеративного моделирования для, например, автоматизации процессов в строительстве, в проектировании. Например, как построить разводку электрику с помощью нажатия одной кнопочки? Это супервостребованная вещь, очень нужная. Никто только не знает, как это делать. Всегда интересно заняться чем-то подобным.
— Как вы думаете, чем именно сейчас сильна отечественная школа вычислительного искусственного интеллекта?
— В целом мы умные очень и сообразительные. У нас просто не всегда хватает GPU (GPU, или graphics processing unit, — графический процессор, который поддерживает параллельные вычисления, из-за чего очень востребован в машинном обучении. — прим. ред.). Но все люди, которые у нас вырастают, если они здесь не остаются, то получают работу в очень приличных местах на Западе. Это означает, что у наших кадров очень высокий интеллектуальный потенциал. Местами нам не хватает системности в постановке задач и какой-то глубокой трактовки, но так мы ничем не хуже кого-либо в мире.
— Кого из российских или советских ученых вы могли бы назвать отцами-основателями направления, в частности искусственного интеллекта?
— Это непростой вопрос. Если позволите, я подумаю. Отечественные ученые, отцы-основатели искусственного интеллекта?
— Давайте переформулируем. Кого бы вы могли назвать своими учителями?
— Из известных, понятно, это Владимир Вапник и Алексей Червоненкис. Можно также отметить Леонида Вассерштейна, тоже из советских ученых. Леонид Канторович внес большой вклад в теорию оптимального транспорта, которую сейчас используют в машинном обучении. Если чуть дальше пойти — Андрей Колмогоров.
У нас целая школа по искусственному интеллекту была, но специфичная и закрытая. И были очень хорошие результаты. Например, тот же «Буран» — абсолютно автоматическая посадка в 1988 году, мы только сейчас приближаемся к чему-то подобному. Я, к сожалению, подробностей не знаю, кто вообще над этим работал, какие там внутри вещи. Только сейчас удается как-то к информации подойти, даже к историческим вопросам, потому что у нас очень долго не было даже такой специальности, как «компьютерные науки», не говоря уже об искусственном интеллекте. Даже просто алгоритмы и прочее всегда были где-то на задворках.
Но если по фундаментальной науке, то я думаю, что назвал достаточно фамилий.
— Есть ли что-то такое, что случилось в российской науке об искусственном интеллекте в последние годы, о чем аудитории обязательно стоит знать?
— Из таких самых известных событий — работы по Deep Image Prior, проведенные в российском Сколтехе, которые вызвали большой интерес на Западе. Это действительно был маленький фурор, ведь оказалось, что можно обучать сверхточные нейронные сети даже всего по одной картинке. Это то, что обязательно следует упомянуть.
Еще очень хороший цикл работ по оптимальному транспорту за авторством Александра Коротина и Евгения Бурнаева. У нас есть довольно неплохие работы, как мне кажется, связанные с применением гиперболической геометрии для машинного обучения. Естественно, был целый цикл работ Александра Гасникова, статьи про разные методы оптимизации. Еще были работы группы Дмитрия Ветрова по разнообразным вариантам байесовских методов, причем достаточно импактные. Вот что приходит на ум из того, что стоит знать.
— Про вас говорят как про человека, который обладает способностью концентрироваться и работать даже не в самых подходящих для этого условиях. Например, в шуме. Это правда? Как вы этому научились?
— Концентрироваться вообще сложно в современном электронном мире, сидеть достаточно долго, чтобы тебя не отвлекали. Иногда бывает так: идет какая-нибудь конференция или доклад, есть один источник шума — докладчик. И если суть доклада понятна, то можно отвлечься и заняться своими вещами, и это работает.
— Может быть, есть какие-нибудь еще лайфхаки, чтобы не отвлекаться? Музыка, например?
— Музыку я не люблю. И музыка меня отвлекает. Это первое. Второе: идеи зачастую возникают именно в коммуникации, когда ты начинаешь кому-то рассказывать, что ты делаешь, или спрашивать, кто что делает. В этот момент появляется наибольшее количество соображений на тему того, что можно было бы сделать еще, поправить, изменить. Если этого нет, то работа зачастую идет очень тяжело и медленно, а потом ты с кем-нибудь поговорил и «О, а можно же было вот так сделать?». То есть такая коммуникация очень помогает.
— Как вы любите отдыхать? Какой тип отдыха помогает отдохнуть голове лучше всего, как-то переключиться от интеллектуальной деятельности?
— К сожалению или к счастью, голова никогда не отдыхает. Да и отдыхать приходится нечасто. Может быть, что-нибудь стандартное, например кататься на лыжах, съездить в санаторий. Путешествуем в основном, это интересно, полезно. Я еще люблю за рулем сидеть, куда-то там ехать. В этих способах, как мне кажется, ничего необычного нет.
— А развлечения вроде кино, видеоигр?
— Ну иногда хочется посмотреть фильм. У нас дома большой проектор, поэтому, в принципе, нет особой нужды ходить в кино. Можно его развернуть и посмотреть какой-нибудь сериал запоем, от начала и до конца. Это в целом прикольно. Не скажу, что ты при этом как-то отдыхаешь, но удовольствие можно получить, если сериал хороший. Вполне могу себе позволить подобное времяпровождение.
— Говоря про кино: приходилось ли вам смотреть фильмы про математиков? Если да, то какие?
— Я смотрел этот известный байопик про Джона Нэша («Игры разума», 2001, США, режиссер Рон Говард). Забавно. А еще какие там бывали, я не помню.
— Вот есть сериал «4исла» (2005–2010, США), например?
—Такой сериал я не смотрел.
— Или «Двадцать одно» (2008, США, режиссер Роберт Лукетич), как они выигрывали в казино с помощью расчетов в уме?
— Это видел, да. Прикольно. Я смотрю такие фильмы абсолютно так же, как обычный зритель.
— То есть нет никакого раздражения или, наоборот, приятных ощущений от того, что математиков показывают так, а не иначе?
— Нет. Вообще никакого. Я воспринимаю это просто как кино и все.
— Я хотел бы кое-что узнать про проникновение искусственного интеллекта в другие науки. Скажем, физиков первой половины XX века в университетах учили решать дифференциальные уравнения преимущественно аналитически, но потом появились компьютеры, и сегодня в каждом университете проходят методы конечных элементов. Как вы считаете, через сколько лет физикам в обязательном порядке начнут преподавать нейронные методы решения дифференциальных уравнений?
— Я считаю, этому надо учить уже сейчас. В целом условный бакалавриат по Physics and AI кажется полезным и востребованным. Там нет ничего сложного, да и профессионалы все чаще уходят туда, потому что там появляются деньги. Поэтому естественно, что и образование тоже будет развиваться в этом направлении. Конечно, пока наши физические факультеты пока развернутся в ту сторону, еще небось сто лет пройдет.
— Ну а сколько же все-таки лет пройдет, пока наши физфаки развернутся?
— Точной цифры назвать, конечно, невозможно. Когда этим навыкам начнут обучать в научных группах, то тогда и учебные программы начнут быстро перестраиваться.
— А в других науках кому в первую очередь придется поменять свои учебные курсы? Я так понимаю, биологам и химикам? Наверное, еще лингвистам?
— По некоторым направлениям уже. Понятно, что есть, к примеру, классическая химия, которая никуда не денется. Но вот биоинформатика — это уже отдельная наука и «биоинформатик» не равно «биолог». Это уже вопрос инструментов, который в биоинформатике свой стандартный, опирающийся в том числе и на искусственный интеллект.
Похожая история с хемоинформатикой. Нужны ли ее методы химику? Нет, у них там достаточно четкое разделение труда: один смешивает, другой моделирует и так далее. Поэтому раз выделились соответствующие специальности, где используются численные методы в том или ином виде, где есть статистика и обработка, то, конечно же, методы машинного обучения уже там есть. Я так думаю.
— Я прочитал один из последних постов в вашем телеграм-канале про участие в конференции ICML 2024 (International Conference on Machine Learning, Вена, 21–27 июля), где вы пишете о гигантском числе участников. Известно, что эта величина и в целом число ML-исследователей растет с каждым годом экспоненциально, и с этим сталкиваются все крупные конференции.
— Ну да.
— Хорошо это или плохо? Чем это грозит? Наверное, этот тренд когда-нибудь остановится?
— Экспоненциальный тренд не может длиться бесконечно, как вы понимаете, и когда-нибудь он остановится. Он означает, что в данный момент к этой области есть большой интерес. Соответственно, там имеется большая выгода для исследователей. Как только там не останется чего-то нового или выгода уйдет, пойдет спад или наступит равновесие. Но пока этого не видно: еще много всего недоисследовано. Вот мы сейчас в этой точке и находимся. Сложно сказать, что будет через год или через два. Увидим.
— Просто сейчас кажется, что организаторам ICML или NeurIPS уже тяжело разруливать эти толпы людей, а попасть на постерную секцию и увидеть все постеры физически невозможно, не говоря уже о рецензировании.
— Теоретически все возможно. Существуют всякие системы, которые позволяют тебе как-то быстро отфильтровать некоторое число заявок. Может, полностью на них и нельзя положиться, но большое количество интересных так отсеять можно. Престижная конференция по искусственному интеллекту — это супермощная, заряжающая знаниями и энергией площадка, организаторы, которые понимают, что и как делать с таким большим числом участников. Все же там неглупые люди этим занимаются.
ICML — это еще не самое страшное. Самое страшное — это NeurIPS, там вообще 20 тысяч сабмитов (заявок). Раньше не было такого, а сейчас есть. Значит, надо учиться работать с таким количеством статей. Может быть, надо меньше принимать. Может быть, что-то делать с рецензированием. Может быть, надо разделять. Ну придумают! Я очень спокойно к этому отношусь.
— То есть это чисто технические вещи, которые вполне преодолимы.
— Да. Это технические вещи. Но, кстати, порой не всем желающим удается попасть туда из-за тех же самых проблем с визами.
— А не совершаем ли мы ошибку, улучшая и улучшая ИИ такими усилиями?
— Вне зависимости от того, будем мы с вами заниматься изучением технологии или не будем, она найдет свое применение. В академической среде значимость развития искусственного интеллекта подтверждает ежегодный рост числа публикаций по теме, в бизнес-сообществе валидацией спроса служит колоссальный рост компаний, создающих продукты на основе ИИ. Вопрос лишь в том, кто возглавит ее развитие, а кто сознательно запишет себя в роль догоняющего.
— Еще такой вопрос, немножко абстрактный: насколько я понимаю, вы сейчас занимаетесь тензорными разложениями?
— Да.
— Это многомерные массивы, которые довольно сложно визуализировать. Скажем, когда обучаешь школьников или студентов первого курса взятию производных, в принципе, их можно нарисовать. Можно объяснить, касательную изобразить. И здесь визуальная интуиция очень помогает. А вот как научиться включать интуицию, когда речь идет вот о таких сложных структурах, которые невозможно нарисовать и приходится пользоваться только математической записью? Есть ли здесь какая-то существенная разница?
— Действительно, есть левое и правое полушария мозга. Соответственно, есть геометрическое воображение, есть алгебраическое. В последнем случае максимально простая конструкция: нарисовать можно двумерный или трехмерный кубик, и этим ограничиться, а дальше использовать способность к обобщению. С другой стороны, если человек сам не может справиться с подобной задачей, то, наверное, ему не надо заниматься тензорами. Как-то так. В целом ничего в этом сложного нет. Там есть своя специфика, но все идет из линейной алгебры, которую преподают в самом начале. Правильно объяснить линейную алгебру очень важно, тогда и с многомерными тензорами проблем не будет.
— Последний короткий вопрос: кто ваши кумиры или люди-примеры в науке?
— Это в первую очередь очень крутой ученый из MIT по имени Гилберт Стрэнг. Он много лет читал линейную алгебру. Естественно, Евгений Евгеньевич Тыртышников (научный руководитель Ивана Оселедца. — прим.ред.) для меня пример. Думаю, из пожилого поколения я бы назвал этих двоих.
Что касается этого поколения… Не могу сказать, что это мой кумир, но я в некотором роде фанат Челси Финн из Беркли (в Беркли Челси получала ученую степень. Ныне работает в Стэнфорде. — прим.ред.). У нее такие замечательные статьи, короткие, понятные, и которые действительно приятно читать, там есть авторский почерк. Также хотел бы отметить Сергея Левина из СПбГУ.
[1] Оселедец И.В. Вычислительные тензорные методы и их применения : автореф. дисс. … д-ра ф.-м. наук. М., 2012. URL: https://www.inm.ras.ru/wp-content/uploads/dis-sovet/disser/Oseledets.pdf (дата обращения: 26.08.2024). Работа выполнена в ФГБУН Институте вычислительной математики РАН.
Опубликовано при поддержке гранта Минобрнауки России в рамках федерального проекта «Популяризация науки и технологий» № 075-15-2024-571.