Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Михаил Криницкий: «Технологическая сингулярность — это просто момент, когда мы перестанем успевать за прогрессом самих нейросетей, перестанем их интерпретировать и контролировать!»
Корреспондент Naked Science поговорил с заведующим лабораторией машинного обучения в науках о Земле МФТИ, старшим научным сотрудником Института океанологии РАН Михаилом Криницким о том, чем отличаются машинное обучение и искусственный интеллект, как нейронные сети уже сегодня предсказывают погоду, каким образом математик может стать океанологом и почему океанолог в наше время обязан быть немного математиком, чем так хорош для студентов и ученых проект «Плавучий университет» и есть ли у паучков интеллект.
[Naked Science]: Михаил, вы кто вообще такой? Нет, погодите, немного неправильно начал. Давайте так: как себя чувствует человек, который одновременно и физик, и океанолог, и немножечко математик? И можно ли вообще сказать «немножечко математик» о человеке, который машинным обучением занимается?
[Михаил Криницкий]: Ну конечно же, можно. Я математик!
◉ Но при этом многие физики и математики, наверное, вас немножко не за своего держат? А вот по профессии вы кто?
– В моем дипломе написано, что я физик. А по профессии я, строго говоря, скорее программист. И я долго зарабатывал после университета, собственно говоря, тем, что был хорошим программистом, потом начальником IT-отдела…
◉ Ух, ты! Это мне близко, я сам какое-то время был директором по IT. А на чем писали?
– В «1С» есть встроенный язык программирования. Но этот этап в моей жизни остался далеко позади. В любом случае профессионально все у меня могло сложиться совсем по-разному. Знаете, я в один прекрасный момент настолько глубоко и профессионально танцевал, что меня звали в Европу зарабатывать. Танцем зарабатывать, представляете? Но уже тогда я сказал: я уже в науке, так что спасибо за предложение, но, пожалуй, нет!
◉ Получается, что и программирование когда-то было параллельно с наукой, и вы с нее не совсем соскакивали?
– Как раз наоборот, тогда совсем соскочил. А потом вернулся в науку, но только не совсем в ту же точку. Моя кафедра называлась кафедрой квантовой теории физики высоких энергий. Это физики-ядерщики, уточню. Если бы я пошел по своей науке, то я бы работал либо в ЦЕРНе, либо в наших структурах, которые с ним ассоциированы: это НИИ ядерной физики в МГУ имени М. В. Ломоносова, либо какие-то в Дубне учреждения.
◉ Или в Академгородке?
– Да, или в нем. Либо же вернулся бы в свой родной Саров и там уже работал бы в прикладной области. Но как-то так случилось, что сразу после защиты диплома я бросился совсем в другую область — зарабатывать, семью обеспечивать, ну вы понимаете. А дальше… Дальше я в какой-то момент уже как руководитель IT-отдела некоей компании хорошо видел, что компании-то осталось пару лет, не больше. Я приложил все силы к тому, чтобы она развалилась не до конца, но моих сил, видимо, было недостаточно. А тут мой друг мне и говорит: «Нам нужен очень хороший программист, который умеет вот это, вот это и вот это».
◉ Когда это было?
– Году в 2008-м примерно. Речь идет об институте океанологии имени Ширшова. С тех пор там и работаю. Вернее, так: основная работа у меня теперь на Физтехе (МФТИ. — NS), но и океанологом тоже остаюсь. Есть в ИО РАН такая лаборатория взаимодействия океана и атмосферы и мониторинга климатических изменений — я больше 10 лет учился это без запинки произносить (смеется). А во главе ее — Сергей Константинович Гулёв, человек, который не устает меня поражать. Он одновременно во всех областях, которые касаются океана, атмосферы и взаимодействия, потоков между ними — признанный эксперт, которого о чем ни спроси, он на все может дать ответ. И открыт ко всему новому, что может помочь в исследованиях. Так в свое время появилось направление машинного обучения в нашей лаборатории, которое я сейчас возглавляю. Мне просто не запретили. Тогда это еще не было особо модным, ну а мне казалось, что это просто безумно интересно.
◉ Получается, что у вас как бы две лаборатории одновременно: и в институте океанологии, и на Физтехе?
– Конечно. В одной я зав.лаб, в другой старший научный сотрудник. С океанологией контакт терять никак нельзя.
◉ Почему?
– А потому что все задачи, которые мы можем решать машинным обучением, они все в науках о Земле. Данных-то хороших и красивых хватает у многих, и приборов отличных много, и инструментов, а вот задачи — дело другое. Другими словами, мы, условно физфаковские или физтеховские, знаем, как измерить, как обработать данные, но не всегда знаем, зачем.
А коллеги из института океанологии (ну или географического факультета МГУ, скажем), они как раз знают, зачем, что и что из этого последует. Конечно, это не абсолютное деление. Но в обычном случае морских биологов на Физтехе вы не найдете. И вот одни ученые в одном институте знают, что нужно посчитать тех же самых дельфинов, морских котиков, и знают, зачем их нужно подсчитывать. На Физтехе мы эту их задачку можем решить, потому что у нас есть экспертиза в машинном обучении, нужное расчетное оборудование и так далее. Опять же, мы в Институте океанологии знаем, что есть такая задача гармонизации данных по облачности за последние 150 лет. На Физтехе мы знаем, как ее решать, но там такая задача просто не стоит.
◉ Погодите, есть же какие-то понятные и очевидные задачи у ядерщиков: посчитать какое-нибудь горение? Там тоже нужна синергия двух разных институтов, выходит?
– К ним не суюсь. Я все-таки про машинное обучение в науках о Земле. Но знаю, что у ядерщиков история взаимодействия с машинным обучением будет куда подольше, чем в науках о Земле. Вот, например, коллеги из НИИ ЯФ в «Яндекс» пришли с конкретными запросами для ЦЕРНа: как фильтровать данные? Как их обрабатывать? И было это еще чуть ли не в 2005-м, когда еще нейросети не взлетели достаточно хорошо, когда даже в «Яндексе» вычислительное оборудование было послабее, когда были нужны классические примеры с классическими методами машинного обучения. Когда с табличными данными работают, а не со скоррелированными. В общем, у них своя история. У меня в науках о Земле, раз уж я из Института океанологии, своя история, и я ее наблюдаю и проживаю прямо сейчас. Задачи берутся из академических институтов, да.
◉ Понятно. Это очень похоже на биоинформатику. Биоинформатика даже называется одним словом, а в ней сидят совершенно разные типы людей: одни биологи, другие — программисты, которые задачки биологов считают, условно говоря.
– Да. И тот на коне, который хорош и в том, и в этом. Именно поэтому я считаю, что у меня есть некоторая ниша, в которой я существую. Это машинное обучение в науках о Земле. Вот так моя новая лаборатория и называется.
◉ А можно я сейчас немного сменю курс нашего разговора? Как вы понимаете термины «машинное обучение» и «искусственный интеллект»? Я ко всем с этим вопросом пристаю, потому что штуки эти достаточно новые. И для меня, например, машинное обучение было таким вложенным множеством в искусственный интеллект, каким-то таким инструментом. А Артем Бабенко, глава научного отдела «Яндекса», мне сказал на днях: нет, это совершенно не подмножество, а вообще параллельные вещи. А вы про это что думаете? Говорят-то про это много, а термины еще, кажется, не устоялись.
– Термин «искусственный интеллект» не устоится еще долго. Вообще у него долгая история. Первую попытку дать определение сделали на Дартмутском семинаре в 1956 году. Чуть ли не до нашей эры, в смысле в прошлом веке. Летом 1956-го, в июле маститые ученые (а ведь кто-то из них еще даже жив!) собрались и целый месяц обсуждали, что такое искусственный интеллект, каковы его перспективы. И дали очень смутное определение, что это набор технологий, которые позволяют решать задачи, которые считаются интеллектуальными.
◉ Это вообще не определение, мне кажется. Это же какая-то рекурсия.
– Это рекурсия, действительно. Более того, задачи, которые считаются интеллектуальными, — что это за определение такое? Шахматы уже не считаются интеллектуальной задачей, потому что эта задача решена, она автоматически считается. В общем, сейчас основные, на самом деле, усилия исследователей в отношении искусственного интеллекта сосредоточены не на технической его стороне, а именно на том, что это вообще такое. Вот у Франсуа Шолле несколько лет назад была статья чуть ли не на 60 страниц, в которой обсуждалось, что такое вообще интеллект. Как только мы будем знать, что такое интеллект, мы уже легко сможем понять, где естественный, где искусственный. А я так скажу, что интеллект — это скорее способность некоего абстрактного агента адаптироваться к решению разнообразных задач в разнообразных окружающих условиях. Но это тоже не строгое определение.
◉ Смело! Ну тогда и у паучков есть интеллект в каком-то смысле.
– Да! Тут вопрос в том, что как только мы говорим, что это, мы можем его посчитать, то есть дать ему некоторую меру. Он может быть примитивный, как у ваших паучков. Он может быть продвинутый. Так вот, к искусственному интеллекту сейчас два подхода. Есть то понимание, в котором его воспринимают специалисты от машинного обучения и нейросетей. И вот оттуда вырастает что-то пока неопределенное, для чего мы сейчас готовим техническую основу. Это методы машинного обучения, более узко — нейросети и какие-то дополнительные хаки.
◉ Звучит немного забавно: «Нечто неопределенное, для чего мы готовим техническую базу».
– И тем не менее мы эту техническую базу готовим со времен Колмогорова и даже раньше. Но! Есть и вторая сторона понимания того, что такое искусственный интеллект. В общепринятом понимании он, на самом деле, воспринимается как аналог естественного интеллекта, только помещенный в машину. Естественно, это не совсем то, о чем…
◉ Кажется, речь в целом сейчас не об этом, да и вообще это ж безумно сложный путь.
– Точно, это очень сложно. Однако я замечу, что искусственные нейронные сети начались как раз с имитации мозга человека, нейронных связей. И все первые публикации по нейросетям были не в математических журналах. Они же были в журналах, которые относятся к нейронаукам, к биологии. И это продолжалось буквально до 1980-х.
◉ А, ну да, это же было как бы моделирование…
– Именно. Это было моделирование искусственного интеллекта «снизу вверх», по принципу: давайте смоделируем запчасти нашего естественного интеллекта, может быть, вдруг получится искусственный. Вообще-то это в каком-то смысле сработало. Только искусственный интеллект получается немного как магия сейчас. Помните третий закон Артура Кларка? «Любая достаточно развитая технология неотличима от магии». Так вот, примерно так же статистические модели (а нейросети — это смесь теории вероятности и математической статистики) на определенном этапе их развития уже неотличимы от искусственного интеллекта. Когда мы смотрим, что какая-то машина определяет меня, кто я, глядя мне в лицо, кажется, что это магия, и там какой-то искусственный интеллект. Но нет, мы прекрасно знаем, что там и как это работает. Мы знаем теоретическую основу вероятностной модели, которая это делает.
◉ Мы знаем теоретическую основу или мы точно понимаем, как это происходит? Остались ли нейронные сети черным ящиком?
– Остались. Остались проблемы интерпретации и explainability, то есть объяснения вывода нейросетей. И тот, кто первый дойдет до какого-то первого вменяемого результата в этом вопросе, получит все лавры. Я думаю, что это случится лет через 5-7-10 (не сегодня). Это прямо очень сложная задача и проблема. Вопрос о том, почему при наращивании сложности вдруг появляются новые качества, пока точно не решен.
◉ Как вы относитесь, например, к технологической сингулярности? Это ведь несколько противоречит тому, о чем мы сейчас говорим. Вы утверждаете, что мы скоро поймем, как работают наши «черные ящики». А она как раз состоит в том, что мы окончательно перестанем понимать.
– А одно другому и не противоречит!
◉ Как это??
– Мы поймем, как работают те нейросети, которые мы используем сейчас. Но это не означает, что не появится новый уровень сложности, который тоже нужно будет интерпретировать. Помните «Солярис» Станислава Лема, мыслящий океан? По мере роста по какой-то причине появилось новое качество. Количество перешло в качество. Когда-нибудь это случится. Технологическая сингулярность — это просто момент, когда мы перестанем успевать за прогрессом самих нейросетей, перестанем их интерпретировать и контролировать.
◉ Но хоть сейчас-то этот прогресс контролируемый? Мы их обучаем, мы их строим…
– Тут есть вопросы. Как ведут себя эти большие лингвистические модели и на что они способны, если дать им полный доступ для диалога с разными людьми? Я считаю, что это было бы очень опасным явлением.
◉ На что они могли бы быть способны, уважаемые друзья и читатели, вы можете почитать в последнем романе Виктора Пелевина. Я прочитал в прошлом месяце и вздрогнул.
– Я, наверное, почитаю, потому что есть ощущение, что таким независимым агентам даже не нужно физическое воплощение. Им достаточно лингвистического интерфейса к человеку, который уже сам физически способен очень на многое. Я имею в виду, что есть люди, которые рады поддаться словесному убеждению, будь это даже текст с экрана, и пойти творить самое необычайное. А при должной настройке большие лингвистические модели могут быть ну очень убедительны! Так вот, вернемся к соотношению понятий «искусственный интеллект» и «машинное обучение»: машинное обучение — это инструмент достижения либо реализации искусственного интеллекта. В машинном обучении есть нейросети, есть классические модели, которые работают не с текстом или картинками, а с табличными данными. Вообще я лично уверен, что искусственный интеллект будет достигнут не только методами машинного обучения и нейросетями, но объединением. Это будет какое-то гибридное построение, в котором будет доступ к экспертным базам данных. Это, кстати, то, на чем было построено понимание искусственного интеллекта примерно в конце 1980-х — 1990-е. Этот период еще называют зимой искусственного интеллекта или зимой нейросетей: тогда практически все разочаровались в идее нейросетей и ИИ. Тогда искусственный интеллект как идея продолжал жить, но о нем думали как о некоем очень-очень сложном алгоритме, который из каких-то унифицированных экспертных баз данных может давать ответ на какое-то ограниченное количество вопросов.
◉ Мы с друзьями развлекались в 1998 году — писали поисковую машину как экспертную систему на базе знаний.
– Что самое интересное, в этих экспертных базах данных мы снова приходим к мысли о том, что нужно осуществлять поиск. И там снова используются статистические модели, которые обрабатывают либо естественный язык, либо что-то. Хорошо или плохо, но обрабатывают. Именно поэтому мое понимание о том, когда мы придем к некоторой реализации искусственного интеллекта на уровне, например, среднего человека, это все-таки совместное использование и хороших лингвистических моделей, и при этом каких-то чисто механических инструментов… Ну я не знаю, калькулятор ему нужно дать на вооружение, что ли, чтобы он не ошибался в арифметике.
◉ Давайте теперь вернемся к наукам о Земле. Я их себе представляю как область, в которой накоплено прямо неимоверное количество данных. Самых разнообразных. Но при этом система, которая изучается (скажем, та же атмосфера), настолько сложна, что, может быть, даже этих данных совершенно недостаточно, чтобы ее понять?
– Вы оба раза правы!
◉ Ну вот! Что же делать?
– Во-первых, сначала изучать свойства данных. Буквально на днях у нас одна из коллег защищалась, и ее работа была посвящена тому, чтобы изучать данные, отфильтровать их, представить, унифицировать и так далее — за прошедшие 150 лет относительно атмосферы (в частности, облачности). Данные, которые накапливаются об атмосфере, океане, суше — в науках о Земле — очень разнообразные. Они разнообразны по качеству, по покрытию во времени и в пространстве.
◉ То есть это не база данных, а куча мусора?
– Я бы сказал «гетерогенные данные». Кто-то называет их «мультимодальными». Они реально мультимодальные, потому что, например, записи морских млекопитающих — это звук. Есть и другие типы данных — это где-то картинки, просто фотографии, где-то двумерные поля или поля, натянутые на сферу (характеристика атмосферы океана). То есть это сеточные массивы данных. А где-то это временные ряды. Так, звук упомянул, что еще?..
◉ Зарисовки. Текстовые описания карандашом на бумажке.
– Да, именно карандашом, где буква z неотличима от цифры 2! Каких-то модальностей реально петабайты, и они относительно унифицированы. Например, климатические исследования строятся на основании сеточных данных, массивов, которые на широтно-долготной сетке на поверхности планеты заданы. И они унифицированы: это давление, это температура, это влажность. С ними можно относительно системно работать. Но есть наборы данных, для которых такие подходы системной работы сейчас невозможны, либо становятся возможны вот прямо с сегодняшнего дня, когда коллега наша защитилась и говорит: «Нате вам унифицированный очищенный набор данных». Так вот, есть проблема, но и есть преимущество того, что данных много. Проблема состоит в том, что с такими данными статистическими методами, которые реально могут обоснованный вывод дать, работать сложно. Прямо практически невозможно! Но здесь, вот для таких записей, для картинок могут помочь современные лингвистические модели. Но в любом случае, это не проблема даже, а особенность. А когда их много унифицированных, там встает другая проблема: их очень много, этих данных. их просто кошмарное количество, реально петабайты. Где под них взять вычислительные мощности? Поэтому наличие такого огромного количества разнообразных данных — одновременно преимущество и недостаток.
◉ В генетике похожая проблема? Там, правда, какое-то все же конечное количество проанализированных геномов.
– Да, конечное! Во всяком случае прямо сейчас оно ограничено восемью миллиардами, так? Это мало по сравнению с тем, сколько нужно для того, чтобы анализировать методами биоинформатики, классическими методами машинного обучения вот эти самые последовательности. Поэтому изобретаются особые методы, которые умеют работать с ними по-особенному (опять же, аналоги лингвистических моделей). Да, действительно, количество данных одновременно и преимущество, и недостаток. Что с ними делать? Что можем, то и делаем. Нет, это реально как у братьев Стругацких: «Задача нерешаемая, я понимаю! Что делать-то дальше»? Помните, в «Понедельник начинается в субботу» есть такой эпизод? Мне очень нравится. Я все время его студентам проговариваю: если вы видите, что задача нерешаемая, значит, нужно кусать этого слона с другой стороны.
◉ «Ложиться на „Алдан-3” и думать» — или как там в книге у них электронно-вычислительная машина называлась?
– Да.
◉ И вы, значит, ложитесь на свою ЭВМ в лаборатории проекта «Плавучий университет» и думаете, думаете… Над чем?
– Над вопросами климата, например! Есть такой координационный центр всероссийского проекта «Плавучий университет» (на базе МФТИ). Моя лаборатория подчинена структурно как раз вот этому КЦ. И там еще несколько есть других лабораторий, они довольно удачно ложатся в концепцию института климата.
◉ А что вы вообще думаете о проекте «Плавучий университет»? Мне лично ужасно понравилась идея проекта — находить по всей стране заинтересованных студентов и сводить их с научными руководителями из какого-то совсем другого места, и отправлять вместе в экспедиции. Это ведь иногда так сложно — найти хорошего научрука.
– Обычно это действительно очень тяжелый процесс. Обычно он очень сильно инкапсулирован. То есть если я на физфаке МГУ, вряд ли я найду научного руководителя где-то вне его, разве что по невероятному везению и случаю. И я считаю это неправильным. Любые инициативы, которые могут преодолеть вот эту преграду, некую стену моего факультета, моей кафедры, за которой я не могу или не хочу искать научного руководителя, хороши. Так что «Плавучий университет» — движение точно в очень правильном направлении. Я всеми силами пытаюсь в этом участвовать, хотя я и там тоже «чужой среди своих» в том смысле, что у меня работа — машинное обучение в науках о Земле. Она камеральная. Она береговая.
В морских экспедициях у меня базовая задача — метеорологическая: наблюдение облачности, радиация, ветрового волнения. В том числе получается вписаться в экспедиции «Плавучего университета» со своим отрядом. В том числе со своими лекциями и семинарами по машинному обучению. И получается так, что это сложный, трудный симбиоз, но он дает отличные плоды. Почему? Я был где-то с месяц назад на встрече президента Путина с молодыми учеными. И говорил о том, что экспертиза у современных специалистов по океану, атмосфере, климату должна быть двойной. Не в смысле двойного назначения, как это обычно говорят, а именно двойная экспертиза. Сейчас они должны обладать дополнительными методами, владеть методами искусственного интеллекта (как это там называется с легкой руки тех, кто не делает разницы между ИИ и машинным обучением). Но пусть будет искусственный интеллект! Они должны изучать его как инструмент своих исследований. И вот я сейчас, в том числе в рейсах «Плавучего университета», в зимней школе «Плавучего университета» (которая здесь, на берегу), это направление и продвигаю. Ребята, вы там кто, геофизики? Очень хорошо!
◉ Вы без меня не обойдетесь, мол. Точнее, без моей области.
– Именно! Без моей области вы через два года, три-четыре-пять лет будете никто в своей области экспертизы. И про это я как раз президенту и говорил: «Пожалуйста, помогите продвинуть изучение вот этих статистических методов (я называл это ИИ) в тех областях, в которых сейчас они страдают очень сильно». Это океанология, метеорология, климатология и вообще в принципе практически все естественные науки. Я к химикам прихожу — они тоже говорят: «А мы этого всего не знаем, помогите!» Мы сейчас с химиками с химического факультета МГУ тоже работаем. У них очень прикольные задачи. Я вообще в восторге от того, какие задачи мы с ними решаем! Но они не умеют их обрабатывать нынешними нейросетями. Я говорю: господи, да это же так просто, давайте вместе сделаем! И вот, пожалуйста, за два месяца сделали две очень красивые задачи с какими-то белками.
◉ Но мне кажется, что во многих областях науки это уже хорошо поняли. Вот взять материаловедов, например, они без ИИ уже вообще не обходятся.
– Да. Я не говорю, что ни у кого нет. Слава богу, с тех пор как я начал отслеживать применение машинного обучения в естественных науках, прошло уж семь лет, и там сейчас такой мощный рост, что ого! Но при всем при этом нужно понимать, что мы сейчас очень сильно отстаем по сравнению с нашими западными коллегами.
◉ Отстаем в инструменте или в его применении?
– Нет, не в инструменте, как раз в применении. В инструменте мы впереди планеты всей. Ну ладно, не впереди, но наравне, на уровне. На очень хорошем уровне. Может быть, у нас там не хватает по лингвистическим моделям чисто вычислительных возможностей, которые дадут конкретный прикладной результат. Но в смысле инструмента, теоретической основы у нас очень хорошие специалисты. Мне очень приятно осознавать, что я с некоторыми из них даже знаком и работаю вместе.
◉ Так в чем же тогда проблема с применением?
– Это такая академическая инертность. Я прихожу… не будем называть конкретные места, их много… прихожу на некую кафедру метеорологии и климатологии и говорю: вам нужно машинное обучение, это передовые методы, без которых вы не сможете выпускать нормальных студентов. Мне что говорят? «Нет, этого не надо. У нас есть классические линейные и статистические методы. Зачем нам машинное обучение? Да вы что?» Я прихожу в 2018 году с докладом в Росгидромет, мне говорят: «А что это такое вообще? Нам это не надо!»
◉ Это как в биологии последних лет 20, когда приходят к традиционным биологам всякие там генетики и говорят: «А чем вы тут занимаетесь вообще, определяете медленно и печально по внешнему виду щетинок вид рачка? Так давайте мы вам сейчас очень быстро все сделаем».
– Да, а им говорят: «Нам этого не нужно». В конце прошлого года была история, которая меня расстроила. Я разговаривал с некоторыми людьми на геофаке МГУ и в НИВЦ МГУ. Да, там же есть фонд «Интеллект», который готов уже профинансировать для МГУ мой готовый курс, я его уже четыре или пять лет читаю на Физтехе. Вам ведь это нужно, для студентов в метеорологии, климатологии, океанологии, вот это вот все. Пожалуйста, давайте стартанем! А мне отвечают: «Ну мы можем выделить четыре лекции на это». А сведущие люди мне подсказывают: «Не волнуйся через три-пять лет можно будет адаптировать программу этого курса и тогда сделать его семестровым». Ну что тут скажешь, а? Три-пять лет?
◉ Это примерно бесконечность в нынешних условиях.
– Да и какой там семестровый, это же двухгодичный курс. Это материал, который больше, чем теория вероятностей и математическая статистика по объему. Он может быть попроще, но он больше! Это меня так зацепило, что в итоге на встрече с президентом я в основном об этом и говорил.
◉ Но это мы про академическую науку сейчас говорим, а ведь чисто академическая наука, которая занимается теоретическими основами машинного обучения, но она ведь на вторых ролях? А первые — это научные отделы больших корпораций. Тот же Yandex Research. И пройдет еще пара лет, и они так надавят на всех остальных, что либо прощайся с профессией, либо начинай использовать наши инструменты.
– На самом деле, давление намного сильнее уже снаружи. Знаете, почему? Простой пример: есть такой Европейский центр среднесрочных прогнозов погоды (European Centre for Medium-Range Weather Forecasts). Это Мекка. Там, собственно, генерируется, считается глобальный прогноз на весь земной шарик. На него ориентируются. Он наряду с американским и, может быть, японским — три наиболее доверенных и авторитетных центра. Если не ошибаюсь, в октябре прошлого года ЕЦСПП начал выкладывать у себя в источнике данных, которыми пользуется весь мир постоянно, стандартный метеорологический прогноз, аналогичный тому, который они выкладывают все время. На 10 суток вперед. Это прогноз, который генерируется исключительно нейросетями. Там никакой гидродинамики вообще нет. И это не замена. Это делается параллельно с обычным гидродинамическим прогнозом..
◉ Как это — «нет гидродинамики»?
– Есть такой класс нейросетей, которые выполняют задачу прогноза во времени. Этим занимаются очень многие… Обычно прогноз погоды считается гидродинамическими моделями: атмосфера, океан и прочее. Они решают численно систему дифференциальных уравнений в частных производных, которые описывают атмосферу, океан, воду, сушу, эти самые процессы диффузии в почве и так далее и тому подобное. Да, естественно, еще аппроксимацию радиации, которая приходит. Каким-то образом разрешаются процессы конвекции.
◉ Минуту, так нейронные сети же по этим моделям и обучаются?
– Они по результатам этих моделей обучались. Но в тот момент, когда они применяются, уже гидродинамические уравнения не решаются. Это исключительно статистический прогноз.
◉ И он работает?
– Еще как. Он работает на том же уровне, на котором у них работают гидродинамические модели. Но вопрос не в том, что он работает, а в том, что если он уже сейчас работает, то это означает, что работа над его развитием началась примерно от двух до четырех лет назад. Ровно тогда, когда я ходил по нашим институтам и организациям, связанным с гидромет-прогнозом и говорил: вам нужно машинное обучение, иначе мы буквально через несколько лет останемся у разбитого корыта. Уверен, именно в это время там, в Европе, в ЕЦСПП они всё и начали. А у нас до сих пор в отношении нейросетей для прогнозов — скепсис..
◉ Получается, что надо не на кафедру идти с вашими идеями, а в Гидрометцентр. Но вот скажите: люди сели три года назад и научили нейронную сеть, подсунули ей модели. В результате она научилась. А можно ли рассчитывать, что она, научившись делать прогноз на 10 дней, еще через пару лет сделает верный прогноз на год?
– Нет. Здесь есть просто фундаментальное ограничение, кстати которое не понимают люди из математической статистики. Но его понимают те, кто напрямую связан с океанологией и науками о Земле. Цикл влаги в атмосфере — примерно 10 суток. Это означает, что атмосфера примерно за 10 суток полностью «забывает» свои начальные условия. Всё! Задача просто не решается в атмосфере больше чем на 10 суток за счет того, что влага испаряется и конденсируется. Это не замкнутая система.
◉ Да, но модель-то остаётся примерно той же? Одна влага испарилась, другая появилась?
– Это да. Но если у нее забыты начальные условия… Ее, конечно, подпитывают граничными условиями из наблюдений из данных наблюдений, но не в будущее же? Если модель не подпитывать граничными условиями, она забывает свое начальное состояние, и это уже идет как климатическая модель. Конечно, у нее есть некоторое понимание о радиации, которая приходит. Ведь Солнце у нас — величина постоянная; есть другие долгопериодные условия. Это как с обсчитыванием выброса игральной кости: первые сколько-то десятков сантиметров она полетит по вполне себе предсказуемой траектории, но дальше тот хаос, который творится в ее перемещениях и влиянии окружающей среды, не позволит нам прогнозировать выпадение конкретного номера..
◉ Ладно! А что, выходит вообще нельзя предсказывать погоду на полгода вперед, условно говоря? Не климат, а именно погоду?
– Очень интересный вопрос! Существуют специальные процессы, которые позволяют снизить неопределенность сезонного прогноза за счет некоторых низкочастотных составляющих нашей земной климатической системы. Эль Ниньо, поведение стратосферы (оно полугодовое примерно), десятилетняя осцилляция температуры поверхности океана в Тихом океане… Или, например, разница температуры и давления между исландским минимумом и азорским максимумом. Просто известно, как они себя ведут вот сейчас, в настоящем климате. Там есть низкочастотная закономерность.
Вот эти низкочастотники нашей атмосферы и океана позволяют снизить неопределенность при сезонном прогнозе. Сейчас есть фундаментальные исследования в отношении таких низкочастотников и дальних связей между океаном и атмосферой. Как, например, изменения температуры на поверхности Тихого океана влияют на поведение стратосферного полярного вихря? Как они отражаются на точности сезонного прогноза. Вот эти исследования сейчас наиболее перспективны с точки зрения того, чтобы снизить неопределенность сезонного прогноза.
◉ Хорошо, это про погоду. А про климат что?
– А климат — это все то, что за пределами 10 лет. Даже чуть больше, наверное. Там вопрос в том, что мы никогда не можем говорить, что у нас есть конкретная температура в конкретной точке пространства в конкретный момент времени — в будущем. Мы говорим о том, что у нас есть некоторые статистические характеристики погоды в некотором регионе на протяжении какого-то отрезка времени: 10-15-20 лет. Мы никогда не можем говорить про прогноз климата так, как это говорят о прогнозе погоды. Мы будем говорить о том, что вариабельность, дисперсия температуры будет либо повышаться, либо понижаться. Мы даже никогда не говорим, какая она! Мы будем говорить, что она либо повышается, либо понижается. Это называется тренд. Когда говорят про прогноз климата, никогда не говорят о том, что в 2057 году на европейской территории России и конкретно Москвы 15 января будет минус 23 ℃.
◉ Ну, может быть, пройдет 500 лет, и у вас поставят компьютер размером с Землю, который посчитает все на 10 лет вперед.
– Видимо, для того чтобы смоделировать Вселенную, нужен компьютер с нее размером. А для планеты — размером с планету. Как это было у моего любимого Дугласа Адамса: вторая версия Великого Думателя, который должен был моделировать планету, все живое на ней и дать ответ на «главный вопрос жизни, вселенной и всего такого», — он был самой планетой, Землей. Ну, видимо, так и должно получиться. Иначе вот эту хаотическую систему (а она изначально такова) пока что с точностью до последнего вихорька не описать.
* Егор Быковский (автор) — член редсовета Naked Science, директор Центра научной коммуникации МФТИ.
Ученые из Аргентины в серии экспериментов проследили за поведением домашних собак во время разногласий между членами семьи и выявили у четвероногих питомцев ряд характерных реакций на конфликт.
Американские ученые проанализировали данные о поедании фекалий животными, чтобы выяснить, какие причины стоят за этим поведением и какие закономерности можно проследить. В результате они разделили всю выборку более чем из 150 видов на семь категорий по тому, что заставляет зверей питаться таким сомнительным продуктом.
Работать под началом шефа-абьюзера тяжело, но свежее исследование показало, что бывают варианты похуже. Ученые выяснили, что еще негативнее на моральный дух и производительность труда сотрудников влияет, когда во главе команды стоит самодур, у которого вспышки агрессии непредсказуемо сменяются этичным поведением.
Международная коллаборация физиков под руководством ученых из Йельского университета в США представила самые убедительные на сегодня подтверждения существования нового типа сверхпроводящих материалов. Доказательство существования нематической фазы вещества — научный прорыв, открывающий путь к созданию сверхпроводимости совершенно новым способом.
Принято считать, что естественный спутник Земли возник в результате ее столкновения с другой планетой, но к этой версии есть вопросы. Теперь ученые предложили рассмотреть сценарий возможного захвата Луны притяжением Земли из пролетавшей мимо двойной системы.
Ученые из Аргентины в серии экспериментов проследили за поведением домашних собак во время разногласий между членами семьи и выявили у четвероногих питомцев ряд характерных реакций на конфликт.
Под рыжим верхним слоем с виду обычного камня открылся целый калейдоскоп довольно неожиданных оттенков. Это особенно интересно с учетом того, где лежит камень — в марсианском кратере, который по всем признакам когда-то был озером.
Международная коллаборация физиков под руководством ученых из Йельского университета в США представила самые убедительные на сегодня подтверждения существования нового типа сверхпроводящих материалов. Доказательство существования нематической фазы вещества — научный прорыв, открывающий путь к созданию сверхпроводимости совершенно новым способом.
Органические молекулы с пи-связью образуют очень устойчивые геометрии, которые не любят нарушаться. В 1924 году немецкий химик Юлиус Бредт сформулировал соответствующий запрет, вошедший в учебники химии. Тем не менее это в некоторых случаях возможно. В новой работе американские исследователи представили несколько «антибредтовских» соединений из класса олефинов.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
ПонятноИз-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
ПонятноНаши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
ПонятноМы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
ПонятноМы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.
Понятно
Комментарии