Пару десятилетий назад о нейросетях знали только узкие специалисты, сейчас же они активно вошли в повседневную жизнь каждого из нас и круг решаемых ими задач продолжает расти. Но что можно назвать локомотивом для такого бурного развития, и есть ли ему предел? На эти вопросы ответил научный сотрудник института «Компьютерные науки и прикладная математика» МАИ, директор департамента цифровой трансформации в компании BetBoom Юрий Чайников.
Нейросети – это математические модели, а также их программное воплощение, но, если взглянуть шире – это модель алгоритмов работы человеческого мозга.
Что касается последнего, то по когнитивным способностям только что родившийся ребенок мало чем отличается от детеныша шимпанзе, но уже по достижении трехлетнего возраста разница между маленьким человеком и маленьким шимпанзе – колоссальна. Почему? В человеческом мозге нервных клеток (нейронов) на 50 миллиардов больше, чем в мозге самых умных обезьян. В этом случае количество переходит в качество.
А как обстоит дело с искусственным интеллектом? За счет чего он становится «умнее»?
– Когда мы тренируем большие языковые модели, мы оцениваем, насколько хорошо они отвечают на заданный вопрос, насколько часто их выводы полезны пользователю, насколько правильно они решают поставленные задачи. Все это очень сильно зависит от трех параметров: от размеров нейросети, объема обучающей выборки и от объема вычислительных мощностей, которые мы потратили на то, чтобы ее тренировать. И зависимость эта – экспоненциальная, – отмечает эксперт.
В результате получается такая линейная зависимость: нейросеть настолько умна, насколько она велика, и насколько много через нее пропустили обучающих данных, а рост объема нейросети, данных и сама возможность их переработки нейросетью зависит от доступных вычислительных мощностей.
– Допустим, наша нейросеть, проходя сложный тест, в 20 процентов случаев допускает ошибки. Чтобы улучшить точность вдвое, уменьшив число ошибок с 20 до 10 процентов, нам придется потратить в 10 раз больше вычислительных мощностей, чем мы ранее задействовали, прогнать в десять раз больший датасет, десятикратно увеличить размер нейросети.
И здесь проблема роста искусственного интеллекта переходит из плоскости математики или информатики в плоскость экономики: может ли разработчик данной нейросети позволить себе такой экспоненциальный рост вычислительных мощностей?
– Сейчас топовые нейросети имеют размер в сотни миллиардов параметров. Если мы будем исходить из того, что аренда сервера обходится доллар в час и нам необходимо потратить 50 миллионов часов на тренировку нейросети, чтобы прогнать через нее обучающую выборку больше триллиона слов, то на обучение нейросети мы потратим 50 миллионов долларов вычислительных мощностей, – говорит Юрий Чайников.
Таким образом, рост интеллектуальных способностей нейросети напрямую зависит от потраченных на ее обучение денег. Это прекрасно понимают их создатели. Так, фронтмен нейросетевой революции Сэм Альтмен, основатель и генеральный директор OpenAI, планирует построить вычислительные кластеры на триллион долларов, на обеспечение которых потребуется больше 10 процентов совокупного энергопотребления США. Для питания дата-центров, на которых будут крутиться модели, потребуется строительство атомных электростанций с десятками ядерных реакторов, мощностью в десятки гигаватт. Microsoft уже заявила, что будет участвовать в инвестициях в этот проект.
Себестоимость обработки одного запроса топовой нейросетью от OpenAI на текущем уровне развития обходится по разным оценкам от 20 до 40 центов. Тогда как запрос в поисковике Google – порядка одного цента. Если Google зарабатывает с каждого запроса примерно 20 центов, то это отличный бизнес. Бизнес OpenAI пока не так оптимистично прибылен.
Но экспоненциальный рост мощностей может изменить все. Сейчас топовые нейросети за секунды выполняют с сопоставимым с человеком качеством задачи, на которые человек потратил бы несколько минут. Задача в 10 минут человеческого времени стоит 1-2 доллара. Решение нейросетью обходится в 20 раз дешевле. Экономика – безжалостная штука. Если за сопоставимое качество можно заплатить в 10 раз дешевле – это будет сделано. И тут начинается гонка не только за точность моделей, но и за стоимость их работы.
– Например, у нас есть модель, которая имела точность 84 процента и производила решений на 100 токенов в секунду на стандартном сервере. Мы ее чуть-чуть подправили ради удешевления ее работы при массовом применении. В результате, точность упала на один процент, зато теперь она выдает не 100, а 1 000 токенов в секунду. Точность стала чуть меньше, то есть предельных задач, с которыми она справляется, стало чуть меньше. Зато экономическая эффективность на тех задачах, с которыми она справляется, возросла в 10 раз.
И это – одно из важнейших направлений по совершенствованию больших моделей, – отмечает эксперт. – Некоторые компании умудряются в сотню раз повысить производительность в терминах токенов за доллар расхода на компьютер, и построить на этом нормально работающий бизнес, продавая это как сервис. Берем выпущенную open source модель, поправляем ее: да, она становится чуть-чуть похуже, но зато в 100 раз дешевле, а потом продаем ее пользователям в 50 раз дешевле и зарабатываем на этом X2 по цене продажи. Такая вот непрерывно работающая конструкция.
Если деньги питают развитие искусственного интеллекта, то что может остановить его?
Пока локомотив экономической эффективности несется вперед – логику объективного развития ИИ остановить невозможно: в нейросети вкладываться выгодно. Но искусственный интеллект, как и вся человеческая цивилизация в принципе, зависит, как ни странно, от технологий позапрошлого века.
– Нейросети будут существовать примерно столько же, сколько существует человеческая цивилизация и электричество, потому что без электричества современная городская инфраструктура превращается в тыкву буквально за считанные часы, а город – в мертвый город за две недели. Ведь на электричестве завязано все, начиная от кассовых терминалов, которыми вы не сможете воспользоваться при его отсутствии, а, значит, вам ничего не смогут продать, и заканчивая самой банальной инфраструктурой вроде водоснабжения и канализации. А если в кране нет воды и в туалете не работает канализация, то через неделю у вас эпидемия бактериальных заболеваний, начиная от дизентерии и заканчивая вспышкой холеры и тифа. Электричество за несколько десятилетий стало основой инфраструктуры человеческой цивилизации в ее нынешнем виде.
Интернет сделал это за пару десятков лет. Пройдут считанные годы, и большие мультимодальные модели проникнут в каждый закоулок современного мира, – считает Юрий Чайников.
Обратной стороной бурного развития ИИ является риск его выхода из-под контроля. Уже сейчас выпущены модели, которые позволяют управлять действиями на экране компьютера без участия человека так, как будто это делает сам человек. В ответ на сформулированную задачу нейросеть может самостоятельно придумать длинную последовательность действий и выполнить их: открыть электронную почту, написать и отправить сообщение, зайти на сайт и собрать информацию по запросу в таблицу, манипулировать курсором мыши, открывать нужные окна на экране компьютера. Да, нейросеть пока будет делать это в 10 раз медленнее, чем делал бы человек, но это – автоматизация реальной деятельности человека. Дальше – больше: нейросети постепенно будут осваивать все новые и новые сферы человеческой деятельности. И здесь напрямую встает вопрос о контроле развития ИИ.
– На сегодняшний день мы очень плохо умеем контролировать большие мультимодальные модели, которые создаем. Есть классическая мифологическая конструкция: джинн, который исполняет желания в буквальном смысле, а не то, что подразумевал автор. Например, человек пожелал: «Хочу много денег», а джинн ему: «О, у вас умерли все родственники, и вы теперь – единственный наследник». Почему так вышло? Джин просто не потрудился переспросить, хотел ли автор желания оставить родственников живых, устроит ли его такой вариант исполнения желания, а просто взял и сделал. Подобная ситуация может когда-нибудь произойти с искусственным интеллектом.
«Оптимизатор скрепок» – мысленный эксперимент про поведение искусственного интеллекта, которому поручили всего лишь оптимизировать выпуск канцелярских скрепок, а в результате он превратил в скрепки весь мир – не такой уж и невероятный сценарий, – утверждает эксперт.
Однако пока катастрофические сценарии – это удел научных фантастов и футуристов. Сжигая в топке все новые тонны пачек зеленых купюр, локомотив искусственного интеллекта несется вперед, набирая обороты по мере увеличения инвестиций, и нам остается только догадываться, где будет его конечная остановка или, как у пелевинской «Желтой Стрелы», ее не будет вовсе.
Материал подготовлен при поддержке Минобрнауки России.