Нейросети учатся у людей писать картины и сочинять музыку, и это все еще выглядит забавным трюком машинного обучения. Но это лишь прелюдия. Она закончится, когда нейросети станут учиться тому, как люди рискуют, делают выбор и как используют мораль. Такие исследования уже идут, и данные для обучения мы создаем сами, зачастую даже не зная об этом. Naked Science пытается представить, зачем нужны нейросети, имитирующие нашу манеру рассуждений и поведения, кто от этого выиграет и чего стоит опасаться.
Программа, созданная исследователями из Университета Торонто, Корнеллского университета и Microsoft Research, по набору шахматных партий угадывает, кто их сыграл. Она вычисляет автора по ходам и может отличить его на фоне партий тысяч других шахматистов, регулярно играющих на популярном сервере Lichess. В сущности, она определяет присущий игроку стиль принятия решений.
Любители шахмат давно знают, что у гроссмейстеров есть свой узнаваемый игровой почерк. Кто-то играет напористо и не боится рисковать, а кто-то осторожничает и выжидает ошибок соперника. Есть те, кто силен в дебютах, а другие, наоборот, особенно опасны в эндшпилях, когда на доске уже мало фигур. Словом, каждый шахматист уникален, и в его выборе ходов есть что-то такое, что отличает его от всех прочих. Оно столь же неповторимо, как отпечаток пальцев, этакий «отпечаток» стиля.
Как раз его и улавливает программа, только ей все равно, кто делает ходы, мастер или начинающий любитель. Она легко распознает всех.
Решающий вклад здесь за машинным обучением — авторы взяли записи партий игроков, сыгравших на Lichess не менее тысячи раз, и отобрали из этих партий последовательности до 32 ходов. Каждый ход — смену позиции — они кодировали в виде чисел и передавали в нейронную сеть, а та представляла любую игру как точку в многомерном пространстве. Для нейросети все партии шахматиста — скопление точек (или кластер). Её учили максимизировать плотность кластера каждого игрока и расстояние между кластерами разных игроков.
Так нейросеть научилась различать людей — по тому, как ходы их партий сходятся в кластеры. Этот кластер и есть индивидуальный стиль конкретного игрока, который не всегда выражен явно, но машина его видит. Причем она различает игроков с высоким рейтингом, даже если ее обучить только на партиях любителей, и наоборот. Программа в самом деле ловит индивидуальность.
Авторы исследования считают, что то же самое можно провернуть с покером. Или, говорят они, при наличии правильных данных такая программа могла бы идентифицировать людей по манере вождения автомобиля или времени и месту использования мобильного телефона.
Словом, вместо набора ходов в шахматах могут быть любые цифровые следы. Любая достаточно длинная (оцифрованная) история поведения потенциально содержит данные для обучения таких программ. Человек узнается по характерным цепочкам действий просто в силу того, что мы разные, и каждый из нас, пусть даже в мелочах, чем-то отличается от других. И если раньше, чтобы запутать следы, можно было попытаться исказить почерк или голос, то изменить стиль принятия решений гораздо труднее, это все равно что подменить свою психику. Притом заранее не известно, какие признаки сеть выделяет и что конкретно надо маскировать.
Авторы программы обеспокоены тем, что их подход годится не только для шахмат, но и легко переносится в другие области: нейросеть можно обучить на любых доступных данных, и тут не все гладко с этикой. Ведь не только мошенники, но и обычные люди зачастую желают остаться анонимными, и вовсе не обязательно со злым умыслом. Машинное обучение сделает их видимыми.
В теории это означает, что вход в сеть под чужим IP уже не поможет — любого человека можно будет вычислить по присущему ему уникальному стилю, в чем бы он ни выражался.
Правда, это пока лишь в теории. На практике все не так просто: для обучения искусственного интеллекта сперва нужно собрать размеченные данные, то есть отдельно записывать цифровые следы каждого из множества миллионов людей, присутствующих в интернете, и желательно в течение месяцев. И далее постоянно отслеживать их по сети. Это требует серьезных вычислительных мощностей, а они, в свою очередь, требуют дополнительной энергии. Наконец, люди гуляют по разным сайтам, и связать их истории можно, лишь если эти сайты активно обмениваются данными между собой, что вряд ли реализуемо (кроме ряда исключений — сайтов, входящих в большие корпорации, как «Инстаграм» и «Фейсбук», например).
Такими данными могут обеспечить себя крупные площадки с огромной аудиторией. Они в основном и будут собирать цифровые следы посетителей, но в первую очередь не для того, чтобы раскрыть их личности: гораздо перспективнее использовать эти следы для изучения и предсказания поведения (например, из маркетинговых соображений). Социальные сети — подходящий полигон для этого. Но наилучший — массовые онлайн-игры.
Игра эффективно раскрывает свойства психики. В ходе игры люди принимают множество решений и взаимодействуют с другими игроками в сложной и быстро меняющейся ситуации. Им приходится мыслить тактически и стратегически. Им приходится учиться и набираться опыта. В некоторые игры люди играют годами, а значит, накапливают богатую историю своих действий. Что еще важно, в такие игры играют миллионы пользователей. Все это создает огромные объемы статистики, ее с лихвой хватит для машинного обучения.
Те, кто начал играть подростком, могут продолжать и спустя много лет, развиваясь вместе с игровой вселенной. За это время их уникальный стиль принятия решений будет глубоко изучен и определен, и такая информация может впоследствии стать очень ценной. Иногда бывшие подростки становятся лидерами бизнеса, крупными чиновниками, политиками, военачальниками высокого ранга. Машина, обученная на большом массиве данных, будет не просто знать, в какой манере они думают и действуют, она поможет строить прогнозы на их счет.
Конечно, точность прогноза зависит и от того, сохранят ли люди свой стиль принятия решений на дистанции десятков лет. На этот вопрос трудно ответить однозначно, но лонгитюдные исследования показывают, что основные черты личности довольно стабильны с юности и до зрелости. Если молодая девушка склонна к рефлексии, она будет копаться в себе и в старости. Если юноша излишне впечатлителен, то с возрастом не утратит это свойство.
Нюансы можно сгладить или развить, но ядро психики изменить трудно. Можно обоснованно ставить на то, что особенности мышления и восприятия, как и темперамент, люди пронесут с собой всю жизнь. И если программы научатся эти особенности ловить, это обещает глубокие последствия.
Ведь сила нейронных сетей не только в том, что они находят скрытые паттерны в наборе данных, они еще могут воспроизводить эти паттерны. Шахматная программа, созданная в Университете Торонто, способна играть так, как играют люди, предсказывать ходы конкретного шахматиста и даже предвидеть типичные ошибки, которые тот совершит в партии. Она знает, какие ошибки допускают игроки на разных уровнях мастерства, и может указать уровень, на котором люди перестают их совершать.
Иными словами, программа не ищет лучший ход для данной позиции — она предлагает ходы, которые сделал бы человек. Она моделирует процесс принятия решений шахматистами. Это и есть прогнозирование.
Не стоит надеяться, что дело ограничится искусственной средой шахмат. В прошлом году психологи из Принстона опубликовали в журнале Science статью «Использование крупномасштабных экспериментов и машинного обучения для открытия теорий принятия решений человеком». Авторы обучили нейросеть на большой базе данных, собранной разными учеными за много лет. В ней содержатся результаты психологических экспериментов о том, как люди делают рискованный выбор, включая азартные игры — всего более 10 000 разных ситуаций, в которых испытуемые принимали те или иные решения.
Оказалось, обученные нейронные сети способны с высокой точностью имитировать решения человека, и они значительно превосходят ранее предложенные в психологии модели рискованного выбора.
Так машинное обучение помогло психологам создать новую, более эффективную теорию поведения, которую раньше разработать не удавалось. И это не удивительно: в попытках объяснить выбор людей специалисты выдвигают гипотезы и полагаются на свою интуицию, но она ограничена экспериментами, которые человеческий ум способен охватить. Ни один психолог не в состоянии перелопатить огромную базу данных, где собраны решения сотен тысяч участников в тысячах разных ситуаций выбора.
Для искусственного интеллекта это не составит труда.
Как насчет моральных проблем? Проект «Машина морали» собрал уже около 40 миллионов решений от людей более чем из 200 стран. Это крупнейший из когда-либо проводившихся онлайн-экспериментов по моральным дилеммам. Участников просят определиться в ситуации дорожного движения, где беспилотный автомобиль может свернуть в ту или иную сторону. Испытуемый должен решить, кого спасти и кем пожертвовать. На картинке могут быть разные персонажи (например, мужчина, ребенок, женщина-врач, собака) и разные варианты окружающей среды. Миллионы уникальных задач на моральный выбор.
Столь многомерное пространство решений не под силу человеческому разуму. Зато нейронная сеть, обученная на этих данных, позволила психологам построить «информативную, интерпретируемую психологическую теорию, которая определяет набор моральных принципов, лежащих в основе суждений людей». Они пишут, что эта теория превосходит те, что придуманы ранее, и благодаря ей они выявили три новых эффекта.
В итоге за счет машинного обучения можно как искать стиль принятия решений, так и моделировать, какое решение примет человек. Но удастся ли продвинуться еще дальше — повлиять на его выбор? Не исключено. В прошлом году IBM Research AI представили автономную компьютерную систему Project Debater, которая способна вести дебаты с людьми в режиме реального времени. Создатели Project Debater даже постарались сделать голос системы механическим, чтобы зрители не путали ее с человеком.
Большие языковые модели все лучше «понимают» тексты и сюжеты, все лучше различают причины и следствия и с успехом рассуждают в рамках здравого смысла. Недавно компания Google AI совершила очередной прорыв, обучив модель PaLM не просто выдавать верные ответы в задачах на логику, но и объяснять, почему они верны. Она даже может разжевать смысл шутки, которую видит впервые. Судя по темпам прогресса, мы на пороге появления систем, способных изобретать сильные доводы по любым вопросам и темам.
Если объединить технологии, о которых идет речь выше, мы получим машину, которая выявляет стиль принятия решений конкретного индивида, строит вероятные сценарии его будущих решений и с учетом его уникального стиля подбирает систему аргументов — стремится убедить его мыслить или действовать в нужном направлении.
Кто может быть заинтересован в такой машине?
Персональные данные из крупных социальных сетей уже использовались для создания психологических профилей и таргетированной политической агитации в избирательных кампаниях по всему миру. История с Cambridge Analytica попала в заголовки после выборов президента США в 2016 году. И пусть все публично осуждают такие методы, включая Facebook, чьи данные заимствовались, важно признание: схемы, основанные на машинном обучении, работают.
Онлайн-игры еще лучше подходят для сбора данных о том, как люди принимают решения. Эти данные, конечно же, активно собирают. Действия игроков записываются, далее в наборах телеметрии программы ищут закономерности и на их основе строят модели поведения. Например, используя машинное обучение, исследователи из Ааленского университета в Германии изучили поведенческие данные 700 000 пользователей в 3300 играх на платформе Steam. Первым делом программа распределила игроков на категории по манере игры, затем углубилась в поиск индивидуальных стилей в найденных категориях.
Поведенческий анализ по игровой телеметрии — растущая область исследований. С точки зрения геймдизайна это поможет сделать игры еще более увлекательными и заодно повысить их монетизацию, то есть побудить участников охотнее тратить деньги. Для этого желательно уметь прогнозировать их поведение и характерные решения в разных ситуациях.
Впечатляет, что такой анализ уже делают в режиме реального времени. Например, можно вычислить аномалии в поведении игрока прямо во время сражений в MOBA. Аномалии указывают на вероятное мошенничество — для индустрии киберспорта, которую уже оценивают более чем в 2 миллиарда долларов, это серьезная тема.
В онлайн-игры на разных платформах играют около 3 миллиардов человек, и это не предел. Со временем игры будут становиться все более реалистичными, насыщенными, интерактивными и погружающими. И если сегодня игровая среда программируется от и до, в будущем ее смогут конструировать нейросети прямо по ходу игры, в зависимости от поведения игроков.
Вероятно, игровая вселенная станет частью более глобальной метавселенной, которую планируют строить IT-гиганты. Как минимум половина населения земного шара будет посещать ее регулярно. Каждый раз, действуя внутри виртуального мира, делая выбор и принимая решения, люди будут наращивать свои индивидуальные траектории цифровых следов. Они могут строить эту траекторию годами — играя, развлекаясь, работая и сотрудничая онлайн. Поэтому цифровые вселенные все больше будут тяготеть к сбору персональных данных. Благодаря машинному обучению в этом есть прямой смысл.
Итак, мы вступаем в эпоху, когда по многим людям, особенно тем, кто регулярно играет онлайн, будет накоплена богатая и долгая история их поведения, их решений и взаимодействий с другими людьми и ИИ-агентами. Продвинутые алгоритмы позволят глубоко анализировать эту статистику. Программы будут не только выявлять уникальный стиль человека, но и создавать его модель — поведенческую и психологическую.
Модель подразумевает прогнозирование. Она может строить разные сценарии и ранжировать их по вероятности. Задача в том, чтобы угадать, к какому выбору склонен конкретный человек в той или иной ситуации. Или какую ошибку он, скорее всего, совершит в определенный момент. Далее в дело вступит искусственный интеллект, потомок Project Debater и больших языковых моделей, который будет общаться с человеком индивидуально, с учетом его психики и стиля мышления.
В целом на больших массах людей все это работало давно, задолго до взлета машинного обучения. На этом основании стоят реклама, политика, пропаганда, но результат всегда достигался «в среднем». Черта же нового времени — персональное отслеживание. Теперь в некоторых аспектах машина будет знать человека лучше, чем он сам.
Все эти рассуждения здесь не для того, чтобы пугать вас, читатель, антиутопией, но чтобы прощупать уязвимости и риски грядущих технологий. Создатели шахматной программы из Университета Торонто сразу же осознали опасность своего детища, вокруг чего у них разгорелась дискуссия с коллегами. Парадокс, но они создавали программу вовсе не затем, чтобы деанонимизировать игроков.
Их изначальная цель — разработать интеллектуальные системы, с которыми людям будет проще взаимодействовать. А для этого ИИ должен уметь вести себя подобно людям и просчитывать их поведение. Способность узнать шахматиста по стилю игры — лишь побочный эффект столь благородной миссии.
Точно так же технология распознавания «стиля принятия решений» может принести много пользы, в том числе и в науке, открывая новые пространства для решения сложных проблем. И ключом здесь станет умение генеративных нейронных сетей порождать новые данные, вдохновляясь обучением.
Яркий пример такого умения — система искусственного интеллекта DALL·E 2 от OpenAI, умеющая создавать изображения из текстовых описаний. Например, она легко справляется с задачей нарисовать «лису, сидящую в поле на восходе солнца, в стиле Клода Моне», и картина выглядит весьма убедительно. DALL·E 2 точно схватывает стилистические черты в созданных людьми изображениях и затем воспроизводит эти черты в изображениях, которые создает сама. Это позволяет не только быстро получить множество новых картин а-ля Моне или Уорхол, но еще комбинировать и совмещать стили.
И это свойство решающее — оно открывает путь в неизведанное.
Подобно DALL·E нейронные сети будущего смогут искать оригинальные стратегии мышления, комбинируя стили принятия решений от разных людей. Или же применять стиль конкретного человека к проблемам, с которыми тот не сталкивался. Такие сочетания могут звучать безумно, вроде попытки решить вопросы квантовой гравитации в стиле Каспарова, но в этом и заключена возможность.
Эйнштейн не мог бы параллельно с теорией относительности плотно заниматься органической химией, дизайном материалов, реформой банковской системы, проектированием городов и массой других нужных вещей. Спустя столетие такой трюк может получиться — нейросеть будет заимствовать часть интеллекта гениев, обучаясь на их траекториях. Она словно арендует их лучшие стратегии и использует там, куда гении не добрались.
И кто знает, может, в обозримом будущем уже никого не удивит научное открытие или экономическое чудо (или же, например, военная операция), где был применен стиль чемпиона многопользовательской игры. Любой мощный инструмент всегда обоюдоострый. Главное решение — с какой целью его использовать — по-прежнему останется за людьми.
Комментарии
Потрясающе !
Спасибо за статью.