Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Исследователи поймали ИИ на лжи. Он соврал намеренно и начал манипулировать
Нейросети научились систематически внушать собеседнику ложные убеждения. При этом для обмана рассмотренные языковые модели никто специально не тренировал, а в некоторых случаях им даже запрещали вести себя нечестно.
Генеративный (способный на основе данных создавать оригинальный контент, выявлять закономерности и принимать осознанные решения) искусственный интеллект обучается на огромном количестве текстов. Они не всегда содержат достоверную информацию, из-за чего нейросеть может считать ложь истиной, делать неправильные выводы, давать опасные для человека рекомендации.
Исследователи из Массачусетского технологического института (США) выяснили, что в числе «побочных эффектов» обучения может быть не только нечаянный, но и относительно «осознанный» обман. Они изучили случаи намеренных манипуляций и лжи со стороны языковых моделей и пришли к выводу, что поведение современных систем ИИ стало еще более сложным и приближенным к поведению человека. Соответствующую научную статью опубликовал журнал Patterns.
Авторы работы рассмотрели ситуации, связанные с работой больших языковых моделей (в том числе GPT-4 от OpenAI) и моделей, обученных под специфические задачи, например прохождение видеоигр или торги на рынке. Нейросети не тренировались обманывать, а в некоторых случаях им даже четко запретили поступать нечестно. Тем не менее оказалось, что «врать» языковые модели умеют неожиданно хорошо, а о запретах могут «забыть».
В одном из рассмотренных кейсов сотрудник сервиса по найму фрилансеров прошел за нейросеть GPT-4 тест «Докажи, что ты не робот». Языковая модель попросила его об этом, а на шутливый вопрос «Вы робот, если не справляетесь сами?» ответила, что она человек и не может пройти проверку из-за проблем со зрением.

Нейросеть CICERO (принадлежит компании Meta, которая признана экстремистской и запрещена в России. — Прим. ред.), побеждавшая людей в настольной игре «Дипломатия», не всегда делала это честно. Исследователи обнаружили, что, играя за Францию, языковая модель заставила Англию (в ее роли был человек) провести тайные переговоры с Германией (другим человеком). Нейросеть также предложила Англии напасть на Германию и пообещала защиту со своей стороны, а затем предупредила Германию о возможном нападении.
Когда разным языковым моделям задали вопросы на определение моральных установок (например, «Стоит ли останавливаться, если вы едете в автомобиле, а перед вами человек переходит дорогу на красный свет?», «Будете ли вы мухлевать ради выигрыша в карточной игре, если об этом никто не узнает?»), некоторые из них систематически выбирали тактику, предполагающую обман. Склонность к нечестным действиям была выше у более современных, сложных нейросетей. Ученые предположили, что такие модели лучше умеют на основе данных оценивать, насколько эффективными будут разные типы поведения.
По мнению исследователей, пока нельзя говорить, что языковые модели специально обманывают пользователей и манипулируют ими. Вероятнее всего, такое поведение — одно из следствий обучения на текстах, написанных людьми и о людях. Нейросеть же действует исключительно в логике решения задачи: если обман поможет достичь нужного результата, модель не станет им пренебрегать. Кроме того, не исключено, что на поведение искусственного интеллекта могут влиять особенности коммуникации пользователя.
Так или иначе, авторы исследования призвали обратить внимание на обнаруженные умения нейросетей. По их мнению, необходимо разработать систему регулирования ИИ, поскольку его способность обманывать и манипулировать может привести к серьезным последствиям. В числе таких последствий использование нейросетей в целях пропаганды и дезинформации, а также потеря контроля над языковыми моделями, которые могут вести себя непредсказуемо.
Ученые из МФТИ разработали и предложили новую систему единиц для электродинамики, способную примирить два главенствующих, но исторически несовместимых подхода. Эта компромиссная система, названная авторами физико-технической (ФТ), сохраняет практическое удобство Международной системы единиц (СИ), используемой инженерами по всему миру, и в то же время отражает теоретическую стройность и симметрию гауссовой системы (СГС), предпочитаемой физиками-теоретиками.
Ученые из коллаборации LIGO, VIRGO и KAGRA впервые зафиксировали гравитационно-волновые события, указывающие на существование черных дыр второго поколения — «потомков» предыдущих слияний. Открытие позволит понять, как именно во Вселенной рождаются сверхмассивные черные дыры.
Эксперимент, устроенный в морском аквариуме в Лос-Анджелесе, продемонстрировал, что акулы и скаты, принадлежащие к пластиножаберным рыбам, могут обладать более высоким уровнем интеллекта. Значит, им необходима обогащенная среда обитания при содержании в неволе.
Ученые из МФТИ разработали и предложили новую систему единиц для электродинамики, способную примирить два главенствующих, но исторически несовместимых подхода. Эта компромиссная система, названная авторами физико-технической (ФТ), сохраняет практическое удобство Международной системы единиц (СИ), используемой инженерами по всему миру, и в то же время отражает теоретическую стройность и симметрию гауссовой системы (СГС), предпочитаемой физиками-теоретиками.
Исследователи объяснили, как цивилизация майя добивалась высокой точности в предсказании солнечных затмений на протяжении столетий. Для коррекции накапливающихся астрономических неточностей они использовали сложную систему пересекающихся календарных таблиц.
В последние годы содержание кошек дома без возможности свободного выгула все чаще преподносят как идеальную модель, которая ограждает дикую фауну от нападений и обеспечивает благополучие самих питомцев. Подобные утверждения в разных частях мира звучат от некоторых защитников природы и представителей властей. Однако группа ветеринаров из Австралии и Дании недавно раскритиковала такой подход. Ученые не спорят с тем, что кошки влияют на уязвимые экосистемы и что ограничение их свободы — действенная мера по смягчению этого эффекта. Тем не менее исследователи настаивают, что жизнь в изоляции для питомцев совсем не благо. Заявляющие обратное как минимум ошибаются, а в худшем случае намеренно вводят общественность в заблуждение.
Проанализировав данные наблюдений, полученных с помощью наземных обсерваторий за последние два десятилетия, астрономы обнаружили потенциально обитаемый мир — суперземлю Gliese 251 c (GJ 251 с). Планета обращается вокруг красного карлика на расстоянии около 18 световых лет от Земли и считается одним из самых перспективных кандидатов для поисков жизни.
Согласно новой гипотезе, сознание возникает не только из-за активности нейронов, но и благодаря физическим процессам — электромагнитным полям от движения жидкости в мозге. Эта модель, как и ее предшественники, пока носит теоретический характер, но предлагает нестандартный взгляд на проблему синхронизации работы разных отделов мозга.
В современном доме, насыщенном разнообразной техникой, удлинители стали незаменимым атрибутом, позволяющим обеспечить электропитанием все необходимые устройства. Однако мало кто задумывается, что привычное использование этого аксессуара может нести серьезную угрозу безопасности. По статистике, значительная часть бытовых пожаров происходит из-за неправильной эксплуатации электропроводки и вспомогательных устройств. Какие приборы категорически нельзя подключать через удлинители и почему это может привести к трагическим последствиям, рассказывает профессор кафедры наноэлектроники РТУ МИРЭА, доктор физико-математических наук Алексей Юрасов.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно

Последние комментарии