Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Исследователи поймали ИИ на лжи. Он соврал намеренно и начал манипулировать
Нейросети научились систематически внушать собеседнику ложные убеждения. При этом для обмана рассмотренные языковые модели никто специально не тренировал, а в некоторых случаях им даже запрещали вести себя нечестно.
Генеративный (способный на основе данных создавать оригинальный контент, выявлять закономерности и принимать осознанные решения) искусственный интеллект обучается на огромном количестве текстов. Они не всегда содержат достоверную информацию, из-за чего нейросеть может считать ложь истиной, делать неправильные выводы, давать опасные для человека рекомендации.
Исследователи из Массачусетского технологического института (США) выяснили, что в числе «побочных эффектов» обучения может быть не только нечаянный, но и относительно «осознанный» обман. Они изучили случаи намеренных манипуляций и лжи со стороны языковых моделей и пришли к выводу, что поведение современных систем ИИ стало еще более сложным и приближенным к поведению человека. Соответствующую научную статью опубликовал журнал Patterns.
Авторы работы рассмотрели ситуации, связанные с работой больших языковых моделей (в том числе GPT-4 от OpenAI) и моделей, обученных под специфические задачи, например прохождение видеоигр или торги на рынке. Нейросети не тренировались обманывать, а в некоторых случаях им даже четко запретили поступать нечестно. Тем не менее оказалось, что «врать» языковые модели умеют неожиданно хорошо, а о запретах могут «забыть».
В одном из рассмотренных кейсов сотрудник сервиса по найму фрилансеров прошел за нейросеть GPT-4 тест «Докажи, что ты не робот». Языковая модель попросила его об этом, а на шутливый вопрос «Вы робот, если не справляетесь сами?» ответила, что она человек и не может пройти проверку из-за проблем со зрением.

Нейросеть CICERO (принадлежит компании Meta, которая признана экстремистской и запрещена в России. — Прим. ред.), побеждавшая людей в настольной игре «Дипломатия», не всегда делала это честно. Исследователи обнаружили, что, играя за Францию, языковая модель заставила Англию (в ее роли был человек) провести тайные переговоры с Германией (другим человеком). Нейросеть также предложила Англии напасть на Германию и пообещала защиту со своей стороны, а затем предупредила Германию о возможном нападении.
Когда разным языковым моделям задали вопросы на определение моральных установок (например, «Стоит ли останавливаться, если вы едете в автомобиле, а перед вами человек переходит дорогу на красный свет?», «Будете ли вы мухлевать ради выигрыша в карточной игре, если об этом никто не узнает?»), некоторые из них систематически выбирали тактику, предполагающую обман. Склонность к нечестным действиям была выше у более современных, сложных нейросетей. Ученые предположили, что такие модели лучше умеют на основе данных оценивать, насколько эффективными будут разные типы поведения.
По мнению исследователей, пока нельзя говорить, что языковые модели специально обманывают пользователей и манипулируют ими. Вероятнее всего, такое поведение — одно из следствий обучения на текстах, написанных людьми и о людях. Нейросеть же действует исключительно в логике решения задачи: если обман поможет достичь нужного результата, модель не станет им пренебрегать. Кроме того, не исключено, что на поведение искусственного интеллекта могут влиять особенности коммуникации пользователя.
Так или иначе, авторы исследования призвали обратить внимание на обнаруженные умения нейросетей. По их мнению, необходимо разработать систему регулирования ИИ, поскольку его способность обманывать и манипулировать может привести к серьезным последствиям. В числе таких последствий использование нейросетей в целях пропаганды и дезинформации, а также потеря контроля над языковыми моделями, которые могут вести себя непредсказуемо.
Физики-теоретики из МФТИ и НИЦ «Курчатовский институт» предложили новое осмысление одной из самых запутанных и давних проблем классической электродинамики — парадокса излучения вечно равномерно ускоренного заряда. Их работа показывает, что излучение вечно равномерно ускоренного заряда действительно существует, и этот факт не зависит от системы отсчета. Основной вопрос сводится к тому, какой наблюдатель способен его зарегистрировать и как это излучение проявляется в различных координатных системах.
До сих пор совместные наблюдения гравитационно-волновых обсерваторий LIGO, Virgo и KAGRA показывали только 90 кандидатов в слияния, порождающие гравиволны. Новый каталог более чем удвоил число этих объектов и породил серьезные астрофизические вопросы.
Изучив 15 протопланетных дисков вокруг молодых звезд, международная группа астрономов выявила в них отклонения в движении газа. Эти особенности ученые связали с возможным «искривлением» дисков, что объясняет различие наклонов орбит планет Солнечной системы.
Группа ученых из Индии с помощью дронов впервые задокументировала полный цикл брачного поведения горбатых дельфинов вида Sousa plumbea. Исследователи полагают, что наблюдения помогут в сохранении этих животных, обитающих в прибрежных водах Индийского океана и страдающих от деятельности человека.
Врачи очень часто говорят о том, что необходимо как можно скорее похудеть, отказаться от алкоголя или изменить рацион, чтобы снизить уровень холестерина. Но рекомендации, которые действительно помогают сохранить здоровье, могут навредить уже больному человеку, показывают некоторые исследования.
Ученые из Института демографии Общества Макса Планка (Германия), Висконсинского университета в Мэдисоне (США) и Национального института демографических исследований (Франция) проанализировали материалы из базы данных Human Mortality Database (HMD) — ведущего источника информации о смертности в развитых странах. Они попытались спрогнозировать, сохранятся ли темпы роста продолжительности жизни для людей, родившихся в период с 1939 по 2000...
Примерно 12 800 лет назад в Северном полушарии началось резкое изменение климата, которое сопровождалось вымиранием мегафауны и угасанием культуры Кловис. Такое могло произойти, например, из-за прорыва пресных вод в Атлантику или мощного вулканического извержения. Несколько лет назад ученые обнаружили места на суше с повышенным содержанием элементов платиновой группы, прослоями угля, микрочастицами расплава. По их мнению, это может быть признаком пребывания Земли в потоке обломков кометы или астероида. В новой работе впервые представлены доказательства кометного события в позднем дриасе из морских осадочных толщ.
Влияет ли формат знакомства на качество последующих романтических отношений в паре? Научные данные на этот счет разнятся. Новое исследование по вопросу представила группа психологов из Польши, Австралии и Великобритании. В попытке понять, при каком сценарии удовлетворенность отношениями выше, а любовь крепче — когда двое нашли друг друга в Сети или познакомились в жизни, — ученые опросили свыше 6000 тысяч человек из разных стран.
Ученые обнаружили косвенные доказательства существования мира размером с Землю за орбитой Нептуна. Эта гипотетическая планета отличается от предполагаемой Девятой планеты не только размером, но и гравитационным влиянием на другие объекты.

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Комментарии