• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
28 июня
Полина Меньшова
2
3 547

ChatGPT прошел пятиминутный тест Тьюринга

5.4

Люди приняли бот ChatGPT-4 за человека во время пятиминутной текстовой переписки в 54% случаев. Однако у результатов эксперимента есть ряд ограничений.

Кадр из сериала «Черное зеркало» / © netflix.com

Тест Тьюринга считается способом проверить сходство искусственного интеллекта с человеком. Его суть в том, что если во время разговора с языковой моделью люди путают ее с человеком или не могут однозначно сказать, кто их собеседник, то поведение модели приближено к человеческому. При этом сам математик Алан Тьюринг, разработавший тест в начале 1950-х, отмечал его несовершенство. Ученый говорил, что для ИИ лучший способ выдать себя за человека — не отвечать на вопросы собеседника, а уклоняться от них, отшучиваться, переспрашивать. Именно такое поведение кажется людям более естественным, хотя в подобных ситуациях явно не демонстрируются сложность и многогранность мышления, свойственные «неискусственному» интеллекту.

Тем не менее тест Тьюринга остается важным инструментом при оценке возможностей ИИ, а его успешное прохождение — одной из целей, которые ставят перед новыми языковыми моделями. Появились даже несколько его разновидностей: они различаются как задачами, которые ставятся перед моделью и экспериментаторами, так и длительностью. Согласно работе ученых из Калифорнийского университета в Сан-Диего (США), справиться с пятиминутным тестом Тьюринга удалось боту ChatGPT-4 от компании OpenAI. Препринт с результатами соответствующего эксперимента появился на сайте arxiv.org.

В исследовании участвовали 402 человека, средний возраст которых составил 35 лет. Им предлагали в течение пяти минут переписываться со случайно подобранным собеседником. Это мог быть другой человек или одна из трех языковых моделей: ELIZA (созданная в 1966 году, способная имитировать поведение психолога и давшая название «эффекту ELIZA», при котором человек присваивает программе с текстовым интерфейсом человеческие качества вроде способности думать, понимать, сопереживать. — Прим. ред.), ChatGPT-3.5, ChatGPT-4. Задачей участников эксперимента было определить, с кем они общаются, и объяснить свое решение, а задачей языковых моделей — выдать себя за людей.

Бот ChatGPT-4 обманул людей в 54% случаев, при том что результат ChatGPT-3.5 составил 50%, а ELIZA — 22%. Верно идентифицировать человека участники исследования смогли в 67% случаев.

Только в одной из четырех переписок участвовали два человека. Остальные диалоги — результат общения человека и одной из трех языковых моделей / © Cameron R. Jones et al., UC San Diego, arxiv.org
Только в одной из четырех переписок участвовали два человека. Остальные диалоги — результат общения человека и одной из трех языковых моделей / © Cameron R. Jones et al., UC San Diego, arxiv.org

Исследователи отметили, что успех ChatGPT-4 говорит о значительном прогрессе в сфере искусственного интеллекта и о возможных проблемах, которые могут возникнуть, если языковые модели станет еще сложнее отличить от людей. С одной стороны, можно будет часть работы (например, клиентский сервис) делегировать машинам, с другой — участятся ситуации дезинформации и мошенничества с помощью технологий.

Тем не менее, говорят ученые, результаты недавнего эксперимента не только иллюстрируют достаточно высокую сложность и гибкость современных языковых моделей, но и напоминают об ограничениях теста Тьюринга. Участники исследования гораздо чаще судили о «человечности» собеседника не по полноте и точности ответа, а по стилю общения, чувству юмора и другим социально-эмоциональным характеристикам, которые не всегда соответствуют традиционным представлениям об интеллекте и его функциях. Кроме того, результаты более длительного эксперимента могли бы быть другими.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
23 октября
Алиса Гаджиева

Колесо называют самым важным механическим изобретением всех времен и связывают с серьезным социальными и экономическими изменениями в человеческих обществах. Тем не менее о происхождении этой революционной технологии известно мало. Авторы нового исследования считают, что колесо придумали жители Карпатских гор примерно шесть тысяч лет назад.

Позавчера, 13:00
Елизавета Александрова

До недавних пор системы красных карликов считали практически безнадежными в смысле возможной обитаемости из-за мощных вспышек таких звезд. Теперь выяснилось, что на их мирах миллиарды лет может сохраняться комфортная, богатая водой атмосфера.

12 часов назад
МАИ

Инженерная компания из Дубая LEAP71 сообщила, что спроектированный нейронной сетью Noyron и напечатанный в 3D-формате из меди ракетный двигатель успешно прошел первые испытания на полигоне в Великобритании. Возможно ли это — рассказал эксперт МАИ, старший преподаватель кафедры «Космические системы и ракетостроение» Иван Рудой.

23 октября
Алиса Гаджиева

Колесо называют самым важным механическим изобретением всех времен и связывают с серьезным социальными и экономическими изменениями в человеческих обществах. Тем не менее о происхождении этой революционной технологии известно мало. Авторы нового исследования считают, что колесо придумали жители Карпатских гор примерно шесть тысяч лет назад.

22 октября
Любовь

Среди 95 лун Юпитера особый интерес у ученых вызывает Европа — мир, под ледяной оболочкой которого скрыт потенциально обитаемый океан. Поиском признаков жизни на спутнике займется космический аппарат Europa Clipper, стартовавший из Космического центра имени Кеннеди в понедельник, 14 октября 2024-го. Аппарат, оснащенный инновационными инструментами для планетных исследований, прибудет к месту назначения в 2030 году.

20 октября
Михаил Орлов

Трилобиты — своеобразные членистоногие, которые жили повсеместно в морях палеозойской эры, а затем полностью вымерли. Некоторые из них (представители групп харпетиды и тринуклеиды) имели уникальную общую черту, — плоский широкий вырост на головном отделе. Его назначение неясно: возможно, с помощью своей лопасти трилобиты питались или копались в грунте. Авторы нового исследования показали, что обе группы приобрели «украшение» независимо и при этом прошли через очень похожие эволюционные изменения.

14 октября
Алиса Гаджиева

Полторы тысячи лет назад климат в Северном полушарии резко изменился. В Дании так похолодало, что там стало невозможно заниматься сельским хозяйством. Авторы нового исследования считают, что именно этот период был прообразом Фимбульвинтера — зимы, предшествующей Рагнарёку.

15 октября
Татьяна

Сейчас Япония привлекает людей со всего мира, но так было не всегда. На протяжение десяти тысяч лет архипелаг оставался изолированным от остального мира, пока туда не начали прибывать первые «мигранты» с континента. Это показал генетический анализ останков человека эпохи Яёй.

11 октября
Татьяна

В 1898 году два льва терроризировали лагерь строителей моста через реку Цаво в Кении. Хищники наведывались ночами и похищали людей из палаток. Погибли 28 человек. Людоедов застрелил британский военный Джон Генри Паттерсон, позже он передал останки в Музей естественной истории имени Филда в Чикаго. Ученые из США и Кении исследовали черепа хищников, извлекли ДНК из сохранившихся в зубах волосков и выяснили видовую принадлежность жертв.

[miniorange_social_login]

Комментарии

2 Комментария
Дмитрий Филимонов
2 дня назад
-
0
+
В 54% случаев да еще и с ограничениями - не слишком-то впечатляюще
Задолбала эта великая новость. Уже из каждого утюга трубят о том, что бог-машина прошел тест тьюринга.
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно