• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
28 июня
Полина Меньшова
1
3 527

ChatGPT прошел пятиминутный тест Тьюринга

5.4

Люди приняли бот ChatGPT-4 за человека во время пятиминутной текстовой переписки в 54% случаев. Однако у результатов эксперимента есть ряд ограничений.

Кадр из сериала «Черное зеркало» / © netflix.com

Тест Тьюринга считается способом проверить сходство искусственного интеллекта с человеком. Его суть в том, что если во время разговора с языковой моделью люди путают ее с человеком или не могут однозначно сказать, кто их собеседник, то поведение модели приближено к человеческому. При этом сам математик Алан Тьюринг, разработавший тест в начале 1950-х, отмечал его несовершенство. Ученый говорил, что для ИИ лучший способ выдать себя за человека — не отвечать на вопросы собеседника, а уклоняться от них, отшучиваться, переспрашивать. Именно такое поведение кажется людям более естественным, хотя в подобных ситуациях явно не демонстрируются сложность и многогранность мышления, свойственные «неискусственному» интеллекту.

Тем не менее тест Тьюринга остается важным инструментом при оценке возможностей ИИ, а его успешное прохождение — одной из целей, которые ставят перед новыми языковыми моделями. Появились даже несколько его разновидностей: они различаются как задачами, которые ставятся перед моделью и экспериментаторами, так и длительностью. Согласно работе ученых из Калифорнийского университета в Сан-Диего (США), справиться с пятиминутным тестом Тьюринга удалось боту ChatGPT-4 от компании OpenAI. Препринт с результатами соответствующего эксперимента появился на сайте arxiv.org.

В исследовании участвовали 402 человека, средний возраст которых составил 35 лет. Им предлагали в течение пяти минут переписываться со случайно подобранным собеседником. Это мог быть другой человек или одна из трех языковых моделей: ELIZA (созданная в 1966 году, способная имитировать поведение психолога и давшая название «эффекту ELIZA», при котором человек присваивает программе с текстовым интерфейсом человеческие качества вроде способности думать, понимать, сопереживать. — Прим. ред.), ChatGPT-3.5, ChatGPT-4. Задачей участников эксперимента было определить, с кем они общаются, и объяснить свое решение, а задачей языковых моделей — выдать себя за людей.

Бот ChatGPT-4 обманул людей в 54% случаев, при том что результат ChatGPT-3.5 составил 50%, а ELIZA — 22%. Верно идентифицировать человека участники исследования смогли в 67% случаев.

Только в одной из четырех переписок участвовали два человека. Остальные диалоги — результат общения человека и одной из трех языковых моделей / © Cameron R. Jones et al., UC San Diego, arxiv.org
Только в одной из четырех переписок участвовали два человека. Остальные диалоги — результат общения человека и одной из трех языковых моделей / © Cameron R. Jones et al., UC San Diego, arxiv.org

Исследователи отметили, что успех ChatGPT-4 говорит о значительном прогрессе в сфере искусственного интеллекта и о возможных проблемах, которые могут возникнуть, если языковые модели станет еще сложнее отличить от людей. С одной стороны, можно будет часть работы (например, клиентский сервис) делегировать машинам, с другой — участятся ситуации дезинформации и мошенничества с помощью технологий.

Тем не менее, говорят ученые, результаты недавнего эксперимента не только иллюстрируют достаточно высокую сложность и гибкость современных языковых моделей, но и напоминают об ограничениях теста Тьюринга. Участники исследования гораздо чаще судили о «человечности» собеседника не по полноте и точности ответа, а по стилю общения, чувству юмора и другим социально-эмоциональным характеристикам, которые не всегда соответствуют традиционным представлениям об интеллекте и его функциях. Кроме того, результаты более длительного эксперимента могли бы быть другими.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
Позавчера, 11:53
СПбГУ

Ученые Санкт-Петербургского государственного университета в составе научной группы выявили ген, который позволил арахису стать природным ГМО и адаптироваться к изменяющимся условиям окружающей среды.

Сегодня, 11:14
КНЦ РАН

В Мурманской области не добывают золото: его месторождений здесь пока не нашли. Впрочем, сообщения о находках этого металла датируются еще XVIII веком. Геологам также известны в Кольском регионе рудопроявления золота — минеральные тела, содержащее драгоценный металл в ассоциации с другими минералами, характерными для промышленных руд, но в таком количестве, что при нынешнем развитии экономики и технологий добывать его нерентабельно. Чтобы обнаружить в Кольском Заполярье месторождения золота, необходимы новые исследования. Ученые Геологического института Кольского научного центра провели их и узнали о природе местных рудопроявлений.

Позавчера, 09:35
Андрей

Американские биологи впервые провели анатомический анализ лицевых мышц койотов и обнаружили у этих хищников мышцы, которые позволяют домашним собакам строить «щенячий взгляд». Гипотетически этот признак возник при одомашнивании, но авторы новой научной работы опровергли эту версию. Вдобавок исследователи обнаружил мышцу-пучок, которая позволяет койотам щуриться.

28 сентября
Любовь

Международная исследовательская группа смогла прорастить семя древнего дерева из рода коммифора (Commiphora), найденного в пещере Иудейской пустыни в 1980-х годах. Ученые предположили, что это растение упоминается в библейских текстах. История семени, пролежавшего в земле почти тысячу лет, не только впечатляет, но и открывает новые возможности для изучения древней флоры засушливого региона.

1 октября
Полина Меньшова

Натуральные, или счетные, числа обозначают количество чего-либо или порядковый номер предмета относительно других. Ноль, не относящийся к натуральным числам, кодирует пустоту, отсутствие каких бы то ни было предметов. Однако человеческий мозг реагирует на него как на очень маленькое число, обнаружили ученые из Германии.

28 сентября
Unitsky String Technologies Inc.

Уголь – один из главных источников производимой электроэнергии во всем мире. В то время как запасов природного газа и нефти хватит на 40–60 лет, а уранового топлива – на 80–90, угля достаточно на тысячи лет. Но есть одна проблема: его использование наносит серьезный вред экологии. Это и выброс парниковых газов (CO2, СН4), а также SOx, NOx и твердых частиц при его сжигании, и загрязнение почвы и подземных вод в зоне складирования отходов. Однако белорусские ученые считают, что за этим видом топлива будущее, и знают, как сделать использование угля безопасным для природы.

25 сентября
Татьяна

Марс не всегда был холодным и сухим, как сейчас. Все больше фактов говорит о том, что миллиарды лет назад там текли водные потоки. А значит, была плотная атмосфера, создающая парниковый эффект и поддерживающая воду в жидком состоянии. Примерно 3,5 миллиарда лет назад вода исчезла, газовая оболочка существенно поредела. Почему? Ответ буквально лежит на поверхности, выяснили американские геологи.

11 сентября
Андрей

Французские исследователи проанализировали тысячи спутниковых снимков поверхности Антарктиды и выяснили, что почти весь континент покрывают продольные дюны — такой рельеф часто встречается на спутнике Сатурна Титане. Ученые также узнали, какие ветры формируют антарктические дюны, и нашли противоречие, раскрывающее детали климата на континенте.

17 сентября
Unitsky String Technologies Inc.

Инженеры из Белоруссии разработали альтернативный маршрут для более быстрой, безопасной и доступной перевозки грузов по сравнению с использованием Северного морского пути (СМП). Проект предусматривает организацию высокоскоростных грузопассажирских перевозок, в том числе транзитных, что станет альтернативой другим видам транспорта, в первую очередь авиации, за счет высокой скорости передвижения и уровня комфорта.

[miniorange_social_login]

Комментарии

1 Комментарий
Задолбала эта великая новость. Уже из каждого утюга трубят о том, что бог-машина прошел тест тьюринга.
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно