28.06.2024, 14:30

Полина Меньшова

ChatGPT прошел пятиминутный тест Тьюринга

❋ 5.4

Люди приняли бот ChatGPT-4 за человека во время пятиминутной текстовой переписки в 54% случаев. Однако у результатов эксперимента есть ряд ограничений.

Психология

# ChatGPT

# OpenAI

# искусственный интеллект

# тест Тьюринга

Кадр из сериала «Черное зеркало» / © netflix.com

Тест Тьюринга считается способом проверить сходство искусственного интеллекта с человеком. Его суть в том, что если во время разговора с языковой моделью люди путают ее с человеком или не могут однозначно сказать, кто их собеседник, то поведение модели приближено к человеческому. При этом сам математик Алан Тьюринг, разработавший тест в начале 1950-х, отмечал его несовершенство. Ученый говорил, что для ИИ лучший способ выдать себя за человека — не отвечать на вопросы собеседника, а уклоняться от них, отшучиваться, переспрашивать. Именно такое поведение кажется людям более естественным, хотя в подобных ситуациях явно не демонстрируются сложность и многогранность мышления, свойственные «неискусственному» интеллекту.

Тем не менее тест Тьюринга остается важным инструментом при оценке возможностей ИИ, а его успешное прохождение — одной из целей, которые ставят перед новыми языковыми моделями. Появились даже несколько его разновидностей: они различаются как задачами, которые ставятся перед моделью и экспериментаторами, так и длительностью. Согласно работе ученых из Калифорнийского университета в Сан-Диего (США), справиться с пятиминутным тестом Тьюринга удалось боту ChatGPT-4 от компании OpenAI. Препринт с результатами соответствующего эксперимента появился на сайте arxiv.org.

В исследовании участвовали 402 человека, средний возраст которых составил 35 лет. Им предлагали в течение пяти минут переписываться со случайно подобранным собеседником. Это мог быть другой человек или одна из трех языковых моделей: ELIZA (созданная в 1966 году, способная имитировать поведение психолога и давшая название «эффекту ELIZA», при котором человек присваивает программе с текстовым интерфейсом человеческие качества вроде способности думать, понимать, сопереживать. — Прим. ред.), ChatGPT-3.5, ChatGPT-4. Задачей участников эксперимента было определить, с кем они общаются, и объяснить свое решение, а задачей языковых моделей — выдать себя за людей.

Бот ChatGPT-4 обманул людей в 54% случаев, при том что результат ChatGPT-3.5 составил 50%, а ELIZA — 22%. Верно идентифицировать человека участники исследования смогли в 67% случаев.

Только в одной из четырех переписок участвовали два человека. Остальные диалоги — результат общения человека и одной из трех языковых моделей / © Cameron R. Jones et al., UC San Diego, arxiv.org

Исследователи отметили, что успех ChatGPT-4 говорит о значительном прогрессе в сфере искусственного интеллекта и о возможных проблемах, которые могут возникнуть, если языковые модели станет еще сложнее отличить от людей. С одной стороны, можно будет часть работы (например, клиентский сервис) делегировать машинам, с другой — участятся ситуации дезинформации и мошенничества с помощью технологий.

Тем не менее, говорят ученые, результаты недавнего эксперимента не только иллюстрируют достаточно высокую сложность и гибкость современных языковых моделей, но и напоминают об ограничениях теста Тьюринга. Участники исследования гораздо чаще судили о «человечности» собеседника не по полноте и точности ответа, а по стилю общения, чувству юмора и другим социально-эмоциональным характеристикам, которые не всегда соответствуют традиционным представлениям об интеллекте и его функциях. Кроме того, результаты более длительного эксперимента могли бы быть другими.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Журналист, преподаватель НИУ ВШЭ, главный редактор медиа о русском языке «Изборник». Специализируется на популяризации лингвистики, психологии, нейробиологии и медицины.

Психология

# ChatGPT

# OpenAI

# искусственный интеллект

# тест Тьюринга

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Генетические бродяги: мобильные элементы в ДНК

Экспериментаниум

Москва

Лекция

16 Авг

Бесплатно

Экологичная архитектура

Библиотека им. Ф.М. Достоевского

Москва

Лекция

17 Авг

600 ₽

Как выбрать лучший оффер и не уйти в монастырь

Центр «Архэ»

Онлайн

Экскурсия

17 Авг

Бесплатно

Тайны небесных светил

Космонавтика и авиация

Москва

Лекция

17 Авг

700 ₽

Личная система самообмана

Зануда

Санкт-Петербург

Лекция

18 Авг

600 ₽

Как батониться по гари, чтобы не засилили

Центр «Архэ»

Онлайн

Библиотека им. Н. А. Некрасова

Москва

Лекция

19 Авг

Бесплатно

Архитектурные утопии XX века

Библиотека им. М. Ю. Лермонтова

Санкт-Петербург

Лекция

19 Авг

Бесплатно

Русские мифы: как и зачем их исследуют ученые?

Альпина нон-фикшн

Москва

Популярное

За сутки

За неделю

За месяц

14 августа, 08:50

Юлия Трепалина

В Австралии обнаружили генетического самца кукабарры, способного откладывать яйца

Ученые знают о возможности реверсии, или изменения, одного пола на другой у рыб, земноводных и рептилий. Но задокументированных случаев подобного у диких птиц и млекопитающих мало. Исследователи недавно обнаружили, что в Австралии смена пола у пернатых может быть не таким редким явлением.

Биология

# Австралия

# дикие птицы

# половые различия

# самки

# самцы

# смена пола

14 августа, 08:27

Полина Меньшова

Историк технологий объяснил, почему бесполезно спрашивать нейросети об их ошибках

Когда модели искусственного интеллекта ошибаются и выдают неверный ответ на запрос, пользователи пытаются выяснить причину этой ошибки, задавая вопрос самому ИИ-помощнику. Историк технологий Бендж Эдвардс объяснил, почему делать так нет смысла и как это связано с устройством нейросетей.

Технологии

# ChatGPT

# OpenAI

# искусственный интеллект

# нейросети

16 августа, 09:00

Денис Яковлев

Психологи описали новое когнитивное искажение

Представьте, что вы решили куда-то сходить. Выходите из дома, поворачиваете налево и проходите примерно один квартал. Внезапно становится понятно: если бы сразу повернули направо — путь занял бы намного меньше времени. Еще достаточно близко, чтобы вернуться и пойти по более короткому маршруту, но сделаете ли вы это? Скорее всего, нет, считают американские ученые, которым удалось объяснить причины такого нерационального поведения.

Психология

# когнитивные искажения

# мышление

# ошибки

# предрассудки

# стереотипы

12 августа, 11:29

Юлия Трепалина

Психологи узнали, в каких парах любовь сильнее — у нашедших друг друга онлайн или в жизни

Влияет ли формат знакомства на качество последующих романтических отношений в паре? Научные данные на этот счет разнятся. Новое исследование по вопросу представила группа психологов из Польши, Австралии и Великобритании. В попытке понять, при каком сценарии удовлетворенность отношениями выше, а любовь крепче — когда двое нашли друг друга в Сети или познакомились в жизни, — ученые опросили свыше 6000 тысяч человек из разных стран.

Психология

# знакомство

# интернет

# любовь

# онлайн-знакомство

# романтические отношения

# удовлетворенность отношениями

14 августа, 08:27

Полина Меньшова

Историк технологий объяснил, почему бесполезно спрашивать нейросети об их ошибках

Технологии

# ChatGPT

# OpenAI

# искусственный интеллект

# нейросети

14 августа, 08:50

Юлия Трепалина

В Австралии обнаружили генетического самца кукабарры, способного откладывать яйца

Биология

# Австралия

# дикие птицы

# половые различия

# самки

# самцы

# смена пола

25 июля, 07:47

Адель Романова

У третьего межзвездного объекта нашли признаки управляемого корабля

Прибывшая из межзвездного пространства предполагаемая комета 3I/ATLAS движется по траектории, максимально удобной для гравитационных маневров управляемого корабля, при этом возможность ее отслеживания с Земли практически минимальна. По мнению некоторых ученых, такое «поведение» объекта наводит на определенные мысли.

Астрономия

# внеземные цивилизации

# космос

# межзвездная комета

# межзвездные зонды

# межзвездные объекты

6 августа, 20:59

Татьяна Пичугина

Ученые добыли новые доказательства столкновения с кометой 12 800 лет назад

Примерно 12 800 лет назад в Северном полушарии началось резкое изменение климата, которое сопровождалось вымиранием мегафауны и угасанием культуры Кловис. Такое могло произойти, например, из-за прорыва пресных вод в Атлантику или мощного вулканического извержения. Несколько лет назад ученые обнаружили места на суше с повышенным содержанием элементов платиновой группы, прослоями угля, микрочастицами расплава. По их мнению, это может быть признаком пребывания Земли в потоке обломков кометы или астероида. В новой работе впервые представлены доказательства кометного события в позднем дриасе из морских осадочных толщ.

Геология

# Атлантический океан

# комета

# морское дно

# платина

# событие позднего дриаса

22 июля, 14:44

ФизТех

Ученые выяснили, как отличить текст, написанный ИИ, от человеческого

Команда исследователей из Сколтеха, МФТИ, Института искусственного интеллекта AIRI и других научных центров разработала метод, позволяющий не просто отличать тексты, написанные человеком, от сгенерированных нейросетью, но и понимать, по каким именно признакам классификатор принимает решение о том, является ли текст генерацией или нет. Анализируя внутренние состояния глубоких слоев языковой модели, ученые смогли выделить и интерпретировать численные признаки, отвечающие за стилистику, сложность и «степень уверенности» текста.

ФизТех