28.06.2024, 14:30

Полина Меньшова

4,0 тыс

ChatGPT прошел пятиминутный тест Тьюринга

❋ 5.4

Люди приняли бот ChatGPT-4 за человека во время пятиминутной текстовой переписки в 54% случаев. Однако у результатов эксперимента есть ряд ограничений.

Психология

# ChatGPT

# OpenAI

# искусственный интеллект

# тест Тьюринга

Кадр из сериала «Черное зеркало» / © netflix.com

Тест Тьюринга считается способом проверить сходство искусственного интеллекта с человеком. Его суть в том, что если во время разговора с языковой моделью люди путают ее с человеком или не могут однозначно сказать, кто их собеседник, то поведение модели приближено к человеческому. При этом сам математик Алан Тьюринг, разработавший тест в начале 1950-х, отмечал его несовершенство. Ученый говорил, что для ИИ лучший способ выдать себя за человека — не отвечать на вопросы собеседника, а уклоняться от них, отшучиваться, переспрашивать. Именно такое поведение кажется людям более естественным, хотя в подобных ситуациях явно не демонстрируются сложность и многогранность мышления, свойственные «неискусственному» интеллекту.

Тем не менее тест Тьюринга остается важным инструментом при оценке возможностей ИИ, а его успешное прохождение — одной из целей, которые ставят перед новыми языковыми моделями. Появились даже несколько его разновидностей: они различаются как задачами, которые ставятся перед моделью и экспериментаторами, так и длительностью. Согласно работе ученых из Калифорнийского университета в Сан-Диего (США), справиться с пятиминутным тестом Тьюринга удалось боту ChatGPT-4 от компании OpenAI. Препринт с результатами соответствующего эксперимента появился на сайте arxiv.org.

В исследовании участвовали 402 человека, средний возраст которых составил 35 лет. Им предлагали в течение пяти минут переписываться со случайно подобранным собеседником. Это мог быть другой человек или одна из трех языковых моделей: ELIZA (созданная в 1966 году, способная имитировать поведение психолога и давшая название «эффекту ELIZA», при котором человек присваивает программе с текстовым интерфейсом человеческие качества вроде способности думать, понимать, сопереживать. — Прим. ред.), ChatGPT-3.5, ChatGPT-4. Задачей участников эксперимента было определить, с кем они общаются, и объяснить свое решение, а задачей языковых моделей — выдать себя за людей.

Бот ChatGPT-4 обманул людей в 54% случаев, при том что результат ChatGPT-3.5 составил 50%, а ELIZA — 22%. Верно идентифицировать человека участники исследования смогли в 67% случаев.

Только в одной из четырех переписок участвовали два человека. Остальные диалоги — результат общения человека и одной из трех языковых моделей / © Cameron R. Jones et al., UC San Diego, arxiv.org

Исследователи отметили, что успех ChatGPT-4 говорит о значительном прогрессе в сфере искусственного интеллекта и о возможных проблемах, которые могут возникнуть, если языковые модели станет еще сложнее отличить от людей. С одной стороны, можно будет часть работы (например, клиентский сервис) делегировать машинам, с другой — участятся ситуации дезинформации и мошенничества с помощью технологий.

Тем не менее, говорят ученые, результаты недавнего эксперимента не только иллюстрируют достаточно высокую сложность и гибкость современных языковых моделей, но и напоминают об ограничениях теста Тьюринга. Участники исследования гораздо чаще судили о «человечности» собеседника не по полноте и точности ответа, а по стилю общения, чувству юмора и другим социально-эмоциональным характеристикам, которые не всегда соответствуют традиционным представлениям об интеллекте и его функциях. Кроме того, результаты более длительного эксперимента могли бы быть другими.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Журналист, преподаватель НИУ ВШЭ, главный редактор медиа о русском языке «Изборник». Специализируется на популяризации лингвистики, психологии, нейробиологии и медицины.

Психология

# ChatGPT

# OpenAI

# искусственный интеллект

# тест Тьюринга

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Эпоха средиземноморских сверхдержав

Центр «Архэ»

Москва

Библиотека им. Н. А. Некрасова

Москва

Лекция

04 Дек

500 ₽

Роль движения в когнитивном развитии

Санкт-Петербургский Планетарий

Санкт-Петербург

Лекция

04 Дек

Бесплатно

Муковисцидоз — вчера, сегодня, завтра

Парк «Зарядье»

Москва

Лекция

04 Дек

1500 ₽

Сознание и мозг: от теории до эксперимента

ВСмысле

Санкт-Петербург

Лекция

04 Дек

Бесплатно

Пони и лошади в Московском зоопарке

Московский зоопарк

Москва

Лекция

05 Дек

Бесплатно

Искусство античной Греции

ВДНХ

Москва

Центр «Архэ»

Санкт-Петербург

Лекция

05 Дек

750 ₽

Генетика пола и сцепленное с полом наследование

Центр «Архэ»

Онлайн

Популярное

За сутки

За неделю

За месяц

1 декабря, 10:59

Максим Абдулаев

У растений обнаружили механизм бурения плотного грунта по принципу промышленных труб

Международная группа биологов изучила механизм, который позволяет корням риса расти сквозь плотный грунт. Оказалось, растение перестраивает структуру своих клеток: внутренние слои корня становятся мягче и расширяются, а внешняя оболочка остается жесткой. Такая конструкция придает корню устойчивость и силу, необходимую для роста в сложной почве.

Биология

# ботаника

# корни

# растения

# рис

2 декабря, 17:10

Игорь Байдов

Археологические памятники на западе Турции назвали «следом забытой цивилизации»

На холмах Западной Турции расположены сотни памятников бронзового века. На протяжении десятилетий их связывали с разрозненными поселениями, которые существовали независимо друг от друга. Однако археологи собрали доказательства, указывающие на то, что эти поселения могли быть частью ранее неизвестной цивилизации, которая представляла собой мощную политическую силу, державшую в напряжении Восточное Средиземноморье почти 3200 лет назад.

Археология

# Бронзовый век

# Древний Египет

# Троянская война

# Турция

# Хеттская империя

2 декабря, 15:52

Адель Романова

Биологи перечислили самые убедительные признаки внеземной жизни

Ученые попытались обобщить все имеющиеся данные о возможном существовании жизни за пределами Земли, от предполагаемых древних окаменелостей в метеоритах до всевозможных сообщений об «инопланетянах». В итоге отсеивание всего слишком сомнительного позволило собрать небольшой список действительно интересных фактов. В этом рейтинге лидируют метеориты Мерчисон и Оргей.

Биология

# астробиология

# внеземная жизнь

# Мерчисонский метеорит

# метеориты

29 ноября, 12:42

Александр Березин

Впервые в истории Россия временно лишилась возможности выводить людей в космос. Какие выводы сделают отрасль сильнее?

Позавчера, 27 ноября 2025 года, при запуске космонавтов к МКС на стартовую площадку № 31 упала кабина обслуживания стартового комплекса. Это означает, что новые пуски оттуда до починки невозможны. К сожалению, в 2010-х годах, в рамках «оптимизации» расходов, резервную площадку (с которой летал Юрий Гагарин) упразднили. Поэтому случилось беспрецедентное: в XXI веке страна с пилотируемой космической программой осталась без средств запуска людей на орбиту. Пока ремонт не закончится, проблема сохранится. Чем это может грозить?

Космонавтика

# «Союз МС»

# Байконур

# корабль Союз

# космодром «Восточный»

# космодром Байконур

# космос

# Роскосмос

# Россия

Выбор редакции

27 ноября, 20:20

Максим Абдулаев

Эксперимент подтвердил эффективность античного способа получения вина из изюма

Японские биологи повторили античную технологию производства вина из изюма, чтобы выяснить механизм его брожения. Исследователи показали, что сушеный виноград, в отличие от свежего, накапливает на поверхности дикие дрожжи и способен превращать воду в алкоголь без внесения дополнительных заквасок.

Археология

# алкоголь

# античность

# вино

# виноделие

# дрожжи

# история

# микробиология

27 ноября, 11:05

Игорь Байдов

Каменные идолы острова Пасхи оказались результатом соперничества независимых общин

Долгое время ученые полагали, что сотни гигантских статуй на острове Пасхи создали представители местной общины под руководством одного вождя. Однако авторы нового исследования поставили эту гипотезу под сомнение. Детальная трехмерная карта главного каменного карьера острова указала на более сложную картину. Вероятно, монументы были плодом творчества и соперничества небольших независимых групп.

Антропология

# остров Пасхи

# Полинезия

# статуи

29 ноября, 12:42

Александр Березин

Впервые в истории Россия временно лишилась возможности выводить людей в космос. Какие выводы сделают отрасль сильнее?

Космонавтика

# «Союз МС»

# Байконур

# корабль Союз

# космодром «Восточный»

# космодром Байконур

# космос

# Роскосмос

# Россия

Выбор редакции

27 ноября, 20:20

Максим Абдулаев

Эксперимент подтвердил эффективность античного способа получения вина из изюма

Археология

# алкоголь

# античность

# вино

# виноделие

# дрожжи

# история

# микробиология

20 ноября, 13:12

Полина Меньшова

Анализ 2430 языков показал сходства и различия их правил грамматики

Человеческие языки разнообразны, но это разнообразие ограничивается повторяющимися закономерностями. Пытаясь описать правила, которым подчиняются различия в грамматике, лингвисты сформулировали ряд так называемых грамматических универсалий — утверждений, предположительно верных для всех или большинства языков мира. Международная команда ученых провела статистический анализ на материале 2430 языков и обнаружила, что соответствующими действительности можно считать около трети таких утверждений.

Психология

# грамматика

# лингвистика

# морфология

# синтаксис

# языки

[miniorange_social_login]

ChatGPT прошел пятиминутный тест Тьюринга

По теме

Историк технологий объяснил, почему бесполезно спрашивать нейросети об их ошибках

Тяга ИИ к гонке вооружений и ядерным ударам сделала его опасным помощником в военно-политических вопросах

Элон Маск создаст робота-домохозяйку

Популярное

Комментарии

Последние новости:

В Москве состоялся XII Конгресс «Инновационная практика: наука плюс бизнес». Naked Science был партнером мероприятия

Механическая деформация сделала алмаз идеальным кубитом

Татуировки резко повысили риск меланомы

Необычное поведение крупнейших солнечных пятен удалось объяснить

Отрастить неотращиваемое: как ученые из России хотят научить человеческий организм регенерировать подобно аксолотлю

Впервые в истории Россия временно лишилась возможности выводить людей в космос. Какие выводы сделают отрасль сильнее?

Атомный квиз — разгоните нейтроны знаний!

Зажечь Солнце на Земле: как Россия в одиночку строит свой ИТЭР – интервью с Андреем Аникеевым

Последние комментарии

Самые обсуждаемые

Впервые в истории Россия временно лишилась возможности выводить людей в космос. Какие выводы сделают отрасль сильнее?

В Институте космических исследований РАН предложили отказаться от полетов на Марс

Эксперимент подтвердил эффективность античного способа получения вина из изюма

Отрастить неотращиваемое: как ученые из России хотят научить человеческий организм регенерировать подобно аксолотлю