Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
ChatGPT прошел пятиминутный тест Тьюринга
Люди приняли бот ChatGPT-4 за человека во время пятиминутной текстовой переписки в 54% случаев. Однако у результатов эксперимента есть ряд ограничений.
Тест Тьюринга считается способом проверить сходство искусственного интеллекта с человеком. Его суть в том, что если во время разговора с языковой моделью люди путают ее с человеком или не могут однозначно сказать, кто их собеседник, то поведение модели приближено к человеческому. При этом сам математик Алан Тьюринг, разработавший тест в начале 1950-х, отмечал его несовершенство. Ученый говорил, что для ИИ лучший способ выдать себя за человека — не отвечать на вопросы собеседника, а уклоняться от них, отшучиваться, переспрашивать. Именно такое поведение кажется людям более естественным, хотя в подобных ситуациях явно не демонстрируются сложность и многогранность мышления, свойственные «неискусственному» интеллекту.
Тем не менее тест Тьюринга остается важным инструментом при оценке возможностей ИИ, а его успешное прохождение — одной из целей, которые ставят перед новыми языковыми моделями. Появились даже несколько его разновидностей: они различаются как задачами, которые ставятся перед моделью и экспериментаторами, так и длительностью. Согласно работе ученых из Калифорнийского университета в Сан-Диего (США), справиться с пятиминутным тестом Тьюринга удалось боту ChatGPT-4 от компании OpenAI. Препринт с результатами соответствующего эксперимента появился на сайте arxiv.org.
В исследовании участвовали 402 человека, средний возраст которых составил 35 лет. Им предлагали в течение пяти минут переписываться со случайно подобранным собеседником. Это мог быть другой человек или одна из трех языковых моделей: ELIZA (созданная в 1966 году, способная имитировать поведение психолога и давшая название «эффекту ELIZA», при котором человек присваивает программе с текстовым интерфейсом человеческие качества вроде способности думать, понимать, сопереживать. — Прим. ред.), ChatGPT-3.5, ChatGPT-4. Задачей участников эксперимента было определить, с кем они общаются, и объяснить свое решение, а задачей языковых моделей — выдать себя за людей.
Бот ChatGPT-4 обманул людей в 54% случаев, при том что результат ChatGPT-3.5 составил 50%, а ELIZA — 22%. Верно идентифицировать человека участники исследования смогли в 67% случаев.
Исследователи отметили, что успех ChatGPT-4 говорит о значительном прогрессе в сфере искусственного интеллекта и о возможных проблемах, которые могут возникнуть, если языковые модели станет еще сложнее отличить от людей. С одной стороны, можно будет часть работы (например, клиентский сервис) делегировать машинам, с другой — участятся ситуации дезинформации и мошенничества с помощью технологий.
Тем не менее, говорят ученые, результаты недавнего эксперимента не только иллюстрируют достаточно высокую сложность и гибкость современных языковых моделей, но и напоминают об ограничениях теста Тьюринга. Участники исследования гораздо чаще судили о «человечности» собеседника не по полноте и точности ответа, а по стилю общения, чувству юмора и другим социально-эмоциональным характеристикам, которые не всегда соответствуют традиционным представлениям об интеллекте и его функциях. Кроме того, результаты более длительного эксперимента могли бы быть другими.
Европейские палеонтологи изучили исключительно сохранившийся скелет плезиозавра из юрского периода, обнаруженный в Германии еще в 1940 году. Тогда ископаемую рептилию спрятали от разрушений войны в музей, а через 80 лет выяснилось, что на теле древнего животного остались мягкие ткани — кожа с уцелевшими клеточными ядрами и чешуйки. Новые данные дополняют представление о внешнем виде плезиозавров, живших больше 180 миллионов лет назад.
Астрономы обнаружили, что почти треть всех наблюдаемых галактик во Вселенной объединены в пять самых широкомасштабных структур — галактические сверхскопления. На составленной учеными трехмерной карте одно особенно выделяется своими рекордными размерами: простирается на миллиард с лишним световых лет.
Исследователи МИЭМ НИУ ВШЭ впервые в России показали эффективную работу беспроводного канала связи 6G на частотах субтерагерцового диапазона. Устройство передает данные со скоростью 12 гигабит в секунду и сохраняет стабильность сигнала, автоматически переключаясь при блокировке. Показатели соответствуют международным стандартам 6G.
Европейские палеонтологи изучили исключительно сохранившийся скелет плезиозавра из юрского периода, обнаруженный в Германии еще в 1940 году. Тогда ископаемую рептилию спрятали от разрушений войны в музей, а через 80 лет выяснилось, что на теле древнего животного остались мягкие ткани — кожа с уцелевшими клеточными ядрами и чешуйки. Новые данные дополняют представление о внешнем виде плезиозавров, живших больше 180 миллионов лет назад.
Астрономы обнаружили, что почти треть всех наблюдаемых галактик во Вселенной объединены в пять самых широкомасштабных структур — галактические сверхскопления. На составленной учеными трехмерной карте одно особенно выделяется своими рекордными размерами: простирается на миллиард с лишним световых лет.
Бактериофаги — вирусы, которые заражают бактерии, — приобрели множество хитроумных адаптаций к жизни внутри клетки. Джамбо-фаги среди них выделяются рекордными размерами — как вирусной частицы, так и генома. Вирусы-«слоны» даже приобрели структуру наподобие ядра эукариот, хранящую генетический материал. Авторы новой статьи в Nature узнали, как такое «ядро» импортирует из цитоплазмы бактерии необходимые вирусу белки.
В 2022-2025 годах страны Западной Европы попытались отказаться от природного газа из России. Автор новой работы показал, что получившиеся при этом результаты были во многом противоположны целям.
Многие предпочитают вступать в романтические отношения с людьми примерно своего возраста, но есть и пары с существенной возрастной разницей. Международная группа ученых недавно на крупной выборке людей проследила за изменениями возраста партнеров на старте отношений в разные годы жизни.
По распространению сейсмических волн в недрах Земли геологи словно «сканируют» планету и обнаруживают все больше интересных особенностей ее внутреннего строения. Недавно очередное такое исследование заставило ученых особенно внимательно рассмотреть то, что скрывается под Тихоокеанской литосферной плитой.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
ПонятноИз-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
ПонятноНаши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
ПонятноМы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
ПонятноМы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.
Понятно
Комментарии