01.08.2023, 11:19

Василий Парфенов

4,0 тыс

GPT-3 выполнил тест на мышление аналогиями лучше студентов колледжа

❋ 4.5

Американские психологи проверили способность большой языковой модели GPT-3 решать незнакомые для нее задачи методом аналогии. Это классический подход к определению интеллектуального развития людей, и нейросетевой алгоритм показал себя с неожиданной стороны. Он дал больше правильных ответов в адаптированном тесте стандартными прогрессивными матрицами Рейвена, чем студенты старших курсов колледжа.

Технологии

# GPT-3

# ИИ

# искусственный интеллект

# логическое мышление

# нейросети

# США

Кадр из фильма «Из машины» (Ex machina, 2014) / ©A24, Universal Pictures International / Автор: Pinaria Caprarius

Заставлять нейросети делать что-нибудь, для чего они изначально не предназначались — интересное развлечение, с которым после открытия доступа к языковым моделям вроде ChatGPT познакомился едва ли не каждый пользователь интернета. Однако подобные действия могут иметь и вполне научное обоснование. Тестируя генеративный искусственный интеллект на грани его возможностей, ученые ищут способы познания человеческого разума.

Пожалуй, самое впечатляющее в алгоритмах семейства GPT-3 — их способность решать те или иные новые задачи с минимум примеров (Zero-shot). Главное — описать проблему текстом.

Такая механика мышления — изучить один-два образца, провести аналогию с новой, совсем незнакомой, но похожей ситуацией и найти из нее выход — называется аналоговым, или аналогичным, рассуждением (analogical reasoning). Имеется в виду «рассуждение» как часть мышления, а не вербализация. И считается, что это уникальная особенность людей. Может быть, еще и некоторых наиболее интеллектуально развитых видов животных.

Исследователи из Калифорнийского университета в Лос-Анджелесе (UCLA) задались вопросом, действительно ли GPT-3 может рассуждать по аналогии. Для этого они выбрали задачи, с которыми модель точно не встречалась во время обучения.

Ученые адаптировали для работающего с текстом искусственного интеллекта проверенные временем карточки теста стандартными прогрессивными матрицами Рейвена.

GPT-3 прошел тест на интеллект — Пример задачи, построенной по принципу стандартных прогрессивных матриц Рейвена / © arXiv:2206.14187

Это серии изображений из девяти элементов, сгруппированных по три, с пропущенной девятой ячейкой. Испытуемому предлагается выбрать из нескольких вариантов ответа правильный. Фигуры имеют несколько свойств, которые в каждом ряду изменяются по набору правил. Чтобы ответить верно, нужно, глядя на первые два ряда, определить правила и, проведя аналогию, применить их к третьему ряду. На словах непросто, но визуально воспринимается легко (смотрите иллюстрацию). С каждым следующим заданием сложность возрастает.

Поскольку GPT-3 не мультимодальная модель, то есть умеет работать только с текстом, матрицы адаптировали, но принцип остался тот же. В качестве контрольной группы выступали учащиеся колледжа UCLA. И они проиграли искусственному интеллекту.

Студенты дали чуть менее 60 процентов правильных ответов (нормальный уровень), GPT-3 — 80 процентов (больше среднего для людей, но в рамках нормы). Как отметили авторы исследования, алгоритм совершал те же ошибки, что и человек. Иными словами, высока вероятность, что процесс принятия решений был очень похожим.

В дополнение к матрицам Рейвена исследователи дали алгоритму задачи из стандартизированного теста для приема в высшие учебные заведения США (SAT). Большая часть его вариантов никогда не публиковалась в открытом доступе, так что GPT-3, скорее всего, с ними тоже не знаком.

Модель показала высокие результаты (наравне или лучше контрольной группы людей) в заданиях вида «„любовь“ для „ненависти“ — то же, что „богатство“ для этого слова, какого?» (правильный ответ — «бедности»). Таким образом, алгоритм должен был понять, что от него требуется найти в этом случае антоним, без прямого указания на то.

Ожидаемо GPT-3 хорошо решил и более трудные вопросы, в которых аналогии нужно было провести между целыми предложениями или абзацами. А вот где модель предсказуемо села в лужу, так это в задачах на пространственное мышление.

Даже если подробно описать проблему вроде «чем лучше переложить жевательные конфеты из одной миски в другую — трубкой, ножницами или лентой», алгоритм предлагал бессмысленные тексты в ответ.

Проведенное американскими психологами исследование на новом уровне поднимает вопрос: имитируют ли большие языковые модели ряд аспектов человеческого мышления, либо перед нами совершенно новый тип мышления? Во втором случае сама собой напрашивается аналогия со знаменитым философским концептом «призрака в машине». По одной из его интерпретаций, достаточно сложноустроенная искусственная система (машина) может обретать новые непредвиденные свойства, которые со стороны будут неотличимы от человеческого сознания.

У научной работы есть два существенных ограничения, на которые ее авторы справедливо указывают. В первую очередь, несмотря на старания исследователей, нет никаких гарантий, что GPT-3 во время обучения сталкивался с задачами, похожими на вышеописанные. Наименее вероятно, что модель тренировали на текстовых представлениях прогрессивных матриц Рейвена. Наиболее — что какие-то варианты SAT могли встречаться в наборе данных для обучения.

Из этого вытекает вторая проблема: ученые не обладают доступом к «внутренностям» модели, из-за чего процессы ее «мышления» представляют собой черный ящик. А это сдерживает нейронауки в развитии.

Научная статья с подробным описанием исследования опубликована в журнале Nature Human Behaviour. Ее препринт (неотрецензированная версия) размещен в открытом доступе на портале arXiv.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

mostly harmless Есть телега: https://t.me/tempest_exults

Технологии

# GPT-3

# ИИ

# искусственный интеллект

# логическое мышление

# нейросети

# США

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Почему мороженое кажется вкуснее: нейробиология удовольствия и иллюзии вкуса

ВДНХ

Москва

ВДНХ

Москва

Лекция

05 Июн

1000 ₽

Остеология. Методы обработки, техника безопасности, создание композиций

Medio Modo

Москва

Лекция

05 Июн

1700 ₽

Необычные симбиозы в живой природе

Medio Modo

Санкт-Петербург

Лекция

05 Июн

Бесплатно

Где рождается авиация: Сергей Алексеевич Чаплыгин и ЦАГИ

Библиотека им. Н. А. Некрасова

Москва

Лекция

06 Июн

Бесплатно

Что скрывают художники: психология в искусстве

ВДНХ

Москва

Беседа

06 Июн

Бесплатно

Сон за пределами Земли: что снится космонавтам

Космонавтика и авиация

Москва

ВДНХ

Москва

Беседа

06 Июн

Бесплатно

Факты и ИИллюзии: можно ли доверять нейросетям в вопросах медицины

ВДНХ

Москва

Популярное

За сутки

За неделю

За месяц

4 июня, 10:04

Максим Абдулаев

Полигамные птицы оказались более склонными к мастурбации по сравнению с моногамными

Брачная стратегия пернатых напрямую определяет их потребность в сексуальной разрядке. Британские биологи проанализировали поведение 120 видов птиц и выяснили, что животные без постоянного партнера прибегают к самоудовлетворению значительно чаще тех, кто образует крепкие пары. Исследование показало, что привычка тереться о ветки служит естественным эволюционным механизмом для сброса гормонального напряжения, а не патологическим следствием жизни в клетке: в дикой природе этот процесс происходит даже активнее, чем в зоопарках.

Биология

# поведение животных

# половое воздержание

# половое поведение

# попугаи

4 июня, 14:24

Марк Чернов

Биологи нашли ген «живи быстро, умри моложе»

Ученые проверили ключевую гипотезу эволюции. Согласно этой концепции, естественный отбор поддерживает гены, которые полезны в начале жизни, даже если в старости они приводят к тяжелым болезням и гибели.

Биология

# генетика

# естественный отбор

# продолжительность жизни

# эволюция

4 июня, 10:59

НИУ ВШЭ

Социологи выяснили, на какие группы делится российский средний класс

Российский средний класс нельзя считать единой и одинаково устойчивой социальной группой. За схожим уровнем доходов скрываются совершенно разные финансовые стратегии, образ жизни и степень стабильности. К такому выводу пришли социологи Высшей школы экономики.

НИУ ВШЭ

# население

# социально-экономическое положение

# социология

# экономика

31 мая, 11:48

Игорь Байдов

Во всем мире любить стали меньше

Исследователи опросили более 60 тысяч испытуемых из разных стран и выяснили: чем больше человек зациклен на себе, тем холоднее он к своему партнеру. Правда, снижение накала страстей не всегда плохо, у этого есть и положительные стороны.

Психология

# индивидуализм

# любовь

# мировоззрение

# общество

# чувства

# эгоизм

1 июня, 08:40

Любовь С.

Спутники Юпитера и Урана указали на «потерянную» планету

Около четырех миллиардов лет назад Солнечная система пребывала в хаосе: гигантские планеты сближались, меняли орбиты и выбрасывали своих соседей в межзвездное пространство. Хотя шансы на «выживание» лун Юпитера и Урана в этот период были крайне малы, астрономы показали, что их судьба может хранить следы древней катастрофы с участием «потерянной» планеты.

Астрономия

# планеты

# Солнечная система

# спутники Урана

# спутники Юпитера

# уран

# Юпитер

29 мая, 17:17

Александр Березин

Поверхность лун Юпитера и Сатурна оказалась экстремально пористой

Изучив данные о скорости изменения температур ледяных спутников пятой и шестой планеты системы, астрономы обнаружили, что она слишком высока для по-настоящему ледяной поверхности. Оказалось, что эти тела покрыты материалом, по своим свойствам резко отличающимся от земного льда.

Космонавтика

# космос

# спутники Сатурна

# спутники Юпитера

17 мая, 10:35

Игорь Байдов

В Гималаях людям и другим животным начал угрожать новый хищник

В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.

Биология

# бездомные животные

# волк

# волки

# Гималаи

# животные

# Индия

# собаки

25 мая, 14:00

Андрей Серегин

Правящие семьи в доколумбовом Перу веками практиковали браки между родственниками

В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.

Археология

# Анды

# брак между родственниками

# инки

# раскопки

17 мая, 10:00

Evgenia Vavilova

Физики разобрались, что нужно, чтобы человек видел в инфракрасном спектре

При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.

Физика

# ближний инфракрасный диапазон

# зрение

# лазер

# сетчатка глаза

# фотоны

[miniorange_social_login]

Я однозначно проиграю ей. В разгадыаании кубиков, кружёчков, треугольников, да хоть в ЕГЭ и подобном всём. Но если победитель окажется со мной в природе. Дикой. Разные встречи могут произойти. Дикая природа, животные, люди!!! Если произойдёт какой либо катаклизм,... Не факт, что этот персонаж выживет. И я смогу его спасти.

Ответить