• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку

Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

Инфографика: самые умные модели ИИ по данным теста на IQ

Искусственный интеллект создан, чтобы стать разумным. Но как современные ведущие модели ИИ выглядят с точки зрения теста на коэффициент интеллекта (IQ) и какие из них самые умные?

Инфографика: самые умные модели ИИ по данным теста на IQ / © visualcapitalist
Инфографика: самые умные модели ИИ по данным теста на IQ / © visualcapitalist

На опубликованной выше инфографике ранжированы самые умные модели ИИ на основе их результатов в тесте на IQ общества Менса. Тест Менса — это широко признанный и очень сложный экзамен на IQ для оценки человеческого интеллекта. Для сравнения: средний показатель IQ человека колеблется от 90 до 110, а показатель выше 130 обычно считается уровнем гениальности.

Возглавила список текстовая модель o3 компании OpenAI, набравшая 135 баллов в тесте Менса, что ставит ее в категорию «гениев». Как часть ChatGPT, она входит в число самых популярных в мире инструментов ИИ.  

Claude-4 Sonnet компании Anthropic и Gemini 2.0 Flash Thinking от Google идут следом с показателями 127 и 126 соответственно. Более того, новые итерации, такие как Gemini 2.5 Pro и OpenAI o4 mini, набрали более 120, что выше среднего человеческого диапазона IQ.

Пять худших моделей ИИ по баллам IQ — мультимодальные, способные читать и обрабатывать изображения. GPT-4o (Vision) от OpenAI и Grok-3 Think (Vision) от компании Илона Маска xAI показали результаты намного ниже среднего человеческого, набрав 63 и 60 баллов в тесте соответственно.

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Комментарии

9 Комментариев
Boris Babanov
4 недели назад
-
0
+
Но тест ARC-AGI 2, который все люди проходят, ни одна модель больше чем на 10% пока не прошла, и весьма вероятно не пройдет в этом году.
ViAr
4 недели назад
-
0
+
Не нашел в списке Алису с Марусей 🙂
Nadooshi CH
4 недели назад
-
0
+
Китайский qwen3 вне конкуренции. Ок. Продолжим им пользоваться. По мне все представленые модели, это обрубки с ограничением в 5к символов. Квен же работает с масштабом уже более 270 страниц художественного текста и выдаёт прекрасный результат. Да. Он требует редактор кой правки и иногда галлюционирует, но это не избежно при больших масштабах.
    Евгений Никольский
    4 недели назад
    -
    0
    +
    Nadooshi, Вась очнись , иди в документацию gemini и посмотри сколько там токенов контекстное окно, какие ещё 5к?? Квен вообще ни о чем по сравнению с gemini
    +
      ещё комментарии
      Nadooshi CH
      4 недели назад
      -
      0
      +
      Евгений, в каких странах этот хеморой доступен? Спасибо, что потратил моё время на изучение ничего.
      Nadooshi CH
      4 недели назад
      -
      0
      +
      Евгений, добрался я до гемини. Все то же ограничение в 50к символов.
        Nadooshi CH
        4 недели назад
        -
        0
        +
        Nadooshi, я ещё более углубился в это болото. Отвечает ещё более галлбционирующе. Требует множество уточнений. Много додумывает того, чего нет в тексте. Ужасно работает с готовыми персонажами. Анализ отвратительный. Пример: Сложный многогранный персонаж. Гримнайт - это монстр, гуманоид, не из обычного мира, а из междумирья. Разумный и способен к коммуникации. Он в процессе повествования умирает - изгоняется как демон, в междумирье. Гемини с какого-то перепугу решил что это какая то собака, которая рычит и лает в попытках общаться, а потом говорит и вся такая добрая.
      Nadooshi CH
      4 недели назад
      -
      0
      +
      Евгений, я ещё более углубился в это болото. Отвечает ещё более галлюционирующе. Требует множество уточнений. Много додумывает того, чего нет в тексте. Ужасно работает с готовыми персонажами. Анализ отвратительный. Пример: Сложный многогранный персонаж. Гримнайт - это монстр, гуманоид, не из обычного мира, а из междумирья. Разумный и способен к коммуникации. Он в процессе повествования умирает - изгоняется как демон, в междумирье. Гемини с какого-то перепугу решил что это какая то собака, которая рычит и лает в попытках общаться, а потом говорит и вся такая добрая.
Roman Frolov
4 недели назад
-
0
+
135 - "гений"? Какая глупость. Это 2.3 стандартных отклонения выше среднего по Европе, т.е. 1 человек из 200. Это не интеллектуальные гении. Таковыми можно считать людей с IQ от 150 (SD 15). А вообще, очень странно. Chat-gpt щелкает как орешки трудные задачки из тестов на интеллект, результат должен быть выше.
Предстоящие мероприятия
12 июля, 22:10
Редакция Naked Science

Лето 2025 обещает насыщенную линейку научно-фантастических сериалов на ведущих стриминговых платформах. От адаптаций культовых романов до масштабных космических одиссей — мы отобрали проекты, на которые стоит обратить внимание.

11 июля, 17:47
Денис Яковлев

Международная команда ученых оценила связь между длительностью физической активности, ее интенсивностью, риском смерти от всех причин и вероятностью развития сердечно-сосудистых и онкологических заболеваний.

11 июля, 12:37
Игорь Байдов

Наблюдения, проведенные космическим аппаратом NASA «Юнона», показали, что магнитное поле Юпитера и его мощная магнитосфера, заполненная ионизированным газом, могут порождать вблизи полюсов газового гиганта новый тип плазменных волн. Ничего подобного ранее ученые не фиксировали.

8 июля, 11:16
РНФ

Ученые предложили математический инструмент, позволяющий точно рассчитать условия стабильной работы систем фазовой автоподстройки частоты, используемых в устройствах связи и навигации. Такие системы синхронизируют параметры собственных сигналов устройства, например телефона, с поступающими на него сигналами, например, от Wi-Fi-роутера. Предложенный метод расчетов позволяет избежать неточностей, которые допускали ранее используемые подходы, и предлагает инженерам простые формулы, удобные для применения в реальных проектах. Это позволит предотвратить ошибки в работе приборов спутниковой навигации и беспроводной связи.

12 июля, 22:10
Редакция Naked Science

Лето 2025 обещает насыщенную линейку научно-фантастических сериалов на ведущих стриминговых платформах. От адаптаций культовых романов до масштабных космических одиссей — мы отобрали проекты, на которые стоит обратить внимание.

8 июля, 13:00
ПНИПУ

Лампочки, фонари и неоновые вывески окружают нас повсюду. Они добавляют красок городскому пространству, создают домашний уют, обеспечивают безопасность на дорогах, позволяя нам отчетливо видеть окружающий мир в любое время суток. Ученые Пермского Политеха рассказали о разнице между тепловыми, диодными, газоразрядными лампочками и их применении в быту.

17 июня, 16:49
Адель Романова

Радиотелескопы уловили очень короткий сигнал, и по его характеристикам стало ясно, что он не может быть естественного происхождения. Астрономы пришли к выводу, что источник находился в околоземном пространстве — там, где уже более полувека летает «мертвый» аппарат NASA.

25 июня, 15:19
ФизТех

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

2 июля, 11:17
Юлия Тарасова

Результаты эксперимента в США в будущем могут позволить добиться разрешения на использование отработанной конопли в качестве кормовой добавки в животноводстве.

[miniorange_social_login]
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно