• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку

Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

Инфографика: самые умные модели ИИ по данным теста на IQ

Искусственный интеллект создан, чтобы стать разумным. Но как современные ведущие модели ИИ выглядят с точки зрения теста на коэффициент интеллекта (IQ) и какие из них самые умные?

Инфографика: самые умные модели ИИ по данным теста на IQ / © visualcapitalist
Инфографика: самые умные модели ИИ по данным теста на IQ / © visualcapitalist

На опубликованной выше инфографике ранжированы самые умные модели ИИ на основе их результатов в тесте на IQ общества Менса. Тест Менса — это широко признанный и очень сложный экзамен на IQ для оценки человеческого интеллекта. Для сравнения: средний показатель IQ человека колеблется от 90 до 110, а показатель выше 130 обычно считается уровнем гениальности.

Возглавила список текстовая модель o3 компании OpenAI, набравшая 135 баллов в тесте Менса, что ставит ее в категорию «гениев». Как часть ChatGPT, она входит в число самых популярных в мире инструментов ИИ.  

Claude-4 Sonnet компании Anthropic и Gemini 2.0 Flash Thinking от Google идут следом с показателями 127 и 126 соответственно. Более того, новые итерации, такие как Gemini 2.5 Pro и OpenAI o4 mini, набрали более 120, что выше среднего человеческого диапазона IQ.

Пять худших моделей ИИ по баллам IQ — мультимодальные, способные читать и обрабатывать изображения. GPT-4o (Vision) от OpenAI и Grok-3 Think (Vision) от компании Илона Маска xAI показали результаты намного ниже среднего человеческого, набрав 63 и 60 баллов в тесте соответственно.

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Комментарии

10 Комментариев
Boris Babanov
17.06.2025
-
0
+
Но тест ARC-AGI 2, который все люди проходят, ни одна модель больше чем на 10% пока не прошла, и весьма вероятно не пройдет в этом году.
ViAr
17.06.2025
-
0
+
Не нашел в списке Алису с Марусей 🙂
Nadooshi CH
16.06.2025
-
0
+
Китайский qwen3 вне конкуренции. Ок. Продолжим им пользоваться. По мне все представленые модели, это обрубки с ограничением в 5к символов. Квен же работает с масштабом уже более 270 страниц художественного текста и выдаёт прекрасный результат. Да. Он требует редактор кой правки и иногда галлюционирует, но это не избежно при больших масштабах.
    Nadooshi, Вась очнись , иди в документацию gemini и посмотри сколько там токенов контекстное окно, какие ещё 5к?? Квен вообще ни о чем по сравнению с gemini
    +
      ещё комментарии
      Nadooshi CH
      16.06.2025
      -
      0
      +
      Евгений, в каких странах этот хеморой доступен? Спасибо, что потратил моё время на изучение ничего.
      Nadooshi CH
      16.06.2025
      -
      0
      +
      Евгений, добрался я до гемини. Все то же ограничение в 50к символов.
        Nadooshi CH
        16.06.2025
        -
        0
        +
        Nadooshi, я ещё более углубился в это болото. Отвечает ещё более галлбционирующе. Требует множество уточнений. Много додумывает того, чего нет в тексте. Ужасно работает с готовыми персонажами. Анализ отвратительный. Пример: Сложный многогранный персонаж. Гримнайт - это монстр, гуманоид, не из обычного мира, а из междумирья. Разумный и способен к коммуникации. Он в процессе повествования умирает - изгоняется как демон, в междумирье. Гемини с какого-то перепугу решил что это какая то собака, которая рычит и лает в попытках общаться, а потом говорит и вся такая добрая.
      Nadooshi CH
      16.06.2025
      -
      0
      +
      Евгений, я ещё более углубился в это болото. Отвечает ещё более галлюционирующе. Требует множество уточнений. Много додумывает того, чего нет в тексте. Ужасно работает с готовыми персонажами. Анализ отвратительный. Пример: Сложный многогранный персонаж. Гримнайт - это монстр, гуманоид, не из обычного мира, а из междумирья. Разумный и способен к коммуникации. Он в процессе повествования умирает - изгоняется как демон, в междумирье. Гемини с какого-то перепугу решил что это какая то собака, которая рычит и лает в попытках общаться, а потом говорит и вся такая добрая.
Roman Frolov
15.06.2025
-
0
+
135 - "гений"? Какая глупость. Это 2.3 стандартных отклонения выше среднего по Европе, т.е. 1 человек из 200. Это не интеллектуальные гении. Таковыми можно считать людей с IQ от 150 (SD 15). А вообще, очень странно. Chat-gpt щелкает как орешки трудные задачки из тестов на интеллект, результат должен быть выше.
Предстоящие мероприятия
3 июля, 14:55
ФизТех

Нейроморфные вычисления — это попытка скопировать принцип работы мозга: не последовательно выполнять команды, как обычный процессор, а обрабатывать информацию параллельно, через сеть взаимосвязанных «нейронов», которые активируются в зависимости от поступающих сигналов. Эта идея существует уже несколько десятилетий, но до недавнего времени ее реализовывали на обычной электронной элементной базе. Исследователи из МФТИ провели обширный обзор, в котором систематизировали последние достижения в области фотонных нейроморфных вычислений.

4 июля, 09:30
Любовь С.

Анализ более 150 тысяч древних звезд Млечного Пути показал, что возраст космоса, судя по всему, близок к 13,8 миллиарда лет. Авторы нового исследования заключили, что сценарии, в которых Вселенную приходится делать заметно «моложе» ради решения хаббловского кризиса, плохо согласуются с наблюдениями. Это важно, поскольку возраст старейших светил — один из немногих независимых способов проверить космологические модели не по данным ранней Вселенной, а по объектам нашей собственной Галактики.

4 июля, 17:28
Evgenia Vavilova

Мы много знаем о том, как цивилизации до нас строили дома и дороги, но с объектами материальной культуры дела обстоят сложнее. Ремесленные техники часто хранились в строгом секрете и могли быть случайно утрачены при неудачном стечении обстоятельств. Так случилось с ювелирной техникой цзинь чжэ сы.

28 июня, 15:51
Александр Березин

На протяжении десятилетий Тель-Авив воздерживался от этого шага, чтобы не испортить отношения с Турцией. Но после действий Израиля 2023-2026 годов официальная Анкара, как и множество государств мира, неоднократно осуждала Израиль, из-за чего изменилась и его позиция по геноциду.

29 июня, 15:46
Марк Чернов

Масштабный анализ ДНК показал, что леопарды в Капской области ЮАР измельчали не из-за случайных мутаций при вырождении популяции, а в результате целенаправленной эволюционной адаптации к местной среде обитания.

29 июня, 15:40
ФизТех

Физтехи предложили аналитический способ описания передачи энергии от ультракороткого лазерного импульса к квантовому осциллятору, находящемуся в тепловом равновесии. Эта модель показывает, как сверхкороткие вспышки света возбуждают микроскопические системы — молекулы, кристаллы, плазмоны, фотоны и электронные центры в веществе. Это важно для разработки методов сверхбыстрого управления веществом, генерации терагерцового излучения и подбора оптимальных параметров лазерных импульсов для возбуждения заданных состояний материала.

10 июня, 11:51
Александр Березин

Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.

25 июня, 16:20
Любовь С.

Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.

25 июня, 15:09
Марк Чернов

Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.

[miniorange_social_login]