• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку

Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

Самые продвинутые модели ИИ не справились с задачей для детей 

Большинство детей учатся определять время на циферблате часов в возрасте шести-семи лет, но искусственный интеллект, судя по всему, до сих пор не достиг этой вехи в своем развитии.

Часы на Спасской башне / © wikipedia / A.Savin
Часы на Спасской башне / © wikipedia / A.Savin

Исследователи из Эдинбургского университета в Шотландии обнаружили, что мультимодальные большие языковые модели (MLLM), которые могут обрабатывать текст и изображения, способны распознавать показания циферблатов часов лишь в 25 процентах случаев.

В статье, ожидающей рецензирования, специалисты протестировали различные конструкции часов, в том числе с римскими цифрами, с секундными стрелками и без них, а также с циферблатами разных цветов. Результаты показали, что системы ИИ от компаний Google, OpenAI, Anthropic и других определяли положение стрелок часов правильно менее чем в четверти случаев. Чаще всего ИИ выдавал ошибки, когда часы имели римские цифры или стилизованные стрелки.

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Комментарии

9 Комментариев
-
0
+
Просто у ии другой способ познания реальности, по этому эти системы ошибаются, если смогут объяснить саму концепцию времени и в каком положение находится стрелки то все заработает и не важно какие там цифры и есть ли они там есть
Mr. K
23.03.2025
-
0
+
Да, реально, сначала не поверил, а потом как сделал 3 опыта понял, что он либо приблизительно даёт, либо угадывает
    -
    0
    +
    Mr., я сначала взял Грок - как бы самый самый считается, он распознал римские числа - но не справился со стрелками! The clock in the image shows the time with Roman numerals. The hour hand is pointing at "VII" (7), and the minute hand is pointing at "XII" (12), which represents the start of the hour. Therefore, the time on the clock is 7:00. This clock is part of the Spasskaya Tower in the Kremlin, Moscow, Russia, a well-known landmark. The Spasskaya Tower clock is one of the most iconic clocks in Russia and is often associated with the Kremlin's chimes, which have historical and cultural significance. А вот ChatGPT смог From the image, the clock shows the time as 11:24. The hour hand is pointing slightly past 11. The minute hand is pointing at 24 minutes past the hour.
    +
      ещё комментарии
      Mr. K
      23.03.2025
      -
      1
      +
      +, у меня подписка на ChatGPT, но он не смог🫤
        -
        0
        +
        Mr., в таком случае, конечно, интерсна последовательность действий. Подписки у меня нет, я через обычный гугл аккаунт логинюсь - но логинится надо, так как ChatGPT не хочет работать с картинкой через интернет адрес. Потом картинку через Upload загружаю и пишу в ChatGPT: You get an image uploaded. What time is it on the picture? В этот раз результат на минуту отличается The clock in the image shows the time as 11:25. The hour hand is pointing slightly past 11, and the minute hand is pointing at 25 minutes. Модель 4o. Да, даже секундную стрелку распознаёт.
Alex I
23.03.2025
-
0
+
Ха-ха, вы у нынешних школьников такой тест проведите, там сильно меньше 25% будет результат.
    -
    0
    +
    Alex, Если я правильно понял, речь о том, что ИИ не может решить задачу даже через жульничество, которым владеет любой школьник (ну то есть ты можешь и не знать римские цифры, тут надо просто вспомнить архитекруру циферблата и сопоставить с положением стрелок. ИИ оказывается для таких творческих задач надо обучать отдельно, он не может в "творческий подход к задаче").
-
0
+
Да, я поддтверждаю, лажает... Therefore, the time shown on the clock is 2:00. С другой стороны, возможно ИИ находится в ином гравитационном поле и уже учёл разницу 😦
-
0
+
Странно, очень странно. Может быть они, ИИ, слишком "общего пользования", и вы не правильно спрашиваете - попробуйте на машинном, типа "посмотри на вот эту картинку, стрелки на картинке показывают время, болшая минуты, маленькая часы и скажи мне сколько... да я щас сам задам, доступ то свободный...
Предстоящие мероприятия
10 марта, 14:47
ФизТех

Коллектив климатологов из Института географии РАН, Института физики атмосферы имени А. М. Обухова РАН и МФТИ разобрал одну из самых загадочных страниц климатической летописи: почему Арктика так резко потеплела в первой половине XX века, причем особенно сильно зимой. Ученые оценили, какую долю в тех температурных скачках могли сыграть «внутренние ритмы» атмосферы и океана Северного полушария и почему ответ меняется в зависимости от того, как именно отделять естественные колебания климата от внешних факторов вроде роста парниковых газов и загрязнения воздуха аэрозолями.

11 марта, 09:09
Татьяна Зайцева

Работа международной команды ученых позволила увидеть, как выглядело лицо знаменитого австралопитека по прозвищу Литтл Фут (Маленькая Стопа) — одного из наших древнейших предков, жившего в Южной Африке более 3,5 миллиона лет назад. Его скелет — самый полный из всех скелетов австралопитеков, когда-либо обнаруженных.

11 марта, 07:55
Игорь Байдов

Уже давно в социальных сетях распространяются видеоролики с воющими под музыку собаками. Одни воспринимают такое поведение как случайную реакцию на звук, другие полагают, что за этим скрываются вокальные способности, которые, возможно, собаки унаследовали от своих предков — древних волков. Команда ученых из США решила проверить, действительно ли домашние питомцы различают высоту звука и пытаются подстроить под нее свой голос, или же это просто совпадение, своего рода инстинктивный отклик на мелодию без всякой «музыкальности».

5 марта, 08:10
Александр Березин

Одна сторона сыплет более дорогими и сложными баллистическими ракетами, другая — относительно дешевыми крылатыми. Но при этом первая на порядок беднее второй. А что у них с технологическим уровнем для наземной войны, и почему, кстати, глава второй избегает даже самого этого слова? Попробуем разобраться в реальных возможностях военных машин сторон потенциально самого опасного конфликта 2026 года.

6 марта, 16:13
Губкинский университет

Запасы лития в России требуют переоценки и могут оказаться в разы выше, чем считалось до 2025 года. Об этом говорится в исследовании «Состояние ресурсной базы критически важных металлов и элементов для развития современных технологий», подготовленном учеными РГУ нефти и газа (НИУ) имени И.М. Губкина.

6 марта, 13:26
ФизТех

Российские ученые из МФТИ с коллегами из Института прикладной математики им. М. В. Келдыша РАН и Института физики Земли им. О.Ю. Шмидта РАН разработали инновационный метод для расчета равновесного распределения несмешивающихся жидкостей в пористой среде. Результаты применения этого метода можно использовать в разработках по повышению нефтеотдачи и гидрологии, а также геологического СО2-хранения.

12 февраля, 07:52
Адель Романова

Астрономы недавно проанализировали базу данных о падающих на Землю объектах и пришли к выводу, что два из них прибыли из межзвездного пространства. Известна не только дата, но и место падения каждого из них.

3 марта, 14:06
Александр Березин

В ноябре 2025 года при взлете российской ракеты с Байконура к МКС с существенной высоты упала кабина обслуживания 8У216. Поскольку в 2010-х годах из экономии средств у нас отказались от дублирования стартовых площадок, это создало ситуацию временной невозможности пилотируемых полетов. Теперь, всего через три месяца после происшествия, «Роскосмос» смог решить проблему, поставив запасную кабину обслуживания, найденную на складах Минобороны. Весенние пуски к МКС, запланированные ранее, теперь имеют шансы пройти в срок.

12 февраля, 08:19
Полина Меньшова

«Любить лишь можно только раз», — писал поэт Сергей Есенин, а герои культовых сериалов приходили к выводу, что «настоящая» влюбленность случается в жизни максимум дважды. Однако ни один из этих тезисов не подкреплен научными данными. Американские исследователи подошли к вопросу иначе: опросили более 10 тысяч человек и вывели среднее число сильных влюбленностей, возможных в течение жизни.

[miniorange_social_login]
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно