• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку

Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

Самые продвинутые модели ИИ не справились с задачей для детей 

Большинство детей учатся определять время на циферблате часов в возрасте шести-семи лет, но искусственный интеллект, судя по всему, до сих пор не достиг этой вехи в своем развитии.

Часы на Спасской башне / © wikipedia / A.Savin
Часы на Спасской башне / © wikipedia / A.Savin

Исследователи из Эдинбургского университета в Шотландии обнаружили, что мультимодальные большие языковые модели (MLLM), которые могут обрабатывать текст и изображения, способны распознавать показания циферблатов часов лишь в 25 процентах случаев.

В статье, ожидающей рецензирования, специалисты протестировали различные конструкции часов, в том числе с римскими цифрами, с секундными стрелками и без них, а также с циферблатами разных цветов. Результаты показали, что системы ИИ от компаний Google, OpenAI, Anthropic и других определяли положение стрелок часов правильно менее чем в четверти случаев. Чаще всего ИИ выдавал ошибки, когда часы имели римские цифры или стилизованные стрелки.

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Комментарии

9 Комментариев
-
0
+
Просто у ии другой способ познания реальности, по этому эти системы ошибаются, если смогут объяснить саму концепцию времени и в каком положение находится стрелки то все заработает и не важно какие там цифры и есть ли они там есть
Mr. K
23.03.2025
-
0
+
Да, реально, сначала не поверил, а потом как сделал 3 опыта понял, что он либо приблизительно даёт, либо угадывает
    -
    0
    +
    Mr., я сначала взял Грок - как бы самый самый считается, он распознал римские числа - но не справился со стрелками! The clock in the image shows the time with Roman numerals. The hour hand is pointing at "VII" (7), and the minute hand is pointing at "XII" (12), which represents the start of the hour. Therefore, the time on the clock is 7:00. This clock is part of the Spasskaya Tower in the Kremlin, Moscow, Russia, a well-known landmark. The Spasskaya Tower clock is one of the most iconic clocks in Russia and is often associated with the Kremlin's chimes, which have historical and cultural significance. А вот ChatGPT смог From the image, the clock shows the time as 11:24. The hour hand is pointing slightly past 11. The minute hand is pointing at 24 minutes past the hour.
    +
      ещё комментарии
      Mr. K
      23.03.2025
      -
      1
      +
      +, у меня подписка на ChatGPT, но он не смог🫤
        -
        0
        +
        Mr., в таком случае, конечно, интерсна последовательность действий. Подписки у меня нет, я через обычный гугл аккаунт логинюсь - но логинится надо, так как ChatGPT не хочет работать с картинкой через интернет адрес. Потом картинку через Upload загружаю и пишу в ChatGPT: You get an image uploaded. What time is it on the picture? В этот раз результат на минуту отличается The clock in the image shows the time as 11:25. The hour hand is pointing slightly past 11, and the minute hand is pointing at 25 minutes. Модель 4o. Да, даже секундную стрелку распознаёт.
Alex I
23.03.2025
-
0
+
Ха-ха, вы у нынешних школьников такой тест проведите, там сильно меньше 25% будет результат.
    -
    0
    +
    Alex, Если я правильно понял, речь о том, что ИИ не может решить задачу даже через жульничество, которым владеет любой школьник (ну то есть ты можешь и не знать римские цифры, тут надо просто вспомнить архитекруру циферблата и сопоставить с положением стрелок. ИИ оказывается для таких творческих задач надо обучать отдельно, он не может в "творческий подход к задаче").
-
0
+
Да, я поддтверждаю, лажает... Therefore, the time shown on the clock is 2:00. С другой стороны, возможно ИИ находится в ином гравитационном поле и уже учёл разницу 😦
-
0
+
Странно, очень странно. Может быть они, ИИ, слишком "общего пользования", и вы не правильно спрашиваете - попробуйте на машинном, типа "посмотри на вот эту картинку, стрелки на картинке показывают время, болшая минуты, маленькая часы и скажи мне сколько... да я щас сам задам, доступ то свободный...
Предстоящие мероприятия
4 июля, 09:30
Любовь С.

Анализ более 150 тысяч древних звезд Млечного Пути показал, что возраст космоса, судя по всему, близок к 13,8 миллиарда лет. Авторы нового исследования заключили, что сценарии, в которых Вселенную приходится делать заметно «моложе» ради решения хаббловского кризиса, плохо согласуются с наблюдениями. Это важно, поскольку возраст старейших светил — один из немногих независимых способов проверить космологические модели не по данным ранней Вселенной, а по объектам нашей собственной Галактики.

4 июля, 17:28
Evgenia Vavilova

Мы много знаем о том, как цивилизации до нас строили дома и дороги, но с объектами материальной культуры дела обстоят сложнее. Ремесленные техники часто хранились в строгом секрете и могли быть случайно утрачены при неудачном стечении обстоятельств. Так случилось с ювелирной техникой цзинь чжэ сы.

5 июля, 11:05
Марк Чернов

Новая находка доказывает, что эволюция изобрела как минимум два независимых способа бороться с вирусами. Это открытие кардинально меняет представления о развитии иммунитета и расширяет горизонты для поиска новых лекарств.

4 июля, 09:30
Любовь С.

Анализ более 150 тысяч древних звезд Млечного Пути показал, что возраст космоса, судя по всему, близок к 13,8 миллиарда лет. Авторы нового исследования заключили, что сценарии, в которых Вселенную приходится делать заметно «моложе» ради решения хаббловского кризиса, плохо согласуются с наблюдениями. Это важно, поскольку возраст старейших светил — один из немногих независимых способов проверить космологические модели не по данным ранней Вселенной, а по объектам нашей собственной Галактики.

1 июля, 08:40
Марк Чернов

В вакууме космоса два металлических предмета, прижатые друг к другу, могут спонтанно свариться без какого-либо нагрева. Из-за отсутствия кислорода на поверхностях деталей разрушается защитный слой, в результате чего свободные электроны начинают мгновенно перемещаться между ними и соединяют два элемента в один монолит.

4 июля, 17:28
Evgenia Vavilova

Мы много знаем о том, как цивилизации до нас строили дома и дороги, но с объектами материальной культуры дела обстоят сложнее. Ремесленные техники часто хранились в строгом секрете и могли быть случайно утрачены при неудачном стечении обстоятельств. Так случилось с ювелирной техникой цзинь чжэ сы.

10 июня, 11:51
Александр Березин

Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.

25 июня, 16:20
Любовь С.

Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.

25 июня, 15:09
Марк Чернов

Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.

[miniorange_social_login]