• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку

Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

Самые продвинутые модели ИИ не справились с задачей для детей 

Большинство детей учатся определять время на циферблате часов в возрасте шести-семи лет, но искусственный интеллект, судя по всему, до сих пор не достиг этой вехи в своем развитии.

Часы на Спасской башне / © wikipedia / A.Savin
Часы на Спасской башне / © wikipedia / A.Savin

Исследователи из Эдинбургского университета в Шотландии обнаружили, что мультимодальные большие языковые модели (MLLM), которые могут обрабатывать текст и изображения, способны распознавать показания циферблатов часов лишь в 25 процентах случаев.

В статье, ожидающей рецензирования, специалисты протестировали различные конструкции часов, в том числе с римскими цифрами, с секундными стрелками и без них, а также с циферблатами разных цветов. Результаты показали, что системы ИИ от компаний Google, OpenAI, Anthropic и других определяли положение стрелок часов правильно менее чем в четверти случаев. Чаще всего ИИ выдавал ошибки, когда часы имели римские цифры или стилизованные стрелки.

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Комментарии

9 Комментариев
-
0
+
Просто у ии другой способ познания реальности, по этому эти системы ошибаются, если смогут объяснить саму концепцию времени и в каком положение находится стрелки то все заработает и не важно какие там цифры и есть ли они там есть
Mr. K
23.03.2025
-
0
+
Да, реально, сначала не поверил, а потом как сделал 3 опыта понял, что он либо приблизительно даёт, либо угадывает
    -
    0
    +
    Mr., я сначала взял Грок - как бы самый самый считается, он распознал римские числа - но не справился со стрелками! The clock in the image shows the time with Roman numerals. The hour hand is pointing at "VII" (7), and the minute hand is pointing at "XII" (12), which represents the start of the hour. Therefore, the time on the clock is 7:00. This clock is part of the Spasskaya Tower in the Kremlin, Moscow, Russia, a well-known landmark. The Spasskaya Tower clock is one of the most iconic clocks in Russia and is often associated with the Kremlin's chimes, which have historical and cultural significance. А вот ChatGPT смог From the image, the clock shows the time as 11:24. The hour hand is pointing slightly past 11. The minute hand is pointing at 24 minutes past the hour.
    +
      ещё комментарии
      Mr. K
      23.03.2025
      -
      1
      +
      +, у меня подписка на ChatGPT, но он не смог🫤
        -
        0
        +
        Mr., в таком случае, конечно, интерсна последовательность действий. Подписки у меня нет, я через обычный гугл аккаунт логинюсь - но логинится надо, так как ChatGPT не хочет работать с картинкой через интернет адрес. Потом картинку через Upload загружаю и пишу в ChatGPT: You get an image uploaded. What time is it on the picture? В этот раз результат на минуту отличается The clock in the image shows the time as 11:25. The hour hand is pointing slightly past 11, and the minute hand is pointing at 25 minutes. Модель 4o. Да, даже секундную стрелку распознаёт.
Alex I
23.03.2025
-
0
+
Ха-ха, вы у нынешних школьников такой тест проведите, там сильно меньше 25% будет результат.
    -
    0
    +
    Alex, Если я правильно понял, речь о том, что ИИ не может решить задачу даже через жульничество, которым владеет любой школьник (ну то есть ты можешь и не знать римские цифры, тут надо просто вспомнить архитекруру циферблата и сопоставить с положением стрелок. ИИ оказывается для таких творческих задач надо обучать отдельно, он не может в "творческий подход к задаче").
-
0
+
Да, я поддтверждаю, лажает... Therefore, the time shown on the clock is 2:00. С другой стороны, возможно ИИ находится в ином гравитационном поле и уже учёл разницу 😦
-
0
+
Странно, очень странно. Может быть они, ИИ, слишком "общего пользования", и вы не правильно спрашиваете - попробуйте на машинном, типа "посмотри на вот эту картинку, стрелки на картинке показывают время, болшая минуты, маленькая часы и скажи мне сколько... да я щас сам задам, доступ то свободный...
26 декабря, 15:47
Максим Абдулаев

Биологи опровергли представление о примитивности органов чувств у древнейших бесчелюстных, обнаружив у миксин огромный арсенал рецепторов для поиска добычи. Исследователи доказали, что способность различать сложные запахи и аминокислоты появилась у общего предка позвоночных задолго до возникновения челюстей.

27 декабря, 17:46
Адель Романова

После открытия объекта 3I/ATLAS предполагалось, что ядро межзвездной кометы могло иметь гигантские размеры. Но в процессе дальнейших наблюдений выяснилось, что эти оценки были явно завышены. Недавние расчеты показали, что на самом деле 3I/ATLAS по размерам соответствует среднестатистическим или даже самым компактным кометам Солнечной системы.

28 декабря, 16:21
Александр Березин

В 16.18 по московскому времени 28 декабря 2025 года с единственного гражданского космодрома на территории России произошел 17-й по счету космический запуск этого года. Перед ним на космодроме побывал корреспондент нашего издания, и вскоре мы выпустим репортаж о том, чем живет самый холодный космодром в мире.

24 декабря, 11:36
ПНИПУ

В России существуют тысячи рабочих мест с вредными и опасными условиями труда. На шахтах, металлургических заводах, в авиастроении люди годами находятся в условиях сильного шума, вибрации, запыленности и контакта с химикатами, что наносит серьезный ущерб здоровью. Однако существующие методы оценки рисков оказываются неэффективными для прогнозирования заболеваний, поскольку работают с усредненными показателями группы, а обязательные медосмотры определяют уже наступившую болезнь. Такая система лечит последствия, но не предотвращает причину. Ученые Пермского Политеха, управления Роспотребнадзора и ФНЦ медико-профилактических технологий управления рисками здоровью населения разработали программу, которая прогнозирует индивидуальные профессиональные риски здоровью для каждого конкретного работника с точностью 89%.

23 декабря, 10:17
Максим Абдулаев

Группа исследователей опровергла классическую теорию о случайности вымирания видов на примере морских хищников. Анализ эволюции акул и скатов за последние 145 миллионов лет показал, что риск исчезновения вида напрямую зависит от времени его существования: «новички» погибают гораздо чаще, чем эволюционные долгожители. Кроме того, ученые установили, что знаменитый астероид, погубивший динозавров, нанес океану не такой сильный удар, как последующее изменение климата.

25 декабря, 09:49
Максим Абдулаев

Ученые выяснили, что специфический вариант гена fruitless (fru) управляет социальным поведением самцов медоносной пчелы, заставляя их активно участвовать в коллективном обмене пищей и правильно выбирать место в колонии.

8 декабря, 13:09
Александр Березин

С 2010-х в «Роскосмосе» говорили: будущая РОС сможет пролетать над полюсом, что даст ей возможности для новых научных экспериментов. Но вскоре после того, как в ноябре 2025 года Россия временно лишилась возможности запускать людей в космос, эта позиция изменилась. В результате запускать космонавтов с космодромов нашей страны станет довольно сложно.

17 декабря, 14:19
Игорь Байдов

На скалистых берегах аргентинской Патагонии разворачивается настоящая драма. Магеллановы пингвины, долгое время чувствовавшие себя в безопасности на суше в своих многотысячных колониях, столкнулись с новым и беспощадным врагом. Их извечные морские страхи — касатки и морские леопарды — теперь блекнут перед угрозой, пришедшей из глубины материка. Виновник переполоха — грациозный и мощный хищник, недавно вернувшийся на эти земли после долгого изгнания.

29 ноября, 12:42
Александр Березин

Позавчера, 27 ноября 2025 года, при запуске космонавтов к МКС на стартовую площадку № 31 упала кабина обслуживания стартового комплекса. Это означает, что новые пуски оттуда до починки невозможны. К сожалению, в 2010-х годах, в рамках «оптимизации» расходов, резервную площадку (с которой летал Юрий Гагарин) упразднили. Поэтому случилось беспрецедентное: в XXI веке страна с пилотируемой космической программой осталась без средств запуска людей на орбиту. Пока ремонт не закончится, проблема сохранится. Чем это может грозить?

[miniorange_social_login]
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно