Хотите получать важные новости науки?
Подписаться
  • Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку

Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

Самые продвинутые модели ИИ не справились с задачей для детей 

Большинство детей учатся определять время на циферблате часов в возрасте шести-семи лет, но искусственный интеллект, судя по всему, до сих пор не достиг этой вехи в своем развитии.

Часы на Спасской башне / © wikipedia / A.Savin
Часы на Спасской башне / © wikipedia / A.Savin

Исследователи из Эдинбургского университета в Шотландии обнаружили, что мультимодальные большие языковые модели (MLLM), которые могут обрабатывать текст и изображения, способны распознавать показания циферблатов часов лишь в 25 процентах случаев.

В статье, ожидающей рецензирования, специалисты протестировали различные конструкции часов, в том числе с римскими цифрами, с секундными стрелками и без них, а также с циферблатами разных цветов. Результаты показали, что системы ИИ от компаний Google, OpenAI, Anthropic и других определяли положение стрелок часов правильно менее чем в четверти случаев. Чаще всего ИИ выдавал ошибки, когда часы имели римские цифры или стилизованные стрелки.

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Комментарии

9 Комментариев
-
0
+
Просто у ии другой способ познания реальности, по этому эти системы ошибаются, если смогут объяснить саму концепцию времени и в каком положение находится стрелки то все заработает и не важно какие там цифры и есть ли они там есть
Mr. K
23.03.2025
-
0
+
Да, реально, сначала не поверил, а потом как сделал 3 опыта понял, что он либо приблизительно даёт, либо угадывает
    -
    0
    +
    Mr., я сначала взял Грок - как бы самый самый считается, он распознал римские числа - но не справился со стрелками! The clock in the image shows the time with Roman numerals. The hour hand is pointing at "VII" (7), and the minute hand is pointing at "XII" (12), which represents the start of the hour. Therefore, the time on the clock is 7:00. This clock is part of the Spasskaya Tower in the Kremlin, Moscow, Russia, a well-known landmark. The Spasskaya Tower clock is one of the most iconic clocks in Russia and is often associated with the Kremlin's chimes, which have historical and cultural significance. А вот ChatGPT смог From the image, the clock shows the time as 11:24. The hour hand is pointing slightly past 11. The minute hand is pointing at 24 minutes past the hour.
    +
      ещё комментарии
      Mr. K
      23.03.2025
      -
      1
      +
      +, у меня подписка на ChatGPT, но он не смог🫤
        -
        0
        +
        Mr., в таком случае, конечно, интерсна последовательность действий. Подписки у меня нет, я через обычный гугл аккаунт логинюсь - но логинится надо, так как ChatGPT не хочет работать с картинкой через интернет адрес. Потом картинку через Upload загружаю и пишу в ChatGPT: You get an image uploaded. What time is it on the picture? В этот раз результат на минуту отличается The clock in the image shows the time as 11:25. The hour hand is pointing slightly past 11, and the minute hand is pointing at 25 minutes. Модель 4o. Да, даже секундную стрелку распознаёт.
Alex I
23.03.2025
-
0
+
Ха-ха, вы у нынешних школьников такой тест проведите, там сильно меньше 25% будет результат.
    -
    0
    +
    Alex, Если я правильно понял, речь о том, что ИИ не может решить задачу даже через жульничество, которым владеет любой школьник (ну то есть ты можешь и не знать римские цифры, тут надо просто вспомнить архитекруру циферблата и сопоставить с положением стрелок. ИИ оказывается для таких творческих задач надо обучать отдельно, он не может в "творческий подход к задаче").
-
0
+
Да, я поддтверждаю, лажает... Therefore, the time shown on the clock is 2:00. С другой стороны, возможно ИИ находится в ином гравитационном поле и уже учёл разницу 😦
-
0
+
Странно, очень странно. Может быть они, ИИ, слишком "общего пользования", и вы не правильно спрашиваете - попробуйте на машинном, типа "посмотри на вот эту картинку, стрелки на картинке показывают время, болшая минуты, маленькая часы и скажи мне сколько... да я щас сам задам, доступ то свободный...
28 июня
Игорь Байдов

За последние 30 лет размер трески, обитающей в Балтийском море, значительно уменьшился. Если раньше рыбаки вылавливали из воды особей размером с маленького ребенка, то теперь добытая рыба легко помещается в ладонях. Авторы нового исследования винят в этом человека, который заставил один из видов эволюционировать в «карликов».

Позавчера, 17:23
Людмила Соколова

Чтобы понять, как часто за пределами Солнечной системы встречаются миры, похожие на Землю, ученые из Калифорнийского университета (США) провели статистический анализ 517 экзопланет. Результаты показали, что всего три мира, включая наш, соответствуют критериям потенциальной обитаемости. Наиболее перспективными из них оказались Kepler-22b и Kepler-538b.

Позавчера, 11:35
Игорь Байдов

Команда исследователей из Италии и США предложила два способа, с помощью которых гипотетический зонд сможет быстро добраться до одного из самых отдаленных и малоизученных объектов Солнечной системы. Речь о Седне — транснептуновом теле, которое находится за орбитой Плутона. По мнению инженеров, эти передовые технологии смогут доставить аппарат к Седне за семь и 10 лет.

28 июня
Игорь Байдов

За последние 30 лет размер трески, обитающей в Балтийском море, значительно уменьшился. Если раньше рыбаки вылавливали из воды особей размером с маленького ребенка, то теперь добытая рыба легко помещается в ладонях. Авторы нового исследования винят в этом человека, который заставил один из видов эволюционировать в «карликов».

25 июня
ФизТех

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

Позавчера, 17:23
Людмила Соколова

Чтобы понять, как часто за пределами Солнечной системы встречаются миры, похожие на Землю, ученые из Калифорнийского университета (США) провели статистический анализ 517 экзопланет. Результаты показали, что всего три мира, включая наш, соответствуют критериям потенциальной обитаемости. Наиболее перспективными из них оказались Kepler-22b и Kepler-538b.

17 июня
Адель Романова

Радиотелескопы уловили очень короткий сигнал, и по его характеристикам стало ясно, что он не может быть естественного происхождения. Астрономы пришли к выводу, что источник находился в околоземном пространстве — там, где уже более полувека летает «мертвый» аппарат NASA.

25 июня
ФизТех

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

5 июня
Александр Березин

Вид антилоп, с ледникового периода привыкший к массовым миграциям, пытается вернуться в свой исторический ареал, когда-то достигавший Днепра. Однако их нетипичные для травоядных привычки вызывают сильнейшее отторжение у сельских жителей, предлагающих массово уничтожать их с воздуха. С экологической точки зрения возвращение этих животных весьма желательно, но как примирить их с фермерами — неясно.

[miniorange_social_login]
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно