Хотите получать важные новости науки?
Подписаться
  • Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку

Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

Самые продвинутые модели ИИ не справились с задачей для детей 

Большинство детей учатся определять время на циферблате часов в возрасте шести-семи лет, но искусственный интеллект, судя по всему, до сих пор не достиг этой вехи в своем развитии.

Часы на Спасской башне / © wikipedia / A.Savin
Часы на Спасской башне / © wikipedia / A.Savin

Исследователи из Эдинбургского университета в Шотландии обнаружили, что мультимодальные большие языковые модели (MLLM), которые могут обрабатывать текст и изображения, способны распознавать показания циферблатов часов лишь в 25 процентах случаев.

В статье, ожидающей рецензирования, специалисты протестировали различные конструкции часов, в том числе с римскими цифрами, с секундными стрелками и без них, а также с циферблатами разных цветов. Результаты показали, что системы ИИ от компаний Google, OpenAI, Anthropic и других определяли положение стрелок часов правильно менее чем в четверти случаев. Чаще всего ИИ выдавал ошибки, когда часы имели римские цифры или стилизованные стрелки.

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Комментарии

9 Комментариев
-
0
+
Просто у ии другой способ познания реальности, по этому эти системы ошибаются, если смогут объяснить саму концепцию времени и в каком положение находится стрелки то все заработает и не важно какие там цифры и есть ли они там есть
Mr. K
23.03.2025
-
0
+
Да, реально, сначала не поверил, а потом как сделал 3 опыта понял, что он либо приблизительно даёт, либо угадывает
    -
    0
    +
    Mr., я сначала взял Грок - как бы самый самый считается, он распознал римские числа - но не справился со стрелками! The clock in the image shows the time with Roman numerals. The hour hand is pointing at "VII" (7), and the minute hand is pointing at "XII" (12), which represents the start of the hour. Therefore, the time on the clock is 7:00. This clock is part of the Spasskaya Tower in the Kremlin, Moscow, Russia, a well-known landmark. The Spasskaya Tower clock is one of the most iconic clocks in Russia and is often associated with the Kremlin's chimes, which have historical and cultural significance. А вот ChatGPT смог From the image, the clock shows the time as 11:24. The hour hand is pointing slightly past 11. The minute hand is pointing at 24 minutes past the hour.
    +
      ещё комментарии
      Mr. K
      23.03.2025
      -
      1
      +
      +, у меня подписка на ChatGPT, но он не смог🫤
        -
        0
        +
        Mr., в таком случае, конечно, интерсна последовательность действий. Подписки у меня нет, я через обычный гугл аккаунт логинюсь - но логинится надо, так как ChatGPT не хочет работать с картинкой через интернет адрес. Потом картинку через Upload загружаю и пишу в ChatGPT: You get an image uploaded. What time is it on the picture? В этот раз результат на минуту отличается The clock in the image shows the time as 11:25. The hour hand is pointing slightly past 11, and the minute hand is pointing at 25 minutes. Модель 4o. Да, даже секундную стрелку распознаёт.
Alex I
23.03.2025
-
0
+
Ха-ха, вы у нынешних школьников такой тест проведите, там сильно меньше 25% будет результат.
    -
    0
    +
    Alex, Если я правильно понял, речь о том, что ИИ не может решить задачу даже через жульничество, которым владеет любой школьник (ну то есть ты можешь и не знать римские цифры, тут надо просто вспомнить архитекруру циферблата и сопоставить с положением стрелок. ИИ оказывается для таких творческих задач надо обучать отдельно, он не может в "творческий подход к задаче").
-
0
+
Да, я поддтверждаю, лажает... Therefore, the time shown on the clock is 2:00. С другой стороны, возможно ИИ находится в ином гравитационном поле и уже учёл разницу 😦
-
0
+
Странно, очень странно. Может быть они, ИИ, слишком "общего пользования", и вы не правильно спрашиваете - попробуйте на машинном, типа "посмотри на вот эту картинку, стрелки на картинке показывают время, болшая минуты, маленькая часы и скажи мне сколько... да я щас сам задам, доступ то свободный...
Позавчера, 10:56
ПНИПУ

С наступлением летней жары так и тянет окунуться в прохладную воду реки или озера. И такое решение может быть небезопасным! Эксперты Пермского Политеха рассказали, от чего водоемы становятся мутными и грязными, почему нельзя купаться рядом с утками и мостами, что находят в запрещенных для отдыха местах, какие инфекции можно подхватить и как не заболеть после купания.

Позавчера, 12:53
Юлия Тарасова

Анализ свыше миллиона фрагментов из выступлений в датском парламенте показал, что с приходом в правительство политики начинают изъясняться менее простым и понятным людям языком. Причины тенденции автор исследования увидел в обязанностях, которые накладывает правительственная должность.

Позавчера, 20:07
Юлия Тарасова

Прошлые исследования показали, что татуировки могут быть способом самовыражения и отражать определенные черты личности их обладателей. Но насколько верно судят окружающие о владельцах нательных рисунков, исходя из их внешнего вида? Результаты нового исследования продемонстрировали, что подобные выводы часто бывают ошибочными.

25 июня
ФизТех

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

25 июня
Елена Авдеева

Состояние паралича, в которое впадают разные виды животных, хорошо известно и задокументировано. Обычно оно считается защитной реакцией в случае опасности, но никаких доказательств этому до сих пор нет. Особенно загадочным остается поведение обитателей океана, притворяющихся мертвыми. Ученые проверили существующие объяснения этого эффекта и сделали неожиданные выводы.

25 июня
Evgenia Vavilova

Квантовые спиновые жидкости (КСЖ) обещают ученым развитие в областях квантовых вычислений и передачи энергии без потерь. В них магнитные моменты частиц теоретически не должны упорядочиваться даже при охлаждении до абсолютного нуля температур.

17 июня
Адель Романова

Радиотелескопы уловили очень короткий сигнал, и по его характеристикам стало ясно, что он не может быть естественного происхождения. Астрономы пришли к выводу, что источник находился в околоземном пространстве — там, где уже более полувека летает «мертвый» аппарат NASA.

25 июня
ФизТех

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

5 июня
Александр Березин

Вид антилоп, с ледникового периода привыкший к массовым миграциям, пытается вернуться в свой исторический ареал, когда-то достигавший Днепра. Однако их нетипичные для травоядных привычки вызывают сильнейшее отторжение у сельских жителей, предлагающих массово уничтожать их с воздуха. С экологической точки зрения возвращение этих животных весьма желательно, но как примирить их с фермерами — неясно.

[miniorange_social_login]
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно