Искусственный интеллект распознал изображения хуже, чем человек
У компьютерного зрения нет тех физиологических особенностей, которые есть у человека, поэтому оно хуже распознает изображения. К такому выводу пришли ученые из ВШЭ и Московского политехнического университета.
Результаты исследования опубликованы в сборнике Proceedings of Seventh International Congress on Information and Communication Technology. Чтобы понять, как машинное восприятие изображений отличается от человеческого, российские ученые загрузили изображения классических визуальных иллюзий в онлайн-сервис распознавания образов IBM Watson Visual Recognition. Большая часть из них представляла собой геометрические силуэты, частично скрытые геометрическими формами цвета заднего плана. Система пыталась определить, что представляет собой поступившее изображение, и указывала степень уверенности в своем ответе.
Оказалось, что искусственный интеллект не способен распознать ни одну воображаемую фигуру. Исключение составил раскрашенный воображаемый треугольник. В силу высокого контраста с фоном он был распознан правильно.
«Объекты, похожие на те, что мы использовали в ходе эксперимента, встречаются в реальной жизни, — комментирует автор исследования Владимир Винников, аналитик Научно-учебной лаборатории методов анализа больших данных факультета компьютерных наук ВШЭ. — Например, прицеп трейлера или радиобашня, которые по ночам обозначаются только габаритными огнями, автопилот автомобиля или самолета воспринимает таким же образом, как мы — воображаемые геометрические фигуры».
Человеческий глаз постоянно непроизвольно движется, а светочувствительная поверхность его сетчатки имеет форму полусферы. Чтобы человек увидел иллюзию, изображению достаточно быть векторным — состоять из опорных точек и соединяющих их кривых. Человеческое воображение достроит картинку благодаря физиологической особенности зрения — постоянному движению глаз.
В оптико-электронных системах все устроено иначе. Их светочувствительная матрица имеет плоскую, как правило прямоугольную, форму, а сама система линз далеко не так свободна в движении, как человеческий глаз. Поэтому искусственный интеллект не может достроить воображаемые линии, которые связывают фрагменты геометрической иллюзии. Машинное зрение видит только то, что реально изображено, тогда как человек достраивает в воображении полное изображение по его очертаниям.
Нейросетевые системы распознавания образов сегодня активно распространяются в коммерческом секторе. Однако вопрос, насколько точно машина распознает изображение, до сих остается открытым. От точности его распознавания могут зависеть человеческие жизни. Например, если автопилот автомобиля или самолета не распознает объект с низкой контрастностью относительно фона и не успеет вовремя уклониться от препятствия, может произойти катастрофа.
Ученые полагают, что недостатки машинного распознавания образов можно исправить. Например, дополнить распознавание растровых изображений, представляющих собой сетку пикселей, имитацией физиологических особенностей движения глаз, которые позволяют глазу видеть двумерные и трехмерные сцены. Альтернативный способ — добавить векторное описание изображений. Оно позволит запрограммировать машину на обход изображения по траекториям, заданным векторами.
«Воображаемые фигуры обязательно стоит использовать в качестве тестов в системах, которые зависят от распознавания фото- и видеопотоков. Например, в автопилотах машин или беспилотных летательных аппаратов. Это поможет избежать рисков, связанных с использованием систем машинного интеллекта в промышленности и транспортных системах», — полагает Владимир Винников.
Древнеримские инженеры проложили колоссальную сеть дорог через Европу, Северную Африку и Ближний Восток, многие участки которой до сих пор поражают безупречной прямолинейностью. Секрет строительства заключался в использовании трех особых геодезических инструментов, с помощью которых разбивали местность на ровные отрезки и размечали трассы.
Самый маленький дневной хищник Африки впервые попал под наблюдение с помощью GPS-трекеров. Ученые выяснили, что для выкармливания птенцов ему нужен участок почти в 14 раз меньше, чем у степной пустельги — ближайшего «рекордсмена» среди изученных птиц.
Физтехи предложили аналитический способ описания передачи энергии от ультракороткого лазерного импульса к квантовому осциллятору, находящемуся в тепловом равновесии. Эта модель показывает, как сверхкороткие вспышки света возбуждают микроскопические системы — молекулы, кристаллы, плазмоны, фотоны и электронные центры в веществе. Это важно для разработки методов сверхбыстрого управления веществом, генерации терагерцового излучения и подбора оптимальных параметров лазерных импульсов для возбуждения заданных состояний материала.
Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.
Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.
Американские ветеринары установили, что длина шага передних лап у пожилых собак отражает возрастные изменения в работе мозга. Когда у собак развивается деменция, шаги их передних лап становятся короче, причем эта связь не зависит от хронической боли в суставах.
Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.
Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.
Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
