Модификация алгоритма улучшила отслеживание объектов на видео
Ученые МТУСИ предложили новый подход к улучшению реидентификации объектов — процесса отслеживания одного и того же объекта на протяжении всего видеоряда.
В современном мире технологии компьютерного зрения играют ключевую роль в различных сферах жизни, от регулирования дорожного движения до обеспечения безопасности на улицах. Одна из важнейших задач в этой области — реидентификация объектов. Однако несмотря на кажущуюся простоту, процесс реидентификации требует использования сложных алгоритмов, сталкивающихся с такими вызовами, как большое количество параметров, долгое время обучения и низкая скорость исполнения.
Ученые МТУСИ предложили новый подход к улучшению реидентификации объектов. В своей работе они использовали современные инструменты, такие как среда Google Colab, язык программирования Python, а также пакеты Super Gradients для работы с моделью YOLO-NAS и Filterpy для реализации алгоритмов отслеживания. В исследовании основной акцент сделан на возможности отслеживания сразу нескольких движущихся целей, присутствующих в кадре. Используются алгоритмы отслеживания нескольких объектов SORT, то есть алгоритм сортировки и DeepSORT — алгоритм глубокой сортировки.
«Одним из базовых алгоритмов для отслеживания объектов является SORT. Он работает быстро, но в сложных условиях, таких как перекрытие объектов или их движение в обратном направлении, может давать сбои. Более совершенный алгоритм — DeepSORT — использует нейронные сети для более точного отслеживания, даже в условиях помех. Алгоритм SORT состоит из четырех основных компонентов: обнаружение, оценка, сопоставление данных, а также создание и удаление идентификаторов треков. Однако в сложных ситуациях, например, при перекрытии объектов или изменении направления их движения, SORT демонстрирует снижение точности», — отметил Тимур Дмитриевич Потапченко, к.т.н., доцент кафедры «Программная инженерия» МТУСИ.
Исследователи МТУСИ провели эксперимент, используя видеозапись с проезжающими автомобилями. Камера была немного смещена от центра, а фонарный столб перекрывал часть обзора, создавая дополнительные сложности. В ходе исследования выяснилось, что алгоритм SORT действительно дает сбои в таких условиях. Улучшая алгоритм сортировки глубокой сортировкой, в исследовании демонстрируется общее улучшение поведения процесса реидентификации движущихся объектов
«После загрузки видео и получения первоначального набора обнаружений с помощью продвинутой модели YOLO-NAS каждому объекту был присвоен уникальный идентификатор. Затем объекты отслеживались по всем кадрам видеопотока с использованием алгоритма DeepSORT. В результате все автомобили были успешно идентифицированы и отслежены, даже те, которые частично перекрывались», — подчеркнул Юрий Садыев, магистрант МТУСИ.
Однако в ходе исследования была замечена ошибочная классификация типов транспорта. Например, легковой автомобиль мог быть ошибочно распознан как грузовик. Ученые предлагают решить эту проблему за счет увеличения объема данных для обучения и количества эпох.
В реальных условиях оборудование не всегда может обрабатывать видео со стандартной частотой 30 кадров в секунду. Ученые провели эксперимент, пропуская 1, 2 и 3 кадра, чтобы понять, как это влияет на работу алгоритмов.
Результаты показали, что общая производительность процесса реидентификации сильно зависит от производительности детектора объектов. Алгоритм SORT изначально работает быстрее, достигая 50 кадров в секунду, но DeepSORT в сочетании с облегченной моделью и пропуском кадров не только увеличивает скорость, но и позволяет отслеживать объекты в сложных условиях.
Исследование подтвердило, что улучшенный алгоритм глубокой сортировки является мощным инструментом для задач отслеживания и реидентификации объектов, особенно в условиях, где объекты временно скрываются, перекрываются или находятся в толпе. При этом даже с учетом пропуска кадров алгоритм сохраняет высокую точность, что делает его применимым в реальных сценариях с ограниченными аппаратными ресурсами.
Работа ученых МТУСИ имеет большое практическое значение. Улучшенные алгоритмы реидентификации могут быть использованы в системах видеонаблюдения, автономных транспортных средствах, робототехнике и других областях, где важно точно отслеживать объекты в реальном времени.
Изучив данные о скорости изменения температур ледяных спутников пятой и шестой планеты системы, астрономы обнаружили, что она слишком высока для по-настоящему ледяной поверхности. Оказалось, что эти тела покрыты материалом, по своим свойствам резко отличающимся от земного льда.
Палеонтологи описали новый вид ископаемой птицы мелового периода, жившей на территории современного Китая 121 миллион лет назад. У маленькой птички размером с воробья были два необычайно длинных хвостовых пера, вдвое превышающих длину ее тела. Перья, по всей видимости, носили декоративный характер и двигались только вверх и вниз, что напоминает брачные игры самцов современных птиц.
Черные дыры, возможно, не такие «сломанные» объекты, как считалось полвека. Автор нового исследования показал, что даже в рамках Общей теории относительности черная дыра может избежать сингулярности — точки, где законы физики перестают работать. Если он прав, новая теория гравитации для «спасения» физики внутри космических «монстров» не понадобится.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
Вначале Reuters опубликовал статью о взаимоотношениях SpaceX и Пентагона, которую миллиардер --- традиционно для его отношений с этим изданием — назвал фейком. Опровергая ее тезисы, он обнародовал информацию, не представленную ранее публично.
Провинция Цзянсу была процветающим центром медицинской практики в Китае во времена династии Мин (1368-1644 годы нашей эры). Микроскопический анализ крошечных частиц на поверхности хирургических ножниц и пинцета из гробницы китайского врача помог выявить следы вещества, получаемого из ядовитого растения, которое, по мнению исследователей, применялось как местная анестезия во время операций.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
