Модификация алгоритма улучшила отслеживание объектов на видео
Ученые МТУСИ предложили новый подход к улучшению реидентификации объектов — процесса отслеживания одного и того же объекта на протяжении всего видеоряда.
В современном мире технологии компьютерного зрения играют ключевую роль в различных сферах жизни, от регулирования дорожного движения до обеспечения безопасности на улицах. Одна из важнейших задач в этой области — реидентификация объектов. Однако несмотря на кажущуюся простоту, процесс реидентификации требует использования сложных алгоритмов, сталкивающихся с такими вызовами, как большое количество параметров, долгое время обучения и низкая скорость исполнения.
Ученые МТУСИ предложили новый подход к улучшению реидентификации объектов. В своей работе они использовали современные инструменты, такие как среда Google Colab, язык программирования Python, а также пакеты Super Gradients для работы с моделью YOLO-NAS и Filterpy для реализации алгоритмов отслеживания. В исследовании основной акцент сделан на возможности отслеживания сразу нескольких движущихся целей, присутствующих в кадре. Используются алгоритмы отслеживания нескольких объектов SORT, то есть алгоритм сортировки и DeepSORT — алгоритм глубокой сортировки.
«Одним из базовых алгоритмов для отслеживания объектов является SORT. Он работает быстро, но в сложных условиях, таких как перекрытие объектов или их движение в обратном направлении, может давать сбои. Более совершенный алгоритм — DeepSORT — использует нейронные сети для более точного отслеживания, даже в условиях помех. Алгоритм SORT состоит из четырех основных компонентов: обнаружение, оценка, сопоставление данных, а также создание и удаление идентификаторов треков. Однако в сложных ситуациях, например, при перекрытии объектов или изменении направления их движения, SORT демонстрирует снижение точности», — отметил Тимур Дмитриевич Потапченко, к.т.н., доцент кафедры «Программная инженерия» МТУСИ.
Исследователи МТУСИ провели эксперимент, используя видеозапись с проезжающими автомобилями. Камера была немного смещена от центра, а фонарный столб перекрывал часть обзора, создавая дополнительные сложности. В ходе исследования выяснилось, что алгоритм SORT действительно дает сбои в таких условиях. Улучшая алгоритм сортировки глубокой сортировкой, в исследовании демонстрируется общее улучшение поведения процесса реидентификации движущихся объектов
«После загрузки видео и получения первоначального набора обнаружений с помощью продвинутой модели YOLO-NAS каждому объекту был присвоен уникальный идентификатор. Затем объекты отслеживались по всем кадрам видеопотока с использованием алгоритма DeepSORT. В результате все автомобили были успешно идентифицированы и отслежены, даже те, которые частично перекрывались», — подчеркнул Юрий Садыев, магистрант МТУСИ.
Однако в ходе исследования была замечена ошибочная классификация типов транспорта. Например, легковой автомобиль мог быть ошибочно распознан как грузовик. Ученые предлагают решить эту проблему за счет увеличения объема данных для обучения и количества эпох.
В реальных условиях оборудование не всегда может обрабатывать видео со стандартной частотой 30 кадров в секунду. Ученые провели эксперимент, пропуская 1, 2 и 3 кадра, чтобы понять, как это влияет на работу алгоритмов.
Результаты показали, что общая производительность процесса реидентификации сильно зависит от производительности детектора объектов. Алгоритм SORT изначально работает быстрее, достигая 50 кадров в секунду, но DeepSORT в сочетании с облегченной моделью и пропуском кадров не только увеличивает скорость, но и позволяет отслеживать объекты в сложных условиях.
Исследование подтвердило, что улучшенный алгоритм глубокой сортировки является мощным инструментом для задач отслеживания и реидентификации объектов, особенно в условиях, где объекты временно скрываются, перекрываются или находятся в толпе. При этом даже с учетом пропуска кадров алгоритм сохраняет высокую точность, что делает его применимым в реальных сценариях с ограниченными аппаратными ресурсами.
Работа ученых МТУСИ имеет большое практическое значение. Улучшенные алгоритмы реидентификации могут быть использованы в системах видеонаблюдения, автономных транспортных средствах, робототехнике и других областях, где важно точно отслеживать объекты в реальном времени.
Дистанционное зондирование из космоса выявило 280 гигантских каменных кругов, разбросанных по пустыне Атбай в Судане. Исследователи пришли к выводу, что это погребальные сооружения, оставленные исчезнувшей культурой скотоводов. Эти люди пасли здесь стада в четвертом-третьем тысячелетии до нашей эры, когда климат в пустыне был более влажным.
Авторы нового исследования выяснили, почему летающие насекомые так не любят чеснок: в нем содержится органическое вещество, подавляющее процесс спаривания и откладывания яиц. Причем мух и комаров отпугивает не запах, а вкус чеснока, поскольку это соединение особым образом воздействует на вкусовые рецепторы.
Вопрос формирования первых континентов на Земле до сих пор вызывает научные дискуссии. Исследование состава древнейших известных минералов, сохранившихся в архейских магматических горных породах Австралии, стало новым подтверждением того, что континенты появились в результате субдукции 3,5 миллиарда лет назад.
Нейробиологи СПбГУ продемонстрировали, что активация рецептора следовых аминов TAAR1 эффективно подавляет агрессивное поведение, вызванное полным отсутствием серотонина в мозге. В дальнейшем этот результат поможет в разработке лекарственных препаратов, направленных на коррекцию патологических форм агрессии, возникающих при посттравматическом стрессовом расстройстве (ПТСР) и шизофрении.
Крупные травоядные утконосые майазавры известны своим развитым социальным поведением. Они жили семьями и строили гнезда для своих детенышей. Даже название вида переводится с греческого языка как «ящер — хорошая мать». Исследование окаменелых зубов майазавров показало, что они выращивали детенышей совсем не так, как это считалось типичным для животных глубокой древности.
Астрономы впервые использовали гравитационные волны, чтобы косвенно оценить параметры одного из ключевых процессов термоядерного горения в массивных светилах. Именно от него зависит, какие звезды взрываются, какие превращаются в черные дыры и как во Вселенной появляются углерод и кислород — элементы, без которых не было бы ни планет, ни жизни.
В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.
Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.
Термоядерные электростанции не смогут конкурировать по цене с возобновляемыми источниками энергии из-за медленного удешевления технологии. По расчетам, расходы на каждую новую установку падали максимум на 8% — много раз ниже ранних ожиданий венчурных инвесторов. Это перечеркивает экономический смысл финансовых вливаний, и мир может никогда не увидеть дешевой термоядерной энергии.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
