• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
17.10.2025, 14:45
ФизТех
527

Искусственный интеллект научили смотреть на проблему под разными углами

❋ 4.5

Коллектив исследователей из T-Bank, МФТИ и МИСИС разработал новый подход к обучению ансамблей нейронных сетей, заставляющий каждую модель в группе смотреть на проблему под своим уникальным углом. Этот метод, названный Saliency-Diversified Deep Ensembles (SDDE), позволяет не просто повысить точность работы искусственного интеллекта, но и научить его лучше распознавать ситуации, с которыми он ранее не сталкивался. В результате ансамбль становится умнее, точнее и осторожнее при столкновении с неизвестными данными, что открывает новые горизонты для создания более надежных и безопасных ИИ-систем.

Кадр из фильма «Я, робот» / © Twentieth Century Fox

Современные нейронные сети достигли поразительных успехов в решении множества задач, от распознавания лиц на фотографиях до медицинской диагностики и управления беспилотными автомобилями. Однако у них есть фундаментальная уязвимость, известная как «сдвиг домена». Модель, блестяще обученная на одном наборе данных, может совершать грубые ошибки, столкнувшись с данными из реального мира, которые хоть немного отличаются от обучающих примеров. Это похоже на студента, который выучил ответы на конкретные билеты, но теряется, если вопрос сформулирован чуть иначе. Для решения этой проблемы инженеры часто используют «ансамбли» — группы из нескольких нейросетей, которые анализируют задачу параллельно, а их «мнения» усредняются для получения итогового ответа. Этот подход, подобно коллективному разуму, повышает надежность и точность.

Тем не менее, у классических ансамблей есть своя «ахиллесова пята» — интеллектуальная однородность. В процессе обучения разные модели в ансамбле, стремясь к максимальной точности на одних и тех же данных, часто начинают «думать» одинаково. Они выучивают одни и те же признаки и шаблоны, обращая внимание на одни и те же детали. В итоге вместо команды независимых экспертов с разными точками зрения получается эхо-камера, где все участники лишь подтверждают выводы друг друга. Это ограничивает эффективность ансамбля и делает его уязвимым перед по-настоящему новыми и нестандартными ситуациями.

Именно эту проблему «интеллектуальной однородности» и взялись решить российские ученые. Их целью было заставить модели внутри ансамбля не просто приходить к разным ответам, но и основывать свои выводы на разных аспектах исходных данных. Для этого они обратились к концепции «карт внимания» (saliency maps). Карта внимания — это своего рода «тепловая карта» изображения, которая показывает, на какие пиксели нейросеть обращает больше всего внимания при принятии решения. Это похоже на то, как человек, разглядывая картину, выделяет для себя ключевые детали: лицо персонажа, яркий элемент одежды или необычную деталь на фоне. Работа исследователей опубликована в виде препринта на научном портале arXiv и на конференции ICIP.

Ключевая идея метода SDDE заключается во внедрении в процесс обучения специальной математической «функции потерь», которая штрафует ансамбль за сходство карт внимания у его моделей. Если две нейросети пытаются сфокусироваться на одной и той же области изображения для вынесения вердикта, алгоритм вносит коррективы в их обучение, поощряя их искать альтернативные, но не менее важные признаки. Таким образом, одна модель учится распознавать кошку по форме ушей, другая — по текстуре шерсти, третья — по характерной позе, а четвертая — по контексту окружения. В качестве инструмента для построения карт внимания исследователи использовали хорошо зарекомендовавший себя метод GradCAM.

Для проверки эффективности своего подхода команда провела серию масштабных экспериментов на общепризнанных наборах данных для компьютерного зрения, включая CIFAR-10, CIFAR-100 и ImageNet. Они сравнили работу своего ансамбля SDDE с несколькими передовыми методами, включая классические глубокие ансамбли (Deep Ensembles) и другие подходы, направленные на повышение разнообразия. Результаты оказались убедительными: по всем ключевым метрикам — точности классификации, калибровке (умению модели адекватно оценивать собственную уверенность) и качеству детекции данных из посторонних источников — предложенный метод продемонстрировал значительное превосходство.

«Представьте, что вы собираете комитет экспертов для принятия важного решения. Если вы пригласите десять специалистов с абсолютно одинаковым опытом и взглядами, вы получите очень уверенный, но, возможно, ошибочный ответ. Гораздо эффективнее собрать команду с разным опытом: один — теоретик, другой — практик, третий — специалист по смежной области. Наш метод, SDDE, выступает в роли модератора, который на этапе обучения говорит каждой нейросети-эксперту: “Ты, пожалуйста, обрати внимание на текстуру. А ты — на форму. А ты — на общий контекст”. В результате их коллективное решение становится гораздо более взвешенным и устойчивым к неожиданностям, — прокомментировал суть работы Станислав Дерека, аспирант МФТИ. Затем он добавил: —Главное преимущество нашего подхода — это повышение надежности систем искусственного интеллекта в реальном мире, который всегда полон сюрпризов. Когда модель не просто классифицирует то, что знает, но и умеет сказать “я не уверена, что это такое”, это фундаментальный шаг к созданию ответственного и заслуживающего доверия ИИ. Наш метод делает ансамбли более “скромными” и осторожными, что в критических приложениях гораздо важнее самоуверенной точности».

Разработка российских исследователей смещает фокус с диверсификации конечных предсказаний на диверсификацию самого процесса анализа данных. Если предыдущие методы в основном пытались сделать так, чтобы модели давали немного разные ответы, то ученые пошли глубже: они заставили диверсифицироваться сам «мыслительный процесс» моделей — их внимание к входным данным. Это обеспечивает более фундаментальное и робастное разнообразие внутри ансамбля.

Рисунок 2. Карты внимания для обычного ансамбля и для ансамбля, обученного по методу SDDE, при анализе фотографии лодки. В первом случае все модели «смотрят» на одну и ту же центральную часть судна. Во втором — их внимание распределено: одна модель фокусируется на парусе, другая — на отражении в воде, третья — на линии горизонта. SDDE заставляет нейросети видеть картину целиком, во всем ее многообразии / © ICIP.

Повышение способности ИИ распознавать неизвестное — ключевой фактор для создания по-настоящему безопасных систем. Это критически важно для беспилотных автомобилей, которые должны адекватно реагировать на нестандартные дорожные ситуации или внезапно появившиеся на дороге объекты, которых не было в обучающих данных. В медицине такие системы смогут не просто ставить диагнозы на основе известных снимков, но и сигнализировать врачу, что столкнулись с редкой или атипичной патологией, требующей особого внимания человека. Другие возможные применения включают финансовый мониторинг для выявления новых видов мошенничества, системы контроля качества на производстве и обеспечение безопасности в киберпространстве.

В будущем исследователи планируют адаптировать свой подход для других типов данных, таких как аудиосигналы, тексты и временные ряды, а также исследовать возможность динамического управления разнообразием ансамбля в зависимости от сложности решаемой задачи. Разработка открывает путь к созданию следующего поколения ИИ-систем, которые будут не только эффективными, но и более устойчивыми и надежными перед лицом непредсказуемой реальности.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Московский физико-технический институт (национальный исследовательский университет), известен также как Физтех — ведущий российский вуз по подготовке специалистов в области теоретической, экспериментальной и прикладной физики, математики, информатики, химии, биологии и смежных дисциплин. Расположен в городе Долгопрудном Московской области, отдельные корпуса и факультеты находятся в Жуковском и в Москве.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
11 мая, 06:54
Лена

Крупные травоядные утконосые майазавры известны своим развитым социальным поведением. Они жили семьями и строили гнезда для своих детенышей. Даже название вида переводится с греческого языка как «ящер — хорошая мать». Исследование окаменелых зубов майазавров показало, что они выращивали детенышей совсем не так, как это считалось типичным для животных глубокой древности.

10 мая, 10:49
Александр Березин

Десятого мая 1940 года вермахт пришел в движение. Через 42 суток англо-французские армии были разгромлены, а Франция капитулировала. Как это произошло, ведь союзники имели больше солдат, танков и пушек, чем немцы? В СССР причиной посчитали нежелание французов воевать, немцы же, говорили советские военные, не внесли в стратегию ничего нового. Реальность была строго обратной: разгром Франции был новым словом в войне, и такой же сценарий Гитлер применил против СССР через год. Что именно произошло и отчего советское руководство не смогло осознать случившееся?

12 мая, 11:21
Игорь Байдов

Римская империя господствовала в Британии на протяжении приблизительно четырех веков. За это время римляне сильно повлияли на местное население: строили города, внедряли новые законы, развивали торговлю и меняли образ жизни. Однако авторы нового исследования выяснили, что вопреки распространенному мнению, генетический вклад как римлян, так и викингов в население Британских островов был на удивление слабым. Гораздо большее влияние на происхождение современных британцев оказали более поздние миграции англосаксов.

8 мая, 17:12
СПбГУ

Нейробиологи СПбГУ продемонстрировали, что активация рецептора следовых аминов TAAR1 эффективно подавляет агрессивное поведение, вызванное полным отсутствием серотонина в мозге. В дальнейшем этот результат поможет в разработке лекарственных препаратов, направленных на коррекцию патологических форм агрессии, возникающих при посттравматическом стрессовом расстройстве (ПТСР) и шизофрении.

11 мая, 06:54
Лена

Крупные травоядные утконосые майазавры известны своим развитым социальным поведением. Они жили семьями и строили гнезда для своих детенышей. Даже название вида переводится с греческого языка как «ящер — хорошая мать». Исследование окаменелых зубов майазавров показало, что они выращивали детенышей совсем не так, как это считалось типичным для животных глубокой древности.

9 мая, 12:15
Любовь С.

Астрономы впервые использовали гравитационные волны, чтобы косвенно оценить параметры одного из ключевых процессов термоядерного горения в массивных светилах. Именно от него зависит, какие звезды взрываются, какие превращаются в черные дыры и как во Вселенной появляются углерод и кислород — элементы, без которых не было бы ни планет, ни жизни.

23 апреля, 18:34
Александр Березин

В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.

21 апреля, 20:03
Evgenia Vavilova

Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.

20 апреля, 13:29
Илья Гриднев

Термоядерные электростанции не смогут конкурировать по цене с возобновляемыми источниками энергии из-за медленного удешевления технологии. По расчетам, расходы на каждую новую установку падали максимум на 8% — много раз ниже ранних ожиданий венчурных инвесторов. Это перечеркивает экономический смысл финансовых вливаний, и мир может никогда не увидеть дешевой термоядерной энергии.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Комментарий на проверке

Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Авторизуясь, вы даете согласие на обработку персональных данных и подтверждаете ознакомление с Политикой.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно