7 апреля, 13:43

Редакция Naked Science

1,9 тыс

Яндекс внедрил в Поиск гибридную ИИ‑архитектуру, созданную на базе научных исследований

❋ 3.8

Компания объединила подходы «смеси экспертов» (Mixture of Experts, MoE) и «энкодер-декодер» (encoder-decoder, «кодировщик-декодировщик»), рассказала технический директор Яндекс Поиска Екатерина Серажим на конференции «День Поиска 2026». В компании подчеркнули, что такое объединение методов ранее существовало в основном на уровне научных исследований, а не практических технологий.

Технологии

# большие языковые модели

# нейросети

# Яндекс

Екатерина Серажим / © Яндекс

В последнее время мировые поисковые системы уделяют все больше внимания прямым ответам на запросы. То есть когда человек вбивает что-то в поиск, кроме выдачи ссылок, он получает в самом верху ответ, который нейросеть генерирует «на лету», в виде связного текста. «Генеративные ответы — важная часть пользовательского опыта. Такие ответы должны соответствовать требованиям Поиска: быть быстрыми, лаконичными и эффективно работать на большом потоке запросов», — отметила Екатерина Серажим.

Для решения довольно непростой задачи компания развивает отдельный набор моделей — Alice AI Search, оптимизированный под задачи поиска. «За последний год мы внедрили улучшения во всех частях технологии — от обучения претрейн-моделей до оптимизации инфраструктуры», — добавила она.

По ее словам, для таких моделей требуется и особая архитектура, так как в Поиске им приходится почти мгновенно анализировать большой объем информации из веб-документов. Это отличается от стандартного подхода нейросетей к генерации ответов. Поэтому важно использовать решения, которые обеспечивают высокое качество выдачи при ограниченных вычислительных ресурсах.

Технический директор пояснила, что в экспериментах компании архитектура «энкодер-декодер» — где одна часть модели анализирует запрос и документы, а другая формирует ответ — при работе с большим объемом данных показала результаты лучше классических языковых моделей. Чтобы ускорение работы модели шло без потери качества, компания использовала подход Mixture of Experts (MoE).

Это принятая в индустрии архитектура, которая позволяет значительно увеличить количество параметров модели (очень условно — ее «знания»), не увеличивая при этом вычислительные затраты на каждый отдельный запрос.

Если обычная нейросетевая модель при каждом слове активирует все свои нейроны («плотная» модель), то MoE-модель активирует только малую часть своих мощностей («разреженная» модель). «Экспертами» в модели называют отдельные подсети, каждая из которых «учится» обрабатывать определенные типы данных. Один «эксперт» может хорошо разбираться в программировании, другой — в биологии, третий — в написании деловых писем.

Серажим отметила, что MoE позволяет задействовать только часть модели для генерации каждого следующего токена, что ускоряет работу и повышает эффективность.

«В Поиске модель должна одновременно работать с большим объемом данных и укладываться в жесткие ограничения по скорости и стоимости на каждом запросе. Нам удалось модифицировать архитектуру, добавив слои MoE. В совокупности все улучшения, включая создание гибридной архитектуры, позволили нам повысить качество и совокупно снизить стоимость инференса в три раза. В результате покрытие ИИ-ответами в Поиске (доля запросов, на которые Поиск сразу даёт генеративный ответ) выросло за год в 1,5 раза», — подытожила она. Инференсом в данном контексте называют процесс работы нейросети над генеративным ответом пользователю, задающему вопрос в поисковике.

Внедрение компанией сочетания архитектур MoE и «энкодер-декодер» из научных исследований в промышленный поиск показывает, как такие разработки переходят в практическое применение — уже с учетом жестких требований к скорости, стабильности и стоимости инфраструктуры.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Технологии

# большие языковые модели

# нейросети

# Яндекс

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Собрано без инструкции: почему эволюция делает странных, нелепых и… гениальных существ

Центр «Архэ»

Онлайн

Лекция

07 Июл

Бесплатно

Животные в старом Петербурге

Библиотека Планетарий 1

Санкт-Петербург

Экскурсия

08 Июл

Бесплатно

Мой адрес – корабль «Союз»

Космонавтика и авиация

Москва

Лекция

08 Июл

Бесплатно

От тучерезов до небоскребов

Политехнический музей

Москва

Лекция

08 Июл

Бесплатно

Многоканальная астрономия

Москва

Возвращение мамонта: клонирование, генное чудо или фейк?

Центр «Архэ»

Онлайн

Лекция

09 Июл

Бесплатно

Эра персонализированной медицины или зачем каждому из нас нужен генетический тест?

Москва

Мамонты: от гигантов до карликов – вымирание, смертельные инфекции и греческие мифы

Московский зоопарк

Москва

Лекция

09 Июл

Бесплатно

Миф об Аркадии и образ Канады как «французского рая»

Библиотека иностранной литературы

Москва

Пользуюсь только Google поисковиком и AI-нейросетью там в поисковике (на базе Gemini Flash). Ищет точнее по запросу, что критично для точных данных и программирования. Эта нейосеть великолепна, работает по актуальным данным (что критично при запросах по программированию, когда обычные нейросети имеют устаревшие нерабочие данные об API библиотек). Для более сложных запросов есть другие нейросети. +Есть Google Books. Лет 10 назад я очень радовался внедрению нейросети в Яндекс Поиск (в обработку семантики запроса, не путать с ответами нейросети). Была патриотичная гордость. Но всё превратилось в рекламно-пропагандную помойку, дзен-маилсру-чебурнет. Пользоваться невозможно. Да и многие разрабы Яндекса свалили за границу, не говоря про то, что домен яндекса увел dzen, превратив в ту самую помойку. Алиса...😏 Для простых общих запросов для народа, как национальная нейросеть... возможно. Но для вопросов по делу - совершенно бесполезна, только тратит время. Для программирования и картинок тот же GigaChat/GigaCode лучше и бесплатные китайцы (DeepSeek, GLM, Qwen). Блин, она даже фильмы, песни и обществ.движения 2000х годов найти не может по описанию... Только рекламу сует фигни всякой...🤬

Ответить

Питон Удав

07.04.2026

Да ну. Как был бред на сложные и редкие запросы, так и есть. Причём, беда всех нейросетей, она ещё и подвирает, лишь бы угодить. Проблема то банальная. На простые и частые запросы есть ответы людей, которые нейросеть обобщает и выдаёт. Но я и так могу найти нужную информацию, еë ведь полно. А вот редкий и сложный запрос нейросеть ставит в тупик и она начинает врать, лишь бы дать ответ.

Ответить

Сергей Механик

07.04.2026

К сожалению, Яндекс назвать мировой поисковой системой можно лишь условно. Да, он удобен, быстр и функционален, однако не все показанные в результатах поиска ссылки можно открыть. Хорошо это или плохо - не знаю.

Ответить

Питон Удав

07.04.2026

Ответить

Сергей Механик

07.04.2026

Ответить

Владислав Васильев

07.04.2026

Ответить

Яндекс внедрил в Поиск гибридную ИИ‑архитектуру, созданную на базе научных исследований

По теме

Ученые создали инструмент, с помощью которого нейросети смогут эффективнее избегать нежелательных тем

Школа анализа данных «Яндекса» запустила программу подготовки ученых к использованию ИИ

Пародийный чат-бот из 1960-х годов превзошел GPT-3.5 в тесте Тьюринга

Популярное

Комментарии

Последние новости:

У агрессивного вида рака нашли уязвимость, которую десятилетиями не могли обнаружить

Биологи научились управлять механизмом, мешающим мышцам заживать в пожилом возрасте

Физики впервые отследили электрон на квантово-механическом пространственно-временном пределе

Биологи нашли способ уничтожать раковые клетки, которые «притворяются мертвыми»

Промышленный кошмар: почему терраформирование Марса может оказаться неподъемной задачей

Невозможное возможно: как вакуумный двигатель SpaceX RaptorVAC работает при атмосферном давлении

Жанна д’Арк: как неграмотная девушка определила будущее мира

Они прилетели из чужих миров: как Оумуамуа, комета Борисова и 3I/ATLAS изменили астрономию

Последние комментарии

Самые обсуждаемые

Парадокс Ферми связали с незаметной экспансией ИИ-цивилизаций

Россия заняла шестое место в мире по числу смертей от автомобильных выхлопов

Историки объяснили, как римляне строили идеально прямые дороги на тысячи километров

Древнейшие звезды Млечного Пути помогли уточнить возраст Вселенной