• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
7 апреля, 13:43
Редакция Naked Science
3
1,8 тыс

Яндекс внедрил в Поиск гибридную ИИ‑архитектуру, созданную на базе научных исследований

❋ 3.8

Компания объединила подходы «смеси экспертов» (Mixture of Experts, MoE) и «энкодер-декодер» (encoder-decoder, «кодировщик-декодировщик»), рассказала технический директор Яндекс Поиска Екатерина Серажим на конференции «День Поиска 2026». В компании подчеркнули, что такое объединение методов ранее существовало в основном на уровне научных исследований, а не практических технологий.

Екатерина Серажим / © Яндекс

В последнее время мировые поисковые системы уделяют все больше внимания прямым ответам на запросы. То есть когда человек вбивает что-то в поиск, кроме выдачи ссылок, он получает в самом верху ответ, который нейросеть генерирует «на лету», в виде связного текста. «Генеративные ответы — важная часть пользовательского опыта. Такие ответы должны соответствовать требованиям Поиска: быть быстрыми, лаконичными и эффективно работать на большом потоке запросов», — отметила Екатерина Серажим.

Для решения довольно непростой задачи компания развивает отдельный набор моделей — Alice AI Search, оптимизированный под задачи поиска. «За последний год мы внедрили улучшения во всех частях технологии — от обучения претрейн-моделей до оптимизации инфраструктуры», — добавила она.

По ее словам, для таких моделей требуется и особая архитектура, так как в Поиске им приходится почти мгновенно анализировать большой объем информации из веб-документов. Это отличается от стандартного подхода нейросетей к генерации ответов. Поэтому важно использовать решения, которые обеспечивают высокое качество выдачи при ограниченных вычислительных ресурсах.

Технический директор пояснила, что в экспериментах компании архитектура «энкодер-декодер» — где одна часть модели анализирует запрос и документы, а другая формирует ответ — при работе с большим объемом данных показала результаты лучше классических языковых моделей. Чтобы ускорение работы модели шло без потери качества, компания использовала подход Mixture of Experts (MoE).

Это принятая в индустрии архитектура, которая позволяет значительно увеличить количество параметров модели (очень условно — ее «знания»), не увеличивая при этом вычислительные затраты на каждый отдельный запрос.

Если обычная нейросетевая модель при каждом слове активирует все свои нейроны («плотная» модель), то MoE-модель активирует только малую часть своих мощностей («разреженная» модель). «Экспертами» в модели называют отдельные подсети, каждая из которых «учится» обрабатывать определенные типы данных. Один «эксперт» может хорошо разбираться в программировании, другой — в биологии, третий — в написании деловых писем.

Серажим отметила, что MoE позволяет задействовать только часть модели для генерации каждого следующего токена, что ускоряет работу и повышает эффективность.

«В Поиске модель должна одновременно работать с большим объемом данных и укладываться в жесткие ограничения по скорости и стоимости на каждом запросе. Нам удалось модифицировать архитектуру, добавив слои MoE. В совокупности все улучшения, включая создание гибридной архитектуры, позволили нам повысить качество и совокупно снизить стоимость инференса в три раза. В результате покрытие ИИ-ответами в Поиске (доля запросов, на которые Поиск сразу даёт генеративный ответ) выросло за год в 1,5 раза», — подытожила она. Инференсом в данном контексте называют процесс работы нейросети над генеративным ответом пользователю, задающему вопрос в поисковике.

Внедрение компанией сочетания архитектур MoE и «энкодер-декодер» из научных исследований в промышленный поиск показывает, как такие разработки переходят в практическое применение — уже с учетом жестких требований к скорости, стабильности и стоимости инфраструктуры.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
21 мая, 22:15
Александр Березин

Стартовое окно для крупнейшей ракеты в земной истории откроется 22 мая, в 01:30 ночи по московскому времени. Прямая трансляция начнется примерно за час до запуска. Вероятность переноса по причине погоды довольно велика, и все же крайне важный для современной космонавтики пуск может состояться этой ночью.

21 мая, 16:54
ЮФУ

Астрофизики Южного федерального университета предложили объяснение одной из самых интригующих загадок современной физики — годичных колебаний сигнала в детекторе DAMA/LIBRA, который вот уже почти тридцать лет регистрирует странные сигналы в подземной лаборатории Гран-Сассо в Италии, интерпретируемые как взаимодействие частиц темной материи с обычным веществом.

21 мая, 15:26
ФизТех

Физик-теоретик Сергей Вергелес, доцент МФТИ, старший научный сотрудник Института теоретической физики им. Л. Д. Ландау РАН предложил новый подход к объяснению барионной асимметрии — через дискретную симметрию Z4 в решеточной теории гравитации.

17 мая, 10:35
Игорь Байдов

В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.

17 мая, 10:00
Evgenia Vavilova

При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.

18 мая, 09:10
Лена

Во всем мире во всех человеческих культурах около 90% людей пользуются преимущественно правой рукой. Такое поразительное единство практически всего человечества не имеет аналогов среди приматов и до сих пор остается эволюционной загадкой. Ученые проанализировали данные о более чем двух тысячах человекообразных обезьянах и выяснили, когда и почему праворукость стала популяционной тенденцией.

23 апреля, 18:34
Александр Березин

В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.

17 мая, 10:35
Игорь Байдов

В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.

23 апреля, 12:08
Любовь С.

Астроциты — клетки, которые долго считались лишь «помощниками» нейронов — оказались частью скрытой системы связи в мозге. Они, как показали результаты нового исследования, формируют собственные протяженные сети, соединяющие разные части головного мозга. Это открытие меняет представление о том, как мозг координирует свою работу, адаптируется к новым условиям и восстанавливается после повреждений.

[miniorange_social_login]

Комментарии

3 Комментария
Пользуюсь только Google поисковиком и AI-нейросетью там в поисковике (на базе Gemini Flash). Ищет точнее по запросу, что критично для точных данных и программирования. Эта нейосеть великолепна, работает по актуальным данным (что критично при запросах по программированию, когда обычные нейросети имеют устаревшие нерабочие данные об API библиотек). Для более сложных запросов есть другие нейросети. +Есть Google Books. Лет 10 назад я очень радовался внедрению нейросети в Яндекс Поиск (в обработку семантики запроса, не путать с ответами нейросети). Была патриотичная гордость. Но всё превратилось в рекламно-пропагандную помойку, дзен-маилсру-чебурнет. Пользоваться невозможно. Да и многие разрабы Яндекса свалили за границу, не говоря про то, что домен яндекса увел dzen, превратив в ту самую помойку. Алиса...😏 Для простых общих запросов для народа, как национальная нейросеть... возможно. Но для вопросов по делу - совершенно бесполезна, только тратит время. Для программирования и картинок тот же GigaChat/GigaCode лучше и бесплатные китайцы (DeepSeek, GLM, Qwen). Блин, она даже фильмы, песни и обществ.движения 2000х годов найти не может по описанию... Только рекламу сует фигни всякой...🤬
-
1
+
Да ну. Как был бред на сложные и редкие запросы, так и есть. Причём, беда всех нейросетей, она ещё и подвирает, лишь бы угодить. Проблема то банальная. На простые и частые запросы есть ответы людей, которые нейросеть обобщает и выдаёт. Но я и так могу найти нужную информацию, еë ведь полно. А вот редкий и сложный запрос нейросеть ставит в тупик и она начинает врать, лишь бы дать ответ.
К сожалению, Яндекс назвать мировой поисковой системой можно лишь условно. Да, он удобен, быстр и функционален, однако не все показанные в результатах поиска ссылки можно открыть. Хорошо это или плохо - не знаю.
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Комментарий на проверке

Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Авторизуясь, вы даете согласие на обработку персональных данных и подтверждаете ознакомление с Политикой.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно