• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
05.12.2024
Мария Азарова
6 290

Нейросетям в «Яндекс Поиске» исполнилось 10 лет

❋ 4.3

«Яндекс» внедряет нейросетевые технологии с 2010-х годов — этому предшествовало много лет исследований в сфере машинного обучения. Со временем такие разработки сделали сервисы компании удобнее и быстрее: например, сегодня пользователи «Поиска» получают более подробные ответы на свои запросы, в которых могут комбинировать текст и изображение.

05.12.2018. Russia. Moscow. Yandex has officially unveiled its first smartphone, Yandex.Phone. Sergey Bulkin/NEWS.ru

В поиске по загруженным изображениям «Яндекс» применил нейросети ровно 10 лет назад — 5 декабря 2014 года. С тех пор их стали использовать во многих областях: от ранжирования сайтов до перевода текстов и поиска объектов по фото. Нейросети эволюционировали, становились доступнее широкому кругу пользователей и компаний. К примеру, генеративные нейросети позволяют создавать изображения, тексты, видео и многое другое. 

Однако распознавание и поиск изображений — не только похожих, но и близких по смыслу — не было первой функцией, в которую «Яндекс» добавил нейросеть. Еще в 2012 году компания использовала простую нейронную сеть для прогнозирования пробок на дорогах, а в 2013-м — для распознавания речи в технологии SpeechKit.

Затем, в 2015 году, в поиске по картинкам начали применять нейросети при обработке текстовых запросов. Если до этого релевантность изображения определяли по окружающему его тексту на сайте, новая модель позволила оценивать саму картинку, помещая в одно семантическое пространство с текстовым запросом. 

В рамках поискового алгоритма «Палех» нейросети впервые использовали для ранжирования сайтов в 2016 году. Созданная «Яндексом» модель, подобная DSSM (Deep Semantic Similarity Model), помогала оценить смысловую связь между заголовками веб-страниц и запросами пользователей. Спустя еще год, в 2017-м, в обновлении «Королев» нейросеть начали применять к содержимому страниц, что улучшило качество ответа на уникальные запросы.

В 2020 году для ранжирования сайтов впервые использовали тяжелую нейронную сеть YATI (Yet Another Transformer with Improvements) — улучшенную версию «трансформера», адаптированную под «рантайм» «Поиска». Это обновление рекордно повысило качество ранжирования сайтов со времен внедрения «Матрикснета» в 2009 году. 

В машинный перевод «Яндекс» ввел нейросети в 2017 году: благодаря этому «Переводчик» стал учитывать контекст и переводить фразы на его основе. Возможность перевода появилась и в «Поиске»: достаточно ввести запрос [translation перевод], чтобы получить мгновенный результат.

Полноценный переводной поиск «Яндекс» запустил в 2021 году: суть в том, что если подходящих результатов на русском языке не нашлось, система ищет их на англоязычных сайтах и предлагает переведенные варианты. В том же году появилась функция перевода видео в «Поиске» и «Браузере», что помогло расширить доступ к полезной информации, преодолевая языковые барьеры. 

Главная цель «Поиска» — помощь пользователям в решении их задач. Для этого «Яндекс» выдает не только список сайтов, но и быстрый ответ на вопрос, причем дополненный ссылками на источники. Ранее для получения таких коротких ответов требовалась языковая модель YaLM, а с 2024 года, после внедрения нейросети нового поколения YandexGPT, поиск стал лучше справляться с анализом сложных вопросов и формированием точных ответов.

Помимо этого, в 2024-м «Яндекс» впервые добавил в поисковую систему мультимодальную VLM-нейросеть, объединяющую опыт работы с текстовыми и визуальными моделями. Теперь пользователи «Поиска» могут задавать вопросы, сочетающие текст и изображение, и получать подробные ответы.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Сегодня, 15:35
Губкинский университет

Исследования ученых РГУ нефти и газа имени И. М. Губкина подтвердили, что технология производства авиационного топлива SAF из растительных лигноцеллюлозных отходов позволит снизить выбросы углекислого газа на 75% по сравнению с нефтяным керосином.

Сегодня, 11:17
Юлия Тарасова

Результаты эксперимента в США в будущем могут позволить добиться разрешения на использование отработанной конопли в качестве кормовой добавки в животноводстве.

Сегодня, 08:01
Адель Романова

На стыке трех литосферных плит у Красного моря заметили необычный вулканический процесс: где-то магма поднимается равномерным потоком, где-то — по частям. По мнению геологов, такой «пульс» вызван тем, что в некоторых местах магма с большим трудом пытается пробиться на поверхность.

28 июня, 18:58
Игорь Байдов

За последние 30 лет размер трески, обитающей в Балтийском море, значительно уменьшился. Если раньше рыбаки вылавливали из воды особей размером с маленького ребенка, то теперь добытая рыба легко помещается в ладонях. Авторы нового исследования винят в этом человека, который заставил один из видов эволюционировать в «карликов».

27 июня, 09:47
Авдей Палиш

Снимки с фотоловушек давно стали культурным явлением. Особенно забавными выглядят медведи. Мы с удовольствием смотрим на зверей, попавших в объектив камер в национальных парках: тигр украл фотоловушку, муравьед проехал верхом на муравьеде и так далее. Но не все животные настолько обаятельные. Ученые из США решили развить эмпатию к гремучим змеям, которых многие боятся. Для этого специалисты запустили трансляцию из «мегалогова», где рептилии отдыхают и рожают потомство.

29 июня, 17:23
Людмила Соколова

Чтобы понять, как часто за пределами Солнечной системы встречаются миры, похожие на Землю, ученые из Калифорнийского университета (США) провели статистический анализ 517 экзопланет. Результаты показали, что всего три мира, включая наш, соответствуют критериям потенциальной обитаемости. Наиболее перспективными из них оказались Kepler-22b и Kepler-538b.

25 июня, 15:19
ФизТех

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

5 июня, 13:20
Александр Березин

Вид антилоп, с ледникового периода привыкший к массовым миграциям, пытается вернуться в свой исторический ареал, когда-то достигавший Днепра. Однако их нетипичные для травоядных привычки вызывают сильнейшее отторжение у сельских жителей, предлагающих массово уничтожать их с воздуха. С экологической точки зрения возвращение этих животных весьма желательно, но как примирить их с фермерами — неясно.

19 июня, 13:42
ЮФУ

В ЮФУ придумали новый остроумный способ тестировать ИИ на способность работать в реальных ситуациях использования русского языка. Исследователи искусственного интеллекта из МИИ ИМ ЮФУ предлагают использовать интеллектуальные языковые игры, как пример — заставлять ИИ отвечать на вопросы из архива телевикторины «Что? Где? Когда?» и «Своей игры». Инициативу прокомментировал опытный игрок.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно