Самый большой научпоп канал
Подписаться
  • Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
05.12.2024
Мария Азарова
6 289

Нейросетям в «Яндекс Поиске» исполнилось 10 лет

4.3

«Яндекс» внедряет нейросетевые технологии с 2010-х годов — этому предшествовало много лет исследований в сфере машинного обучения. Со временем такие разработки сделали сервисы компании удобнее и быстрее: например, сегодня пользователи «Поиска» получают более подробные ответы на свои запросы, в которых могут комбинировать текст и изображение.

05.12.2018. Russia. Moscow. Yandex has officially unveiled its first smartphone, Yandex.Phone. Sergey Bulkin/NEWS.ru

В поиске по загруженным изображениям «Яндекс» применил нейросети ровно 10 лет назад — 5 декабря 2014 года. С тех пор их стали использовать во многих областях: от ранжирования сайтов до перевода текстов и поиска объектов по фото. Нейросети эволюционировали, становились доступнее широкому кругу пользователей и компаний. К примеру, генеративные нейросети позволяют создавать изображения, тексты, видео и многое другое. 

Однако распознавание и поиск изображений — не только похожих, но и близких по смыслу — не было первой функцией, в которую «Яндекс» добавил нейросеть. Еще в 2012 году компания использовала простую нейронную сеть для прогнозирования пробок на дорогах, а в 2013-м — для распознавания речи в технологии SpeechKit.

Затем, в 2015 году, в поиске по картинкам начали применять нейросети при обработке текстовых запросов. Если до этого релевантность изображения определяли по окружающему его тексту на сайте, новая модель позволила оценивать саму картинку, помещая в одно семантическое пространство с текстовым запросом. 

В рамках поискового алгоритма «Палех» нейросети впервые использовали для ранжирования сайтов в 2016 году. Созданная «Яндексом» модель, подобная DSSM (Deep Semantic Similarity Model), помогала оценить смысловую связь между заголовками веб-страниц и запросами пользователей. Спустя еще год, в 2017-м, в обновлении «Королев» нейросеть начали применять к содержимому страниц, что улучшило качество ответа на уникальные запросы.

В 2020 году для ранжирования сайтов впервые использовали тяжелую нейронную сеть YATI (Yet Another Transformer with Improvements) — улучшенную версию «трансформера», адаптированную под «рантайм» «Поиска». Это обновление рекордно повысило качество ранжирования сайтов со времен внедрения «Матрикснета» в 2009 году. 

В машинный перевод «Яндекс» ввел нейросети в 2017 году: благодаря этому «Переводчик» стал учитывать контекст и переводить фразы на его основе. Возможность перевода появилась и в «Поиске»: достаточно ввести запрос [translation перевод], чтобы получить мгновенный результат.

Полноценный переводной поиск «Яндекс» запустил в 2021 году: суть в том, что если подходящих результатов на русском языке не нашлось, система ищет их на англоязычных сайтах и предлагает переведенные варианты. В том же году появилась функция перевода видео в «Поиске» и «Браузере», что помогло расширить доступ к полезной информации, преодолевая языковые барьеры. 

Главная цель «Поиска» — помощь пользователям в решении их задач. Для этого «Яндекс» выдает не только список сайтов, но и быстрый ответ на вопрос, причем дополненный ссылками на источники. Ранее для получения таких коротких ответов требовалась языковая модель YaLM, а с 2024 года, после внедрения нейросети нового поколения YandexGPT, поиск стал лучше справляться с анализом сложных вопросов и формированием точных ответов.

Помимо этого, в 2024-м «Яндекс» впервые добавил в поисковую систему мультимодальную VLM-нейросеть, объединяющую опыт работы с текстовыми и визуальными моделями. Теперь пользователи «Поиска» могут задавать вопросы, сочетающие текст и изображение, и получать подробные ответы.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
Позавчера, 10:20
Редакция Naked Science

Онлайн-шопинг, доставка еды, мобильный банкинг и стриминг кино — часть повседневности. Мы почти не задумываемся, что делает все это возможным. Ответ — облачные технологии. За каждой покупкой, переводом или просмотром фильма работает невидимая инфраструктура, без которой современные цифровые сервисы попросту остановились бы. Рассказываем, как облака изменили нашу цифровую жизнь и стали незаметным мотором современной экономики.

Вчера, 21:01
Юлия Трепалина

Анализ более двух миллионов карт пациентов британских ветеринарных клиник показал, какие псы имеют повышенный риск острых кишечных расстройств — одной из распространенных проблем со здоровьем у четвероногих друзей человека.

6 часов назад
Александр Березин

В рамках новой модели вспышки сверхновых существенно нарушили парниковый эффект на нашей планете. Это должно приводить к похолоданиям и даже вымиранию отдельных видов.

9 июня
Александр Березин

2020-е годы показали, что любая система международной торговли может быть разрушена в кратчайшие сроки. Ученые решили выяснить, какие государства в таких условиях смогут прокормить свое население, а какие — не совсем. Лидером, что неожиданно, оказалось очень небольшое государство с населением менее миллиона человек.

9 июня
Адель Романенкова

Инженер Эррол Маск заявил, что одновременно с вопросом о межпланетном перелете автоматически возникает вопрос о возвращении астронавтов на Землю.

Позавчера, 10:20
Редакция Naked Science

Онлайн-шопинг, доставка еды, мобильный банкинг и стриминг кино — часть повседневности. Мы почти не задумываемся, что делает все это возможным. Ответ — облачные технологии. За каждой покупкой, переводом или просмотром фильма работает невидимая инфраструктура, без которой современные цифровые сервисы попросту остановились бы. Рассказываем, как облака изменили нашу цифровую жизнь и стали незаметным мотором современной экономики.

5 июня
Александр Березин

Вид антилоп, с ледникового периода привыкший к массовым миграциям, пытается вернуться в свой исторический ареал, когда-то достигавший Днепра. Однако их нетипичные для травоядных привычки вызывают сильнейшее отторжение у сельских жителей, предлагающих массово уничтожать их с воздуха. С экологической точки зрения возвращение этих животных весьма желательно, но как примирить их с фермерами — неясно.

22 мая
ПНИПУ

Недавно вышел второй сезон сериала «Одни из нас» (TheLastofUs), созданного по сюжету популярнейшей видеоигры. Ученые Пермского Политеха решили разобраться, насколько реален сценарий грибной пандемии, превращающей людей зомби? Чем живет кордицепс и как он «ищет» своих жертв, действительно ли паразит способен эволюционировать настолько, чтобы поражать человеческий организм и подчинять себе его волю, был бы у людей шанс выжить, какие грибы уже поселились в наших телах и выручит ли нас иммунитет, сформированный тысячелетиями.

26 мая
Unitsky String Technologies Inc.

Казахстанский Алматы — город контрастов, где горы соседствуют с урбанистическими пейзажами, а бизнес-центры — с историческими кварталами. Неизменным остается одно — пробки. Ежедневно сюда приезжает более 700 тысяч автомобилей из пригородов, при этом в самом мегаполисе зарегистрировано порядка 600 тысяч транспортных средств. В результате по улицам ежедневно движется более миллиона транспортных средств.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно