Нейросетям в «Яндекс Поиске» исполнилось 10 лет
«Яндекс» внедряет нейросетевые технологии с 2010-х годов — этому предшествовало много лет исследований в сфере машинного обучения. Со временем такие разработки сделали сервисы компании удобнее и быстрее: например, сегодня пользователи «Поиска» получают более подробные ответы на свои запросы, в которых могут комбинировать текст и изображение.
В поиске по загруженным изображениям «Яндекс» применил нейросети ровно 10 лет назад — 5 декабря 2014 года. С тех пор их стали использовать во многих областях: от ранжирования сайтов до перевода текстов и поиска объектов по фото. Нейросети эволюционировали, становились доступнее широкому кругу пользователей и компаний. К примеру, генеративные нейросети позволяют создавать изображения, тексты, видео и многое другое.
Однако распознавание и поиск изображений — не только похожих, но и близких по смыслу — не было первой функцией, в которую «Яндекс» добавил нейросеть. Еще в 2012 году компания использовала простую нейронную сеть для прогнозирования пробок на дорогах, а в 2013-м — для распознавания речи в технологии SpeechKit.
Затем, в 2015 году, в поиске по картинкам начали применять нейросети при обработке текстовых запросов. Если до этого релевантность изображения определяли по окружающему его тексту на сайте, новая модель позволила оценивать саму картинку, помещая в одно семантическое пространство с текстовым запросом.
В рамках поискового алгоритма «Палех» нейросети впервые использовали для ранжирования сайтов в 2016 году. Созданная «Яндексом» модель, подобная DSSM (Deep Semantic Similarity Model), помогала оценить смысловую связь между заголовками веб-страниц и запросами пользователей. Спустя еще год, в 2017-м, в обновлении «Королев» нейросеть начали применять к содержимому страниц, что улучшило качество ответа на уникальные запросы.
В 2020 году для ранжирования сайтов впервые использовали тяжелую нейронную сеть YATI (Yet Another Transformer with Improvements) — улучшенную версию «трансформера», адаптированную под «рантайм» «Поиска». Это обновление рекордно повысило качество ранжирования сайтов со времен внедрения «Матрикснета» в 2009 году.
В машинный перевод «Яндекс» ввел нейросети в 2017 году: благодаря этому «Переводчик» стал учитывать контекст и переводить фразы на его основе. Возможность перевода появилась и в «Поиске»: достаточно ввести запрос [translation перевод], чтобы получить мгновенный результат.
Полноценный переводной поиск «Яндекс» запустил в 2021 году: суть в том, что если подходящих результатов на русском языке не нашлось, система ищет их на англоязычных сайтах и предлагает переведенные варианты. В том же году появилась функция перевода видео в «Поиске» и «Браузере», что помогло расширить доступ к полезной информации, преодолевая языковые барьеры.
Главная цель «Поиска» — помощь пользователям в решении их задач. Для этого «Яндекс» выдает не только список сайтов, но и быстрый ответ на вопрос, причем дополненный ссылками на источники. Ранее для получения таких коротких ответов требовалась языковая модель YaLM, а с 2024 года, после внедрения нейросети нового поколения YandexGPT, поиск стал лучше справляться с анализом сложных вопросов и формированием точных ответов.
Помимо этого, в 2024-м «Яндекс» впервые добавил в поисковую систему мультимодальную VLM-нейросеть, объединяющую опыт работы с текстовыми и визуальными моделями. Теперь пользователи «Поиска» могут задавать вопросы, сочетающие текст и изображение, и получать подробные ответы.
Хотя сам факт наличия непонятных объектов на снимках, которые американские астронавты сделали на Луне, известен давно, десятилетиями их списывали на химические дефекты светочувствительной эмульсии фотопленки или блики света в линзах камер. Новая публикация на сайте Пентагона признает их реально существующими объектами, хотя и не делает выводов о их природе.
Крупные травоядные утконосые майазавры известны своим развитым социальным поведением. Они жили семьями и строили гнезда для своих детенышей. Даже название вида переводится с греческого языка как «ящер — хорошая мать». Исследование окаменелых зубов майазавров показало, что они выращивали детенышей совсем не так, как это считалось типичным для животных глубокой древности.
Десятого мая 1940 года вермахт пришел в движение. Через 42 суток англо-французские армии были разгромлены, а Франция капитулировала. Как это произошло, ведь союзники имели больше солдат, танков и пушек, чем немцы? В СССР причиной посчитали нежелание французов воевать, немцы же, говорили советские военные, не внесли в стратегию ничего нового. Реальность была строго обратной: разгром Франции был новым словом в войне, и такой же сценарий Гитлер применил против СССР через год. Что именно произошло и отчего советское руководство не смогло осознать случившееся?
Нейробиологи СПбГУ продемонстрировали, что активация рецептора следовых аминов TAAR1 эффективно подавляет агрессивное поведение, вызванное полным отсутствием серотонина в мозге. В дальнейшем этот результат поможет в разработке лекарственных препаратов, направленных на коррекцию патологических форм агрессии, возникающих при посттравматическом стрессовом расстройстве (ПТСР) и шизофрении.
Крупные травоядные утконосые майазавры известны своим развитым социальным поведением. Они жили семьями и строили гнезда для своих детенышей. Даже название вида переводится с греческого языка как «ящер — хорошая мать». Исследование окаменелых зубов майазавров показало, что они выращивали детенышей совсем не так, как это считалось типичным для животных глубокой древности.
Астрономы впервые использовали гравитационные волны, чтобы косвенно оценить параметры одного из ключевых процессов термоядерного горения в массивных светилах. Именно от него зависит, какие звезды взрываются, какие превращаются в черные дыры и как во Вселенной появляются углерод и кислород — элементы, без которых не было бы ни планет, ни жизни.
В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.
Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.
Термоядерные электростанции не смогут конкурировать по цене с возобновляемыми источниками энергии из-за медленного удешевления технологии. По расчетам, расходы на каждую новую установку падали максимум на 8% — много раз ниже ранних ожиданий венчурных инвесторов. Это перечеркивает экономический смысл финансовых вливаний, и мир может никогда не увидеть дешевой термоядерной энергии.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии