• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
02.11.2016, 11:38
Редакция Naked Science
621

Поисковик «Яндекс» научился находить смысл

«Яндекс» объявил о запуске нового поискового алгоритма «Палех», который позволяет повысить релевантность поисковой выдачи по низкочастотным запросам. Об этом сообщается в блоге компании.

148597_02
©Wikipedia / Автор: Дмитрий Жуков

Работа современных поисковых систем основана на анализе ключевых слов. Получив информацию о содержании интернет-страницы, индексатор разбивает его на элементы — текст, заголовки, метатеги и другие — и сохраняет их в индексной базе. В ответ на запрос пользователя система проверяет базу на наличие подходящих сайтов и осуществляет их выдачу в определенном порядке. При этом порядок выдачи зависит от степени соответствия запросу, которая определяется по длине и сочетанию ключевых фраз, и частоте таких запросов от других пользователей. Поисковая выдача по длинным и нестандартным запросам часто имеет низкую релевантность.

 

Для повышения такой релевантности компания использовала поисковую модель на искусственных нейросетях. Алгоритм одновременно сопоставляет запрос и индексную базу по формальному (ключевые слова) и семантическому признакам. Это позволяет выявить соответствия, даже если в запросе и базе нет общих ключевых слов или запрос и база соответствуют только формально. Пополнение таких ассоциаций происходит за счет машинного обучения, а его результатом является трехсотмерный семантический вектор.

 

Поисковик «Яндекс» научился находить смысл – иллюстрация к материалу на Naked Science

Пример построения семантического вектора «Палех» в двухмерном пространстве. / © «Яндекс», 2016

 

По данным компании, пока алгоритм строит семантические векторы только по заголовкам страниц. Потенциально он может сопоставлять запрос с полным текстовым содержанием страницы, а также составлять профиль интернет-пользователя исходя из его действий.

 

Подробностями проекта с Naked Science поделился представитель «Яндекса» Алексей Гусаков:

 

«Самая интересная часть всей нашей истории про нейросети в поиске — это семантический вектор. Так мы назвали новый способ обработки запроса и его сопоставление с вероятными ответами. Дело в том, что компьютеру проще работать с числами, чем с буквами, поэтому поиск соответствий между запросами и веб-страницами сводится к сравнению чисел. С помощью нейронной сети мы перевели заголовки веб-страниц в числа, а точнее — в группы из трехсот чисел каждая. В результате документы из базы данных «Яндекса» получили координаты в трехсотмерном пространстве. Представляя запрос и веб-страницу в виде вектора в трехсотмерном пространстве, мы можем понять, что они хорошо соответствуют друг другу, даже если у них нет ни одного общего слова. Семантический вектор мы используем не только в поиске «Яндекса», но и в «Картинках», а в будущем мы планируем переводить в такие векторы не только заголовки, но и полные тексты документов — это еще сильнее улучшит нашу выдачу».

 

Новый поисковый алгоритм назван в честь российского поселка Палех, известного палехскими миниатюрами. Для этого народного промысла характерно нанесение рисунка (иконы или сюжета из сказки) темперой на папье-маше, а одним из самых популярных персонажей миниатюр является Жар-птица. «Яндекс» использует изображение Жар-птицы как иллюстрацию распределения частотности запросов: высокочастотные (небольшое количество, но часто встречаются) соответствуют короткому клюву, среднечастотные — крупному туловищу, низкочастотные и редкие — длинному и витиеватому хвосту.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
15 декабря, 11:02
Игорь Байдов

Акведуки, дороги, бани и города, которые римляне построили на оккупированных территориях, часто воспринимаются историками как символ прогресса. Но археологические раскопки, проведенные учеными из Великобритании, открыли обратную, мрачную сторону этого «развития». Оказалось, римское владычество на несколько поколений подорвало здоровье местного населения, особенно тех, кто жил в административных центрах. Исследователи увидели эту печальную картину в костях наиболее уязвимых групп населения — женщин и детей, которые первыми реагируют на ухудшение условий жизни.

15 декабря, 08:10
Любовь С.

В конце 2025 года Национальные академии наук, инженерии и медицины США представили доклад, посвященный будущим пилотируемым миссиям к Марсу. В документе подробно описаны причины, по которым людям стоит отправиться на Красную планету, а также технологии, способные приблизить человечество к первой высадке.

13 декабря, 14:51
Игорь Байдов

На Красной планете ученые нашли предполагаемую «каменную летопись» древних приливов. Эту запись могла оставить не существующая сегодня сила — гравитация луны, которая когда-то красовалась в марсианском небе и управляла «ритмом» морей.

15 декабря, 11:02
Игорь Байдов

Акведуки, дороги, бани и города, которые римляне построили на оккупированных территориях, часто воспринимаются историками как символ прогресса. Но археологические раскопки, проведенные учеными из Великобритании, открыли обратную, мрачную сторону этого «развития». Оказалось, римское владычество на несколько поколений подорвало здоровье местного населения, особенно тех, кто жил в административных центрах. Исследователи увидели эту печальную картину в костях наиболее уязвимых групп населения — женщин и детей, которые первыми реагируют на ухудшение условий жизни.

12 декабря, 13:48
Игорь Байдов

У побережья Канады морские биологи стали свидетелями необычного случая. Косатки и дельфины объединили свои силы, чтобы вместе охотиться на тихоокеанского лосося. Они погружались в темные глубины, а после удачной охоты делились пищей. Это первое задокументированное охотничье сотрудничество между двумя видами морских млекопитающих.

15 декабря, 08:10
Любовь С.

В конце 2025 года Национальные академии наук, инженерии и медицины США представили доклад, посвященный будущим пилотируемым миссиям к Марсу. В документе подробно описаны причины, по которым людям стоит отправиться на Красную планету, а также технологии, способные приблизить человечество к первой высадке.

8 декабря, 13:09
Александр Березин

С 2010-х в «Роскосмосе» говорили: будущая РОС сможет пролетать над полюсом, что даст ей возможности для новых научных экспериментов. Но вскоре после того, как в ноябре 2025 года Россия временно лишилась возможности запускать людей в космос, эта позиция изменилась. В результате запускать космонавтов с космодромов нашей страны станет довольно сложно.

29 ноября, 12:42
Александр Березин

Позавчера, 27 ноября 2025 года, при запуске космонавтов к МКС на стартовую площадку № 31 упала кабина обслуживания стартового комплекса. Это означает, что новые пуски оттуда до починки невозможны. К сожалению, в 2010-х годах, в рамках «оптимизации» расходов, резервную площадку (с которой летал Юрий Гагарин) упразднили. Поэтому случилось беспрецедентное: в XXI веке страна с пилотируемой космической программой осталась без средств запуска людей на орбиту. Пока ремонт не закончится, проблема сохранится. Чем это может грозить?

27 ноября, 20:20
Максим Абдулаев

Японские биологи повторили античную технологию производства вина из изюма, чтобы выяснить механизм его брожения. Исследователи показали, что сушеный виноград, в отличие от свежего, накапливает на поверхности дикие дрожжи и способен превращать воду в алкоголь без внесения дополнительных заквасок.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно