Запись перенесена в личный блог модератором.

guest перенес эту запись

Яндекс запустил новый поисковый алгоритм «Палех»

Яндекс запустил новый поисковый алгоритм «Палех», в основе которого лежат нейронные сети. Благодаря «Палеху» Яндекс стал лучше подбирать ответы на редкие и уникальные поисковые запросы. Такие запросы редко повторяются, но в совокупности их очень много — около ста миллионов в день.

При подборе ответов на запросы поисковые системы используют ключевые слова. Если слова из запроса есть на веб-странице, то она, вероятно, будет интересна пользователю. Но только на слова опираться нельзя: один и тот же смысл можно выразить совершенно по-разному. Тогда на помощь приходят дополнительные данные, например обезличенная статистика: на какие страницы перешли пользователи, задавшие такой же запрос. В случае с уникальными запросами статистики мало или нет вовсе — а значит, поиску труднее понять, какие страницы хорошо отвечают на запрос, а какие нет.

Поисковая модель на нейронных сетях, которую использует «Палех», умеет устанавливать смысловые соответствия между поисковым запросом и заголовками веб-страниц. С её помощью можно выявить, что в запросе и на странице говорится об одном и том же, даже если у них нет общих ключевых слов. Так, поиск поймёт, что в запросе [фильм про человека который выращивал картошку на другой планете] речь идёт о «Марсианине», хотя релевантные страницы могут и не содержать слов «картошка» или «планета».

Редкие и уникальные запросы составляют почти треть всего потока поисковых запросов, поэтому иногда их называют «длинным хвостом» поиска. Новому алгоритму решили дать название «Палех» в честь Жар-птицы — сказочной птицы с длинным хвостом, которая часто появляется в сюжетах палехской миниатюры.

Искусственные нейронные сети — один из методов машинного обучения. Он показывает отличные результаты в анализе естественной информации: изображений, звука, текста. В Яндексе нейронные сети задействованы в поиске по картинкам и смежных задачах — например, модерации рекламных объявлений и фильтрации взрослого контента. На их основе также построены модели, отвечающие за распознавание речи. Далекая, но чрезвычайно интересная цель поиска Яндекса состоит в том, чтобы получить на основе нейронных сетей модели, способные «понимать» семантическое соответствие запросов и документов на уровне, сравнимом с уровнем человека.

  • 4
    Нет аватара Мастер
    04.11.1617:13:15

    Важно не то, где главный офис, а где юридическая регистрация. Если за рубежом, то это оффшор. Это как минимум часть налогов идет по месту регистрации, также, насколько знаю, они становятся подсудны местным судам, что означает, что на них может оказываться политическое влияние.

    А варгейминг раньше был зарегистрирован, кажется, в Лондоне, сейчас на Кипре.

    В России, кстати, за счет того, что в оффшоре большая часть частного бизнеса (раньше было примерно 85-90% среднего и крупного), бюджет теряет просто колоссальные деньги.

    Наш президент уже несколько лет пытается провести деоффшоризацию, т. е., чтобы российские компании, зарегистрированные за рубежом, зарегистрировались в России. Ничего не получается.

    Отредактировано: Мастер~19:20 04.11.16
Написать комментарий
Отмена
Для комментирования вам необходимо зарегистрироваться и войти на сайт,