Запись перенесена в личный блог модератором.

guest перенес эту запись

Яндекс запустил новый поисковый алгоритм «Палех»

Яндекс запустил новый поисковый алгоритм «Палех», в основе которого лежат нейронные сети. Благодаря «Палеху» Яндекс стал лучше подбирать ответы на редкие и уникальные поисковые запросы. Такие запросы редко повторяются, но в совокупности их очень много — около ста миллионов в день.

При подборе ответов на запросы поисковые системы используют ключевые слова. Если слова из запроса есть на веб-странице, то она, вероятно, будет интересна пользователю. Но только на слова опираться нельзя: один и тот же смысл можно выразить совершенно по-разному. Тогда на помощь приходят дополнительные данные, например обезличенная статистика: на какие страницы перешли пользователи, задавшие такой же запрос. В случае с уникальными запросами статистики мало или нет вовсе — а значит, поиску труднее понять, какие страницы хорошо отвечают на запрос, а какие нет.

Поисковая модель на нейронных сетях, которую использует «Палех», умеет устанавливать смысловые соответствия между поисковым запросом и заголовками веб-страниц. С её помощью можно выявить, что в запросе и на странице говорится об одном и том же, даже если у них нет общих ключевых слов. Так, поиск поймёт, что в запросе [фильм про человека который выращивал картошку на другой планете] речь идёт о «Марсианине», хотя релевантные страницы могут и не содержать слов «картошка» или «планета».

Редкие и уникальные запросы составляют почти треть всего потока поисковых запросов, поэтому иногда их называют «длинным хвостом» поиска. Новому алгоритму решили дать название «Палех» в честь Жар-птицы — сказочной птицы с длинным хвостом, которая часто появляется в сюжетах палехской миниатюры.

Искусственные нейронные сети — один из методов машинного обучения. Он показывает отличные результаты в анализе естественной информации: изображений, звука, текста. В Яндексе нейронные сети задействованы в поиске по картинкам и смежных задачах — например, модерации рекламных объявлений и фильтрации взрослого контента. На их основе также построены модели, отвечающие за распознавание речи. Далекая, но чрезвычайно интересная цель поиска Яндекса состоит в том, чтобы получить на основе нейронных сетей модели, способные «понимать» семантическое соответствие запросов и документов на уровне, сравнимом с уровнем человека.

  • 6
    Нет аватара guest
    04.11.1615:30:36

    Есть компания, созданная русскими людьми на русские деньги, которая работает в Москве, в которой 2500 работникам платят зарплату, платят налоги с этой зарплаты; работающая в России и создающая продукт для России. Эта компания называется российской. При этом она инкорпорирована за границей. Иностранные акционеры вследствие отсутствия правильного закона об акционерных компаниях в России боятся создавать тут юридическое лицо.

    Илья Сегалович, один из основателей Яндекс.

    • Комментарий удален
      • 4
        Нет аватара guest
        04.11.1617:46:36

        У Вашего предприятия тоже есть иностранные акционеры?

        То о чем статья — сделано русскими программистами здесь.

        Если новости о сборке какой-нить китайщины в России достойны быть названными «Сделанными у нас». То эта и подавно.

        Отредактировано: Антон Смоленский~19:52 04.11.16
        • 0
          shigorin shigorin
          05.11.1620:00:20

          Яндекс из-за своего западничества сам некисло пострадал, много народу после IPO «свалило» во всякие Брно.

Написать комментарий
Отмена
Для комментирования вам необходимо зарегистрироваться и войти на сайт,