В сервисах «Яндекса» с крупными каталогами объектов, в частности, в музыкальных службах, применяется особая рекомендательная технология под названием «Диско». Российская поисковая компания рассказала, как устроена эта система.
«Диско» генерирует рекомендации исходя из вкусов и предпочтений каждого конкретного веб-пользователя. Информацию о них система получает из нескольких источников. Во-первых, это поисковые запросы — они могут рассказать о текущих интересах. Во-вторых, анализируются данные от платформы «Крипта»: пол, примерный возраст и род занятий. Они позволяют не рекомендовать человеку то, что ему заведомо не понравится. Наконец, в-третьих, изучается информация от сервиса, для которого составляются рекомендации. Например, в «Маркете» это сведения о том, какие товары просматривал пользователь, а в «Музыке» и «Радио» — какие треки он слушал. Само собой, все данные обезличены.

Фотка


В процессе составления рекомендаций «Диско» использует три разных подхода. Первый опирается на информацию об объектах и связях между ними. Например, про любой музыкальный трек известно, на каком альбоме он вышел, кто его исполняет и к какому жанру он относится, а про любой товар — кто его производитель, каковы его характеристики и к какой категории товаров он принадлежит. Проанализировав связи, можно посоветовать пользователю объекты, родственные тому, чем он уже интересовался.
В основе второго подхода лежит информация о связях между людьми. Благодаря «Крипте» известны пол, примерный возраст и предположительный род занятий каждого пользователя. Установлено, что людей, у которых эти характеристики совпадают, часто интересуют одни и те же объекты. Даже если человек пользуется сервисом впервые и ещё не успел ничего посмотреть, послушать или приобрести, можно проверить, что смотрят, слушают или покупают люди со схожими характеристиками — и предложить ему эти же объекты.
Третий подход использует данные о взаимодействиях пользователей с объектами. Взаимодействием можно считать, например, факт просмотра видеоролика или оценку «нравится», поставленную музыкальному треку. Метод позволяет, опираясь на уже известные взаимодействия, предсказать, как пользователи отреагируют на те или иные объекты — например, какую оценку они поставят фильму, который пока не видели.
В общей сложности в «Диско» применяется несколько сотен рекомендательных моделей, построенных на основе описанных подходов. Все модели работают по-разному: одна составляет рекомендации с учётом музыкального жанра, вторая — с учётом бренда товаров, и так далее.

Фотка


Рекомендации от различных моделей обрабатывает система машинного обучения «Матрикснет». Её задача — составить сочетание рекомендаций, которое бы идеально соответствовало интересам пользователя в данный момент. Для этого во внимание принимается множество факторов. В результате формируется финальный список рекомендаций, который и видит пользователь.