Правила применения рекомендательных технологий в НИУ ВШЭ
Редакция от 11.09.2023
Настоящие правила регулируют применение рекомендательных технологий на официальном сайте (портале) Национального исследовательского университета «Высшей школы экономики» (www.hse.ru).
С дополнительными вопросами о применении рекомендательных технологий Вы можете обратиться по адресу portal@hse.ru.
I. Виды сведений, относящихся к предпочтениям пользователей сети Интернет, которые используются для предоставления информации с применением рекомендательных технологий, источники получения таких сведений.
Используемые на портале рекомендательные модели обрабатывают данные о пользователях (посетителях) с помощью трекера НИУ ВШЭ, размещенного на портале (программное обеспечение, используемое для отслеживания действий пользователя). Хранение данных осуществляется на серверах НИУ ВШЭ.
Для обучения моделей используются следующие данные:
- event_timestamp — время события;
- event_name — название события;
- event_value — значение события;
- current_location — url страницы;
- user_id — ID посетителя;
Под событием в терминах веб-аналитики подразумевается совершенное пользователем действие. Примером такого события может служить клик по элементам на сайте, прокрутка страницы до определенного места и т.д.
В рекомендательных моделях используется идентификатор пользователя, который представляет собой набор букв, цифр и спец. символов, например: ffa8be67-f454-444e-8194-9b536ba8cad8
На основе исходных данных выделяются типы взаимодействий пользователя со страницей на портале, такие как:
- pageview — просмотр страницы;
- something_clicked — клик по любому элементу на странице;
- button_click — клик по кнопке;
- tel_click — клик по номеру телефона;
- email_click — клик по email адресу;
- submit_form — отправка формы.
II. Описание процессов и методов сбора, систематизации, анализа сведений, относящихся к предпочтениям пользователей сети Интернет, предоставления информации на основе этих сведений, а также способов осуществления таких процессов и методов
После препроцессинга исходных данных создается разряженная сводная таблица с ID пользователей в строках и ID элементов в столбцах. Весь алгоритм строится на выполнении матричной факторизации созданной разряженной таблицы.
После матричной факторизации модель формирует компоненты, другими словами, сегменты принадлежности к той или иной группе и две матрицы сегментного представления элементов и пользователей.
После факторизации осуществляется попытка восстановить исходную матрицу, умножая ее множители. В полученной матрице осуществляется генерация прогнозов для элементов, с которыми пользователь еще не взаимодействовал, которые далее используются для формирования рекомендации.
Рекомендация для пользователя реализуется в виде списков единиц контента (рекомендованные новости, рекомендованные образовательные программы). Рекомендации дополняются уведомлением о применении в данном разделе портала рекомендательной технологии.