Правила применения рекомендательных технологий в НИУ ВШЭ

Редакция от 11.09.2023

Настоящие правила регулируют применение рекомендательных технологий на официальном сайте (портале) Национального исследовательского университета «Высшей школы экономики» (www.hse.ru).

С дополнительными вопросами о применении рекомендательных технологий Вы можете обратиться по адресу portal@hse.ru.

I. Виды сведений, относящихся к предпочтениям пользователей сети Интернет, которые используются для предоставления информации с применением рекомендательных технологий, источники получения таких сведений.

Используемые на портале рекомендательные модели обрабатывают данные о пользователях (посетителях) с помощью трекера НИУ ВШЭ, размещенного на портале (программное обеспечение, используемое для отслеживания действий пользователя). Хранение данных осуществляется на серверах НИУ ВШЭ.

Для обучения моделей используются следующие данные:

  • event_timestamp — время события;
  • event_name — название события;
  • event_value — значение события;
  • current_location — url страницы;
  • user_id — ID посетителя;

Под событием в терминах веб-аналитики подразумевается совершенное пользователем действие. Примером такого события может служить клик по элементам на сайте, прокрутка страницы до определенного места и т.д.

В рекомендательных моделях используется идентификатор пользователя, который представляет собой набор букв, цифр и спец. символов, например: ffa8be67-f454-444e-8194-9b536ba8cad8

На основе исходных данных выделяются типы взаимодействий пользователя со страницей на портале, такие как:

  • pageview — просмотр страницы;
  • something_clicked — клик по любому элементу на странице;
  • button_click — клик по кнопке;
  • tel_click — клик по номеру телефона;
  • email_click — клик по email адресу;
  • submit_form — отправка формы.

II. Описание процессов и методов сбора, систематизации, анализа сведений, относящихся к предпочтениям пользователей сети Интернет, предоставления информации на основе этих сведений, а также способов осуществления таких процессов и методов

После препроцессинга исходных данных создается разряженная сводная таблица с ID пользователей в строках и ID элементов в столбцах. Весь алгоритм строится на выполнении матричной факторизации созданной разряженной таблицы.

После матричной факторизации модель формирует компоненты, другими словами, сегменты принадлежности к той или иной группе и две матрицы сегментного представления элементов и пользователей.

После факторизации осуществляется попытка восстановить исходную матрицу, умножая ее множители. В полученной матрице осуществляется генерация прогнозов для элементов, с которыми пользователь еще не взаимодействовал, которые далее используются для формирования рекомендации.

Рекомендация для пользователя реализуется в виде списков единиц контента (рекомендованные новости, рекомендованные образовательные программы). Рекомендации дополняются уведомлением о применении в данном разделе портала рекомендательной технологии.