素性ベクトルベース#
アイテム素性ベクトル#
アイテムの特徴を表すベクトルを構成する方法はいくつかある。
古典的・シンプルな方法だと
カテゴリ化:商品や記事のカテゴリ、タグなど
bag-of-words:(テキストを含むデータの場合)単語の出現の有無\(\{0,1\}\)やTF-IDFなどでテキストをベクトルにする。
トピックモデリング:(テキストを含むデータの場合)アイテム\(j\)がトピック\(k\)に属する確率を推定
ユーザー素性ベクトル#
ユーザーの特徴のベクトルを作るには、例えば次のような情報が使われる
ユーザーが入力した「興味のあるカテゴリ」の情報
過去に「いいね」やクリックしたコンテンツの情報
年齢、性別、職業、地域などの属性情報
Webサイト内での利用回数
検索履歴
現在位置