素性ベクトルベース

素性ベクトルベース#

アイテム素性ベクトル#

アイテムの特徴を表すベクトルを構成する方法はいくつかある。

古典的・シンプルな方法だと

  • カテゴリ化:商品や記事のカテゴリ、タグなど

  • bag-of-words:(テキストを含むデータの場合)単語の出現の有無\(\{0,1\}\)やTF-IDFなどでテキストをベクトルにする。

  • トピックモデリング:(テキストを含むデータの場合)アイテム\(j\)がトピック\(k\)に属する確率を推定

ユーザー素性ベクトル#

ユーザーの特徴のベクトルを作るには、例えば次のような情報が使われる

  • ユーザーが入力した「興味のあるカテゴリ」の情報

  • 過去に「いいね」やクリックしたコンテンツの情報

  • 年齢、性別、職業、地域などの属性情報

  • Webサイト内での利用回数

  • 検索履歴

  • 現在位置