赞
踩
用户执行物品搜索,推荐系统根据情况返回推荐结果
长尾模式 | 实体和线上 |
---|---|
环境智能 = 普适计算 + 智能接口(比如个性化)
从简单到复杂
问题 | 详细描述 |
---|---|
收集矩阵的"已知"评分 | 如何收集Utility Matrix中的数据 |
从已知评级中推断未知评级 | 主要对高未知等级感兴趣,我们对了解自己不喜欢的东西并不感兴趣 |
评估外推方法 | 如何衡量推荐方法的成功/绩效 |
冷启动问题 | 对于长时间的系统没有影响,但是对于短时间(刚开始)的系统有着比较重要的预测作用 |
完成模型转换 | 用户往往没有直接的输入,不会直接表达兴趣 |
模糊的信息 | 比明确的资料要糟糕,有很多的用户、网页,并且用户的资料信息比较短 |
隐藏的网页 | 在互联网部分很多的网页是通过数据库查询而获取的,其重要性很难通过日志显示出来,不能无差别的推荐物品 |
->
评分矩阵稀疏->
推荐质量较差off-line | on-line |
---|---|
s i m ( x , y ) = ∑ s ∈ S x y ( r x s − r x ‾ ) ( r y s − r y ‾ ) ∑ s ∈ S x y ( r x s − r x ‾ ) 2 ∑ s ∈ S x y ( r y s − r y ‾ ) 2 sim(x,y) = \frac{\sum\limits_{s \in S_{xy}}(r_{xs} - \overline{r_x})(r_{ys} - \overline{r_y})}{\sqrt{\sum\limits_{s \in S_{xy}}(r_{xs} - \overline{r_x})^2 }\sqrt{\sum\limits_{s \in S_{xy}}(r_{ys} - \overline{r_y})^2}} sim(x,y)=s∈Sxy∑(rxs−rx)2 s∈Sxy∑(rys−ry)2 s∈Sxy∑(rxs−rx)(rys−ry)
直观地我们想要说明: S i m ( A , B ) > S i m ( A , C ) Sim(A, B) > Sim(A, C) Sim(A,B)>Sim(A,C)
r
x
i
=
1
k
∑
y
∈
N
r
y
i
r
x
i
=
∑
y
∈
N
s
x
y
∗
r
y
i
∑
y
∈
N
s
x
y
r x i = ∑ j ∈ N ( i ; x ) s i j ∗ r x j ∑ y ∈ N ( i ; x ) S i j r_{xi} = \frac{\sum\limits_{j \in N(i; x)} s_{ij} * r_{xj}}{\sum\limits_{y \in N(i; x)}S_{ij}} rxi=y∈N(i;x)∑Sijj∈N(i;x)∑sij∗rxj
B
e
f
o
r
e
:
r
x
i
=
∑
y
∈
N
s
x
y
∗
r
y
i
∑
y
∈
N
s
x
y
A
f
t
e
r
:
r
x
i
=
b
x
i
+
∑
j
∈
N
(
i
;
x
)
s
i
j
∗
(
r
x
j
−
b
x
j
)
∑
j
∈
N
(
i
;
x
)
s
i
j
b
x
i
=
μ
+
b
x
+
b
i
在实际生活中,我们可以观察到物品-物品通常比用户-用户更好地工作
因为物品更简单,而用户有很多的口味
适用于任何种类的物品:无需选择功能
对于文本信息提取的时候会使用到TF-IDF算法
往往是基于情景或者限制条件
s i m i l a r i t y ( P , R E Q ) = ∑ r ∈ R E Q w i ∗ s i m ( p , r ) ∑ r ∈ R E Q w r similarity(P, REQ) = \frac{\sum\limits_{r \in REQ} w_i * sim(p, r)}{\sum\limits_{r \in REQ w_r}} similarity(P,REQ)=r∈REQwr∑r∈REQ∑wi∗sim(p,r)
sim(p,REQ)
表示每个商品属性值
ϕ
(
p
)
\phi(p)
ϕ(p)与客户需求的距离
r
∈
R
E
Q
r \in REQ
r∈REQM A E = ∑ r i ∈ R ∑ k = 1 n β k ∗ ∣ r e c k ( u , i ) − r i ∣ ∣ R ∣ MAE = \frac{\sum\limits_{r_i \in R }\sum\limits_{k = 1}\limits^n \beta_k * |rec_k(u, i) - r_i|}{|R|} MAE=∣R∣ri∈R∑k=1∑nβk∗∣reck(u,i)−ri∣
下图中左侧红色框是权重,右侧红色框是MAE
∃ 1 k : 1... n r e c s w i t c h i n g ( u , i ) = r e c k ( u , i ) \exists_1 k:1...n\ rec_{switching}(u, i) = rec_k(u, i) ∃1k:1...n recswitching(u,i)=reck(u,i)
<score, k>
的集合r e c m i x e d = ⋃ k = 1 n < r e c k ( u , i ) , k > rec_{mixed} =\bigcup_{k = 1}^n<rec_k(u, i), k> recmixed=k=1⋃n<reck(u,i),k>
r e c c a s c a d e ( u , i ) = r e c u ( u , i ) rec_{cascade}(u, i) = rec_u(u, i) reccascade(u,i)=recu(u,i)
r
e
c
k
(
u
,
i
)
=
{
r
e
c
u
,
i
:
r
e
c
k
−
1
≠
0
0
:
o
t
h
e
r
w
i
s
e
rec_k(u,i) =
r e c m e t a − l e v e l ( u , i ) = r e c n ( u , i , △ r e c n − 1 ) rec_{meta-level}(u, i) = rec_{n}(u, i, \triangle_{rec_{n-1}}) recmeta−level(u,i)=recn(u,i,△recn−1)
->
信任-->
信任+通过使用推荐系统提高总体满意度
当前解释组件的主要设计维度
表征尺寸:
学科 | 在线客户,学生,基于足迹的在线进程、计算机 |
---|---|
研究方法 | 实验,准实验,非实验研究 |
设置 | 实验室,真实场景 |
P r e c i s i o n = t p t p + f p = ∣ 被 推 荐 的 好 电 影 ∣ ∣ 所 有 被 推 荐 的 ∣ Precision = \frac{tp}{tp + fp} = \frac{|被推荐的好电影|}{|所有被推荐的|} Precision=tp+fptp=∣所有被推荐的∣∣被推荐的好电影∣
召回:完整性的度量,确定所有相关项目中相关项目的分数:例如,所有推荐的好电影的推荐
R e c a l l = t p t p + f n = ∣ 被 推 荐 的 好 电 影 ∣ ∣ 所 有 好 电 影 ∣ Recall = \frac{tp}{tp + fn} = \frac{|被推荐的好电影|}{|所有好电影|} Recall=tp+fntp=∣所有好电影∣∣被推荐的好电影∣
F 1 = 2 ∗ p r e c i s i o n ∗ r e c a l l p r e c i s i o n + r e c a l l F_1 = 2 * \frac{precision * recall}{precision + recall} F1=2∗precision+recallprecision∗recall
排名指标可提高召回率和准确性,以考虑排名列表中正确项目的位置
M
A
E
=
1
n
∑
i
=
1
n
∣
p
i
−
r
i
∣
R
A
S
E
=
1
n
∑
i
=
1
n
(
p
i
−
r
i
)
2
离线实验 | 在线实验 |
---|---|
评级,交易 | 评分,反馈 |
历史数据,并非所有的推荐物品都是被评级的 | 在线数据,所有的推荐物品都是被评级了的 |
未评级的商品的未知,但是会被解释为坏的(默认假设是用户只会购买评分高的商品) | 未推荐的物品的好坏是未知的 |
如果默认假设不成立,真正性可能很小,真负性可能很小 | 假负性和真负性不能被确定 |
准确率偏高,召回率可能有多种情况 | 准确率尚可,召回率存疑 |
结果表明,对在线用户的行为缺乏准确性。
r x i ^ = ∑ j ∈ N ( i ; x ) s i j ∗ r x j ∑ j ∈ N ( i ; x ) s i j \hat{r_{xi}} = \frac{\sum\limits_{j \in N(i; x)}s_{ij} * r_{xj}}{\sum\limits_{j \in N(i; x)} s_{ij}} rxi^=j∈N(i;x)∑sijj∈N(i;x)∑sij∗rxj
r
x
i
^
=
b
x
i
+
∑
j
∈
N
(
i
;
x
)
s
i
j
∗
(
r
x
j
−
b
x
j
)
∑
j
∈
N
(
i
;
x
)
s
i
j
b
x
i
=
μ
+
b
x
+
b
i
r x i ^ = b x i + ∑ j ∈ N ( i ; x ) w i j ( r x j − b x j ) \hat{r_{xi}} = b_{xi} + \sum\limits_{j \in N(i;x)} w_{ij}(r_{xj} - b{xj}) rxi^=bxi+j∈N(i;x)∑wij(rxj−bxj)
J ( W ) = ∑ x , i ( [ b x i + ∑ j ∈ N ( i ; x ) w i j ( r x j − b x j ) ] − r x i ) 2 J(W) = \sum\limits_{x, i}([b_{xi} + \sum\limits_{j \in N(i; x)} w_{ij}(r_{xj} - b_{xj})]-r_{xi})^2 J(W)=x,i∑([bxi+j∈N(i;x)∑wij(rxj−bxj)]−rxi)2
▽
w
j
=
[
δ
J
(
w
)
δ
w
i
j
]
=
2
∑
x
,
i
(
[
b
x
i
+
∑
j
∈
N
(
i
;
x
)
w
i
j
(
r
x
j
−
b
x
j
)
]
−
r
x
i
)
(
r
x
i
−
b
x
j
)
f
o
r
j
∈
{
N
(
i
;
x
)
,
∀
i
,
∀
x
}
e
l
s
e
δ
J
(
w
)
δ
w
i
j
=
0
我们为每一个电影i,计算到 r x i r_{xi} rxi,对于每一个电影 j ∈ N ( i ; x ) j \in N(i;x) j∈N(i;x),我们计算梯度
到目前为止, r x i ^ = b x i + ∑ j ∈ N ( i ; x ) w i j ( r x j − b x j ) \widehat{r_{xi}} = b_{xi} + \sum\limits_{j \in N(i;x)} w_{ij}(r_{xj} - b_{xj}) rxi =bxi+j∈N(i;x)∑wij(rxj−bxj)\
之后:明确考虑潜在因子模型之间的相互关系,提取邻近电影的"区域"相关性
min P , Q ∑ t r a i n i n g ( r x i − q i p x ) 2 + [ λ 1 ∑ x ∣ ∣ p x ∣ ∣ 2 + λ 2 ∑ i ∣ ∣ q i ∣ ∣ 2 ] \min\limits_{P, Q} \sum\limits_{training}(r_{xi} - q_ip_x)^2 + [\lambda_1\sum_{x}||p_x||^2 +\lambda_2\sum\limits_{i}||q_i||^2] P,Qmintraining∑(rxi−qipx)2+[λ1x∑∣∣px∣∣2+λ2i∑∣∣qi∣∣2]
min P , Q ∑ t r a i n g ( r x i − q i p x ) 2 + [ λ 1 ∑ x ∣ ∣ p x ∣ ∣ 2 + λ 2 ∑ i ∣ ∣ q i ∣ ∣ 2 ] \min\limits_{P,Q}\sum\limits_{traing}(r_{xi} - q_{i}p_{x})^2 + [\lambda_{1}\sum\limits_{x}||p_x||^2 + \lambda_2\sum\limits_{i}||q_i||^2] P,Qmintraing∑(rxi−qipx)2+[λ1x∑∣∣px∣∣2+λ2i∑∣∣qi∣∣2]
r x i = μ ( O v e r a l l m e a n r a t i n g ) + b x ( B i a s f o r u s e r x r_{xi} = \mu(Overall\ mean\ rating) + b_x(Bias\ for\ user\ x rxi=μ(Overall mean rating)+bx(Bias for user x + b i ( B i a s f o r m o v i e i ) + q i ∗ p x ( U s e r − M o v i e I n t e r a c t i o n ) b_i(Bias\ for\ movie\ i) + q_i * p_x(User-Movie\ Interaction) bi(Bias for movie i)+qi∗px(User−Movie Interaction)
min Q , P ∑ ( x , i ) ∈ R ( r x i − ( μ + b x + b i + q i ∗ p x ) ) 2 + ( λ 1 ∑ i ∣ ∣ q i ∣ ∣ 2 + λ 2 ∑ x ∣ ∣ p x ∣ ∣ 2 + λ 3 ∑ x ∣ ∣ b x ∣ ∣ 2 + λ 4 ∑ i ∣ ∣ b i ∣ ∣ 2 ) \min_{Q,P}\sum_{(x, i)\in R}(r_{xi} - (\mu + b_x + b_i + q_i * p_x))^2 + (\lambda_1\sum\limits_{i}||q_i||^2 + \lambda_2\sum\limits_{x}||p_x||^2 + \lambda_3\sum\limits_x||b_x||^2 + \lambda_4\sum\limits_i||b_i||^2) Q,Pmin(x,i)∈R∑(rxi−(μ+bx+bi+qi∗px))2+(λ1i∑∣∣qi∣∣2+λ2x∑∣∣px∣∣2+λ3x∑∣∣bx∣∣2+λ4i∑∣∣bi∣∣2)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。