赞
踩
主要从三个角度(最近时间,行为频度,行为稳定性)来刻画用户的活跃度,和上面类似。
和上面类似。
主要用来刻画用户的一些属性特征包括性别、年龄、学历以及使用机型等。
和上面类似。
和上面类似。
tf-idf
(
t
,
d
)
=
tf
(
t
,
d
)
×
idf
(
t
)
\operatorname{tf-idf}(\mathrm{t}, \mathrm{d})=\operatorname{tf}(\mathrm{t}, \mathrm{d}) \times \operatorname{idf}(\mathrm{t})
tf-idf(t,d)=tf(t,d)×idf(t)
idf
(
t
)
=
log
1
+
n
1
+
df
(
t
)
+
1
\operatorname{idf}(t)=\log \frac{1+n}{1+\operatorname{df}(t)}+1
idf(t)=log1+df(t)1+n+1
先选择后训练。按照评估准则对各个特征进行评分,然后按照筛选准则来选择特征。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。