摘要:MicroblogPCU是从新浪微博採集到的。它能够被用于研究机器学习方法和社会关系研究。
这个数据集被原作者用于探索微博中的spammers(发送垃圾信息的人)。他们的demo在这里
数据集的属性信息:
weibo_user.csv
-user_id: 用户ID
-user_name: 用户昵称
-gender:性别,male,female。other
-class:账户级别
-message:账户注冊位置或其它个人信息
-post_num: 邮政编码
-follower_num: followers的数量
-followee_num: followee的数量
-follow ratio: followee_num/follower_num;
-is_spammer: manually annotated label, 1 表示 spammer,0 表示 non-spammer;
user_post.csv
-post_id:微博的ID
-post_time:公布时间
-poster_id: 公布用户的ID