当前位置:   article > 正文

完整的虚假新闻检测数据集weibo_datasets_虚假信息识别 数据集

虚假信息识别 数据集

数据集概述:

这是一个示例数据集。推文被分为训练集和测试集。对于每个集合,分别有两个文件存储谣言和非谣言的推文。该数据集的正负样本数量相当,差不多3700+。真正的数据集就是tweets文件。每个txt文件中的数据格式如下:

  • line1: 推文ID|用户名|推文URL|用户URL|发布时间|是否原创|转发数|评论数|点赞数|用户ID|用户认证类型|用户粉丝数|用户关注数|用户推文数|发布平台
  • line2: 推文的图片。以下面这种形式组织“图片1 URL|图片2 URL|null”其中URL是图片的链接,null表示图片列表的结尾。
  • line3:推文内容(可能为空)
推荐阅读
相关标签