当前位置:   article > 正文

R语言618电商大数据文本分析LDA主题模型可视化报告

文本主题分析电商

原文链接:http://tecdat.cn/?p=1078

618购物狂欢节前后,网民较常搜索的关键词在微博、微信、新闻三大渠道的互联网数据表现,同时通过分析平台采集618相关媒体报道和消费者提及数据点击文末“阅读原文”获取完整代码数据)。

社交媒体指数趋势观察

c6a59281f41e9c19bf3a898681b70bb3.png

ce02221ddd138ff1a56f14a827e4b367.png

平台数据显示,5月30日起,网上关于618的讨论明显热烈起来。5月30日网上声量相关讨论的主贴有3130条,其中提及最多的是关于“零点,天猫打响618大战第一枪“、”天猫618掀价格战:大家电比京东贵我就赔!“内容的转发,从媒体源数据对比中可见,此话题在微信的传播速度稍快于微博。

数据显示,5月30日至6月6日期间,消费者讨论最多的关键词、声量第一的是”天猫“,天猫以声量数12275位居618关键词搜索榜首。而在618的网络声量中,天猫的相关讨论均占据了40%以上内容。

399cd9db48bb80045a050aece5bd8fcb.png

以微博为例,观察其用户活跃群体以女性较多,主要来自一/二线城市,他们关注的话题大多为购物等话题,日常分享女装化妆品等话题偏多,品牌通过与微博的合作,更易匹配到目标人群。

洞察销售数据

不仅买家们剁手不亦乐乎,卖家们也是八仙过海,花样百出。狂欢过后,理性的卖家逐渐发现,在电商平台上,并不是俺们家所有的商品都能搭上六一八的便车。那么,六一八销量与哪些因素有关?商家应选择怎样的促销策略?

为此,我们采集了线上电商平台的销售数据。从销量来看,这些产品有的成为爆款,有的却无人问津,甚至约有35.8%的产品销量为零。另外,从价格来看,大部分卖家经过历年六一八已经成为“老司机”,尽管也采取促销活动,但是降价甚微(约有84.9%的产品降价不超过10元)。

36a68344107be979696f818cb05c8c67.png

从品类销售上来看,女士类产品销售较好,其中女鞋、女装都提升明显。看来,剁手主力还是以女性消费者为主。


点击标题查阅往期内容

9d10658ffb6a0cd37d8a52cc504e6980.jpeg

NLP自然语言处理—主题模型LDA案例:挖掘人民网留言板文本数据

outside_default.png

左右滑动查看更多

outside_default.png

01

4db1bce7c8aba74da8046577cfa558fe.png

02

e9b7988dfb0f16f6c70d3c3dc20e5722.png

03

15f275ce5d9858bdd195397f3b6a219f.png

04

2c135b7b4389f2dd126e77946b614631.png

cc785a4f2081030b42e806cbf29b022c.png

另外,从价格来看,大部分卖家经过历年双十一已经成为“老司机”,尽管也采取促销活动,但是降价很少(约有20%的产品没有降价),从销量和降价的关系来看,通过降价来促销的效果甚微。

0434be9abc024ee36aafa88f4041f954.png

从不同维度的评分来看,消费者对卖家的服务态度满意程度最高,然而降价的幅度显然没有达到他们的预期。

女性消费者都喜欢买什么东西呢?通过简单的分词、词频统计,我们能够发现,在双十一期间销售量>0的商品中,出现了“夏季”、“清凉” 这样的季节性词汇;同时,也有“新款”、“韩版”、“时尚”这样的款式热词。

2b1de9bbce53fc3b9850a881fa65872c.png


机器学习促销策略--LDA主题模型

主题模型(topic modeling)是一种常见的机器学习应用,主要用于对文本进行分类。形象来说,主题就是一个桶,里面装了出现概率较高的单词,这些单词与这个主题有很强的相关性。

如果机器能理解这个隐含语义,就能展示相应的广告——这样点击率会更高。在广告、搜索和推荐中,最重要的问题之一就是理解用户兴趣以及页面、广告、商品等的隐含语义。

269705557e6dfef5a8d4363929d80337.png

fd470cb3e08939cb5d89d7029741467a.png

通过对商品关键词使用LDA建模,我们得到模型有3个主题,主题1关于材质(主要的词为麝皮、山羊绒等),主题2关于风格(主要的词为商务、韩版等),主题3关于颜色(主要的词为咖啡色、蓝色等)。通过机器理解的隐含语义,我们就能展示相应的广告,从而提高点击率。


结语

不论是近期的“天猫618”还是“京东618节”,众多电商巨头及品牌齐聚,正如马爸爸提出的,我们都处在一个全新的零售时代,正在逐步预见着消费需求的变化,在同质化严重的当下,如何走进消费者并赢得关注是每个品牌都非常重要的课题。


d5ef17f54c3a8529f15732edd80271a1.jpeg

点击文末“阅读原文”

获取全文完整代码数据资料。

本文选自《618电商大数据分析可视化报告》。

点击标题查阅往期内容

Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集

自然语言处理NLP:主题LDA、情感分析疫情下的新闻文本数据

R语言对NASA元数据进行文本挖掘的主题建模分析

R语言文本挖掘、情感分析和可视化哈利波特小说文本数据

Python、R对小说进行文本挖掘和层次聚类可视化分析案例

用于NLP的Python:使用Keras进行深度学习文本生成

长短期记忆网络LSTM在时间序列预测和文本分类中的应用

用Rapidminer做文本挖掘的应用:情感分析

R语言文本挖掘tf-idf,主题建模,情感分析,n-gram建模研究

R语言对推特twitter数据进行文本情感分析

Python使用神经网络进行简单文本分类

用于NLP的Python:使用Keras的多标签文本LSTM神经网络分类

R语言文本挖掘使用tf-idf分析NASA元数据的关键字

R语言NLP案例:LDA主题文本挖掘优惠券推荐网站数据

Python使用神经网络进行简单文本分类

R语言自然语言处理(NLP):情感分析新闻文本数据

Python、R对小说进行文本挖掘和层次聚类可视化分析案例

R语言对推特twitter数据进行文本情感分析

R语言中的LDA模型:对文本数据进行主题模型topic modeling分析

R语言文本主题模型之潜在语义分析(LDA:Latent Dirichlet Allocation)

95af8f85bdde3fc2fba2f34488e8fc35.png

e35cb4d9d8f164dab10086f7fc08b791.jpeg

c267421aa8b0c493e9b212e3427a9343.png

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/712171
推荐阅读
相关标签
  

闽ICP备14008679号