赞
踩
快速数据分析的策略流程:
- 1.确定指标变量,也就确定了数据分析想要回答的问题。想回答不同的问题,就选择不同的指标变量。
- 变量筛选方法选出指标变量相关的变量;
- 针对筛选出的变量进行描述性分析和因果关系的分析。
短视频媒体目前是一个重要的信息来源,不仅仅是娱乐休闲方面的知识,还包括严肃的知识类的信息,可以对人们的行为产生潜在的影响。但是,短视频媒体上缺乏对信息内容本事和提供信息人员资格的的审核与认证,导致一些信息的内容存在偏差,甚至虚假,而对用户行为产生误导。在重要的公众事件中,比如COVID,短视频媒体是如何影响用户的行为,值得关注和分析,有助于我们正确看待短视频媒体带来的信息。
为了回答COVID相关短视频的哪些属性可以导致用于行为的改变,指标变量确定为“behavior_change”,行为改变。
Boruta法准确,快捷,一步可以实现变量的筛选,是快速数据分析策略的关键步骤之一。传统的变量筛选的方法,比如参数过滤法,逐步法,Lasso法等,过程较多,不够快捷,需要花费很多的时间用于参数的探索。另外,称之为快速数据分析策略的另一个原因是,仅仅对筛选出的变量进行分析,而舍弃其它不相关的变量。
这里筛选出了两种变量是与指标变量相关的。一个是视频的观看数、点赞数和评论数,另一种是特定内容的视频,比如讨论COVID预防的视频,其它的,像是否是官方来源却对指标变量影响不大。还有一些有趣的结果,比如含有幽默成份的视频和发布者为女性的视频不容易对用户行为造成影响。
快递数据分析的策略,特点是通过准确的变量筛选,迅速的把注意力集中到相关的变量上,最终快速得出结论,可能是数据分析过程的趋势之一。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。