赞
踩
# y轴数据
bar.add_yaxis(“”, list(reversed(v1)))
# 设置全局配置项,标题、工具箱(下载图片)、y轴分割线
bar.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V点赞数TOP10(亿)”, pos_left=“center”, pos_top=“18”),
toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),
xaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=True)))
# 设置系列配置项,标签样式
bar.set_series_opts(label_opts=opts.LabelOpts(is_show=True, position=“right”, color=“black”))
bar.reversal_axis()
bar.render(“抖音大V点赞数TOP10(亿).html”)
def create_cut_likes(df):
# 将数据分段
Bins = [0, 1000000, 5000000, 10000000, 25000000, 50000000, 100000000, 5000000000]
Labels = [‘0-100’, ‘100-500’, ‘500-1000’, ‘1000-2500’, ‘2500-5000’, ‘5000-10000’, ‘10000以上’]
len_stage = pd.cut(df[‘likes’], bins=Bins, labels=Labels).value_counts().sort_index()
# 获取数据
attr = len_stage.index.tolist()
v1 = len_stage.values.tolist()
# 生成柱状图
bar = Bar(init_opts=opts.InitOpts(width=“800px”, height=“400px”))
bar.add_xaxis(attr)
bar.add_yaxis(“”, v1)
bar.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V点赞数分布情况(万)”, pos_left=“center”, pos_top=“18”),
toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),
yaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=True)))
bar.set_series_opts(label_opts=opts.LabelOpts(is_show=True, position=“top”, color=“black”))
bar.render(“抖音大V点赞数分布情况(万).html”)
03 粉丝数
「人民日报」和「央视新闻」粉丝都破亿了。
和去年的抖音数据一对比,「热巴」还少了几十万的粉丝,陈赫倒是涨了不少粉丝。
今年直播带货火热,李佳琦排入前十,也不足为奇,毕竟带货一哥。
再来看一下大V们粉丝数的分布情况。
5000万以上56个,妥妥的大佬。
200w~500w的人数最多,好多一时爆火的博主,一段时间后也基本不怎么涨粉了。
可能都停留到了这里,比如小F以前刷过的「三支花」,想不明白这都能火…
这里的可视化代码和上面差不多,就不放出来了。
公众号回复「抖音」,即可获取完整代码!
04 评论数TOP10****
抖音视频的评论区也是比较有意思的地方。
比如刷剧催更的,「赶紧去更新,都过了十几分钟了,生产队的驴都不敢休息这么久」。
还有五只疯狂摇头的猫,也占领了评论区一段时间。
小F只能说,太魔性了~
总的来说,媒体类的视频评论较多。
05 分享数TOP10****
抖音的分享是视频对外传播的一个方法,可以让更多的人看到视频。
从数据上看,大家还是比较喜欢分享新闻类以及美食类的视频。
可能过年疫情,居家一个月的时间,除了葛优躺看新闻,就是吃吃吃。
每个人,也就都有了一个成为大厨的梦想。
06 各类型点赞数/粉丝数汇总分布图
记得曾经一位大佬说过,抖音这个产品是消磨你时间的(Kill Time),而不是节约时间(Save Time),技术稍微深一点的视频基本上生存不下去。
由上面的矩形树图可以知道,大家都喜欢「美女」类型的视频,毕竟谁不喜欢漂亮妹子呢~
比如说深情看铜人的妹子、高考送满天星的妹子,刀小刀等等,妹子爆火的视频太多了…
另外「搞笑」、「游戏」、「剧情」类的视频也比较吸引人,妥妥的Kill Time。
可视化代码如下。
def create_type_likes(df):
# 分组求和
likes_type_message = df.groupby([‘category’])
likes_type_com = likes_type_message[‘likes’].agg([‘sum’])
likes_type_com.reset_index(inplace=True)
# 处理数据
dom = []
for name, num in zip(likes_type_com[‘category’], likes_type_com[‘sum’]):
data = {}
data[‘name’] = name
data[‘value’] = num
dom.append(data)
print(dom)
# 初始化配置
treemap = TreeMap(init_opts=opts.InitOpts(width=“800px”, height=“400px”))
# 添加数据
treemap.add(‘’, dom)
# 设置全局配置项,标题、工具箱(下载图片)
treemap.set_global_opts(title_opts=opts.TitleOpts(title=“各类型抖音大V点赞数汇总图”, pos_left=“center”, pos_top=“5”),
toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),
legend_opts=opts.LegendOpts(is_show=False))
treemap.render(“各类型抖音大V点赞数汇总图.html”)
07 平均视频点赞数/粉丝数TOP10
「李现」作为2019年的顶级流量,登顶第一,没啥问题。
其他的博主小F一个也没关注过。
去搜索了一下,发现大部分账号只有一两个视频。
看了评论区,发现原来号被卖掉了,有可能是大V和公司分手了,毕竟现在好多做网红的公司,不火就下一位。
另一种就是个人转让账号,变现赚钱跑路咯。
可视化代码如下。
def create_avg_likes(df):
# 筛选
df = df[df[‘videos’] > 0]
# 计算单个视频平均点赞数
df.eval(‘result = likes/(videos*10000)’, inplace=True)
df[‘result’] = df[‘result’].round(decimals=1)
df = df.sort_values(‘result’, ascending=False)
# 取TOP10
attr = df[‘name’][0:10]
v1 = [‘%.1f’ % (float(i)) for i in df[‘result’][0:10]]
# 初始化配置
bar = Bar(init_opts=opts.InitOpts(width=“800px”, height=“400px”))
# 添加数据
bar.add_xaxis(list(reversed(attr.tolist())))
bar.add_yaxis(“”, list(reversed(v1)))
# 设置全局配置项,标题、工具箱(下载图片)、y轴分割线
bar.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V平均视频点赞数TOP10(万)”, pos_left=“center”, pos_top=“18”),
toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),
xaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=True)))
# 设置系列配置项
bar.set_series_opts(label_opts=opts.LabelOpts(is_show=True, position=“right”, color=“black”))
# 翻转xy轴
bar.reversal_axis()
bar.render(“抖音大V平均视频点赞数TOP10(万).html”)
08 抖音大V分布情况
可以看出西藏一个大V都没有,所以没有颜色。
广东、浙江、四川位列前三。
可视化代码如下。
def create_province_map(df):
# 筛选数据
df = df[df[“country”] == “中国”]
df1 = df.copy()
# 数据替换
df1[“province”] = df1[“province”].str.replace(“省”, “”).str.replace(“壮族自治区”, “”).str.replace(“维吾尔自治区”, “”).str.replace(“自治区”, “”)
# 分组计数
df_num = df1.groupby(“province”)[“province”].agg(count=“count”)
df_province = df_num.index.values.tolist()
df_count = df_num[“count”].values.tolist()
# 初始化配置
map = Map(init_opts=opts.InitOpts(width=“800px”, height=“400px”))
# 中国地图
map.add(“”, [list(z) for z in zip(df_province, df_count)], “china”)
# 设置全局配置项,标题、工具箱(下载图片)、颜色图例
map.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V省份分布情况”, pos_left=“center”, pos_top=“0”),
toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),
# 设置数值范围0-600,is_piecewise标签值连续
visualmap_opts=opts.VisualMapOpts(max_=600, is_piecewise=False))
map.render(“抖音大V省份分布情况.html”)
省份看完了,来看一下城市TOP10吧。
北京遥遥领先,大V的聚集地。
杭州盛产网红的城市,位列第二。
可视化代码如下。
def create_city(df):
df1 = df[df[“country”] == “中国”]
df1 = df1.copy()
df1[“city”] = df1[“city”].str.replace(“市”, “”)
df_num = df1.groupby(“city”)[“city”].agg(count=“count”).reset_index().sort_values(by=“count”, ascending=False)
df_city = df_num[:10][“city”].values.tolist()
df_count = df_num[:10][“count”].values.tolist()
bar = Bar(init_opts=opts.InitOpts(width=“800px”, height=“400px”))
bar.add_xaxis(df_city)
bar.add_yaxis(“”, df_count)
bar.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V城市分布TOP10”, pos_left=“center”, pos_top=“18”),
toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),
yaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=True)))
bar.set_series_opts(label_opts=opts.LabelOpts(is_show=True, position=“top”, color=“black”))
bar.render(“抖音大V城市分布TOP10.html”)
看完国内,就应该是国外了。
抖音上有着不少汉语讲得非常好的「歪果仁」。
美国居第一,不少在美国的华人会分享他们在美国生活的一些事情。
国内也有人感兴趣这方面的东西,看看国外的月亮究竟圆不圆。
哈哈说笑了,其实是让我们了解国外的生活。
09 抖音大V毕业学校TOP10
北影、中传、浙传、中戏、上戏、央美,妥妥的演艺圈大佬。
通过代码查询一下大V们的认证情况。
df1 = df[(df[“custom_verify”] != “”) & (df[“custom_verify”] != “未知”)]
df1 = df1.copy()
df_num = df1.groupby(“custom_verify”)[“custom_verify”].agg(count=“count”).reset_index().sort_values(by=“count”, ascending=False)
print(df_num[:20])
得到结果如下。
都是需要表演表达天赋的~
10 抖音大V简介词云
可以看到大部分大V都留下了商务合作的信息,利好内容创作者,如此才能双赢。
据统计,在抖音2200万以上创作者实现了超过417亿元的收入。
从创作到创益,这句话抖音讲的很好。
可视化代码如下。
def create_wordcloud(df, picture):
words = pd.read_csv(‘chineseStopWords.txt’, encoding=‘gbk’, sep=‘\t’, names=[‘stopword’])
# 分词
text = ‘’
df1 = df[df[“signature”] != “”]
df1 = df1.copy()
for line in df1[‘signature’]:
text += ’ '.join(jieba.cut(str(line).replace(" ", “”), cut_all=False))
# 停用词
stopwords = set(‘’)
stopwords.update(words[‘stopword’])
backgroud_Image = plt.imread(‘douyin.png’)
# 使用抖音背景色
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)
易碰到天花板技术停滞不前!**
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
[外链图片转存中…(img-4siB9yZ4-1713634837048)]
[外链图片转存中…(img-lkSL6fRm-1713634837048)]
[外链图片转存中…(img-OkshlMQ1-1713634837049)]
[外链图片转存中…(img-bvWLmcaR-1713634837050)]
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。