当前位置:   article > 正文

Python分析5000+抖音大V,发现大家都喜欢这类视频!_抖音大v分析

抖音大v分析

本期就给大家用数据分析一下在抖音,什么类型的视频最受欢迎

/ 01 / 数据获取

数据来自于第三方监测,一共是有5000+抖音大V数据信息

文件我已上传公众号,回复「抖音」即可获取。

主要包含大V们的昵称、性别、地点、类型、点赞数、粉丝数、视频数、评论数、分享数、关注数、毕业学校、认证、简介等信息。

其中粉丝最多的是「人民日报」,接近1.2亿。「央视新闻」也破亿了,记得之前破亿的时候还上过热搜~

粉丝最少的博主也有近150w+的粉丝,这5000多位大V累计236.5亿粉丝,地球人口的三倍多!

/ 02 / 数据可视化

导入相关库,然后读取数据。

from pyecharts.charts import Pie, Bar, TreeMap, Map, Geo

from wordcloud import WordCloud, ImageColorGenerator

from pyecharts import options as opts

import matplotlib.pyplot as plt

from PIL import Image

import pandas as pd

import numpy as np

import jieba

df = pd.read_csv(‘douyin.csv’, header=0, encoding=‘utf-8-sig’)

print(df)

01 性别分布情况

整体上看,男女比例差别不大。

除去未知的数据,基本是1:1

可视化代码如下。

def create_gender(df):

df = df.copy()

# 修改数值

df.loc[df.gender == ‘0’, ‘gender’] = ‘未知’

df.loc[df.gender == ‘1’, ‘gender’] = ‘男性’

df.loc[df.gender == ‘2’, ‘gender’] = ‘女性’

# 根据性别分组

gender_message = df.groupby([‘gender’])

# 对分组后的结果进行计数

gender_com = gender_message[‘gender’].agg([‘count’])

gender_com.reset_index(inplace=True)

# 饼图数据

attr = gender_com[‘gender’]

v1 = gender_com[‘count’]

# 初始化配置

pie = Pie(init_opts=opts.InitOpts(width=“800px”, height=“400px”))

# 添加数据,设置半径

pie.add(“”, [list(z) for z in zip(attr, v1)], radius=[“40%”, “75%”])

# 设置全局配置项,标题、图例、工具箱(下载图片)

pie.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V性别分布情况”, pos_left=“center”, pos_top=“top”),

legend_opts=opts.LegendOpts(orient=“vertical”, pos_left=“left”),

toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}))

# 设置系列配置项,标签样式

pie.set_series_opts(label_opts=opts.LabelOpts(is_show=True, formatter=“{b}:{d}%”))

pie.render(“抖音大V性别分布情况.html”)

02 点赞数

点赞数TOP10,除了「小团团」和「毒舌」,其他都是新闻媒体类的大V。

今年因为疫情,有很多新闻在抖音上都是第一时间传播,所以影响力比较大,点赞也就比较多了。

记得「四川观察」还被评论区调侃为四处观察,意思是发布消息非常快。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/秋刀鱼在做梦/article/detail/846926
推荐阅读
相关标签
  

闽ICP备14008679号