赞
踩
昨天我们爬取了微博游戏名人的信息,包括名字,关注量,粉丝量,微博量,地址和简介,今天我们就分析下它们的地址信息和简介
我第一次用pyecharts,所以需要先安装它,借助pyecharts库,可以对游戏名人的地址分布可视化,需要安装如下工具,想通过热力图的形式将他们的地址分布展现出来
$ sudo pip3 install pyecharts==0.5.10
$ sudo pip3 install echarts-countries-pypkg
$ sudo pip3 install echarts-china-provinces-pypkg
$ sudo pip3 install echarts-china-cities-pypkg
$ sudo pip3 install echarts-china-counties-pypkg
数据内容如下
address列就是地址信息,因为我对pandas比较熟悉,所以我是先将数据库中的数据提取出来,再转为DataFrame
#连接数据库
def connection_mysql():
return pymysql.connect('ip','QINYUYOU','密码','homework')
#通过pandas读取数据库内容
def df_mysql(sql):
return pd.read_sql(sql,connection_mysql())
def get_df(sql):
return df_mysql(sql)
我们可以打印get_df(sql)返回的内容,检查是不是DataFrame数据
没问题,就是我们要的DataFrame
我们需要的数据是地址和简介,先将他们提取出来看看
print(df['address'])
print(type(df['address']))
可以看到是一个Series数据类型
暂时没有问题,一切很顺利,我们需要对地址进行处理,比如上海静安区,我们需要将它改成上海,可以通过string的split()方法实现,通过空格将字符串分成一个字符串列表,返回列表的第一个元素即可
def address_string(string):
return string.split()[0]#通过空格分割成字符串列表返回第一个元素
方法写好了,需要对Series中的每一个数据都调用address_string方法,可以通过pandas.apply()方法实现,
这里一定要注意:一定要用Series接收Series使用apply()方法,不然原Series是不会发生变化的
df['address'] = df['address'].apply(address_string)
print(df['address'])
打印看看结果
没问题,接下来就是统计地址的频率了
df_address_count = df.groupby(['address'],as_index=False)['address'].agg({'cnt':'count'})
print(df_address_count)
打印看看
address cnt
0 上海 278
1 云南 3
2 其他 115
3 内蒙古 1
4 北京 175
5 台湾 1
6 吉林 7
7 四川 39
8 天津 6
9 宁夏 1
10 安徽 9
11 山东 15
12 山西 5
13 广东 114
14 广西 4
15 新疆 1
16 江苏 43
17 江西 9
18 河北 4
19 河南 9
20 浙江 63
21 海南 2
22 海外 67
23 湖北 24
24 湖南 25
25 澳门 2
26 福建 19
27 贵州 4
28 辽宁 15
29 重庆 18
30 陕西 10
31 青海 2
32 香港 4
33 黑龙江 6
看到有两个地址不清楚,分别是‘其他’和‘海外’,我打算将他们移除
df_address_count = df_address_count[~df_address_count['address'].isin(['其他'])]#选取‘其他'以外的数据
df_address_count = df_address_count[~df_address_count['address'].isin(['海外'])]#选取‘海外‘以外的数据’
我们提取到了地址和频率信息,就可以做热力图了
查看pyecharts中文文档,研究画出热力图
google搜索十六进制颜色,而已获取颜色的十六进制,方便我们配置图形的参数
pyecharts中文文档
address = df_address_count['address']#地址
count = df_address_count['cnt']#频率
# print(address)
# print(count)
geo = Geo("微博游戏名人地区热力图", "data from weibo", title_color="#161a16", title_pos="left", width=1200, height=600,
background_color='#bad1ba')
geo.add("微博游戏名人地区热力图", address, count, visual_range=[0, 30],type='heatmap', visual_text_color="#161a16",
symbol_size=20, is_visualmap=True,
is_roam=True) # type有scatter, effectScatter, heatmap三种模式可选,可根据自己的需求选择对应的图表模式
geo.render(path="微博游戏名人地区热力图.html")
运行代码生成html文件,浏览器打开
还行吧,虽然不是特别好看,起码功能实现了,后面在写简介的词云,要学的东西太多了,给自己加个油,冲鸭!!!!!!
开始对制作简介的词云
首先需要获取简介的数据
df = get_df()
df_introduction = df['introduction']
print(df_introduction)
打印结果如下
得到我们要的Series,接下来我们将Series每个元素拼接成一个大的字符串即可
string = ''
for i in df_introduction:
string = string + ' ' + str(i) + ' '
print(string)
结果如下
知名游戏博主 知名游戏博主 知名游戏博主 游戏视频自媒体 上海七煌信息科技有限公司游戏解说李浩宇 知名游戏博主 游戏视频自媒体 知名游戏博主 游戏视频自媒体 王者荣耀小星工作室诚信效率为本 头条文章作者 微博签约自媒体 RNG电子竞技俱乐部ADC队员 广州上进文化传媒有限公司旗下D7G电子竞技俱乐部 知名游戏博主 英雄联盟赛事君 斗鱼直播平台签约主播 游戏视频自媒体 歌手 Newbee电子竞技俱乐部DOTA2分部队员 知名游戏博主 王者荣耀职业战队AG超玩会官方微博 知名游戏博主 游戏视频自媒体 香蕉计划签约艺人 LPL官方解说 知名游戏博主 英雄联盟超话小主持人 游戏视频自媒体 英雄联盟官方主持人 视拳签约艺人 微博vlog博主 虎牙直播签约主播 知名游戏博主 游戏视频自媒体 秒拍达人 游戏视频自媒体 穿越火线CFPL解说 游戏视频自媒体 知名游戏博主 游戏视频自媒体 微博解说视频博主 知名游戏博主 苏州游视网络科技有限公司 解说 主持人\n 知名时尚博主 时尚美妆视频自媒体 iG电子竞技俱乐部 LGD俱乐部CEO,CDEC精英联盟创始人负责人 皇族电子竞技俱乐部RNG战队 上单 Zz1tai Snake电子竞技俱乐部打野选手 Imba传媒创始合伙人;电竞解说 DNF手游超话主持人 皇族电子竞技俱乐部RNG战队官方微博 英雄联盟官方主持人 视拳签约艺人 游戏博主 知名游戏博主 头条文章作者 微博签约自媒体 知名游戏博主 QG电子竞技俱乐部王者荣耀分部 教练 斗鱼直播主播,小象互娱合伙人,LOL前职业上单 英雄联盟官方主持人 视拳签约艺人 微博vlog博主 知名游戏博主 微博2018十大影响力游戏大V 微博签约自媒体 百度DOTA吧官方微博 知名游戏博主 头条文章作者 英雄联盟官方解说 斗鱼直播平台签约主播 《我是唱作人》百人评审 英雄联盟官方解说,LPL、LCK官方赛事解说 EDG电子竞技俱乐部官方微博 QGhappy上单位选手 王者荣耀清风代练陪练工作室 香蕉计划签约艺人 LPL官方解说 《我是唱作人》百人评审 头条文章作者 知名游戏博主 新浪游戏官方微博 知名游戏博主 游戏视频自媒体 iG电子竞技俱乐部LOL分部队员 英雄联盟S8世界赛冠军 iG电子竞技俱乐部LOL分部队员 英雄联盟S8世界赛冠军 香蕉计划签约艺人 LPL官方解说 DOTA2职业选手;DOTA第一视角解说 上海综皇文化签约解说、主持人 普通的AB站游戏实况者,各方努力中!||近期沉迷:明日方舟/Undertale/Deltrune||【合作请私信】 FPX电子竞技俱乐部英雄联盟项目中单 知名游戏博主 英雄联盟官方解说 知名游戏博主 微博2017十大V影响力新星大V 游戏视频自媒体 大电竞韩国站负责人 知名游戏博主 KPL王者荣耀官方解说 大神电竞公司艺人 虎牙直播签约主播 微博vlog博主 斗鱼签约主播 知名游戏博主 游戏视频自媒体 知名游戏博主 知名游戏博主 游戏视频自媒体 知名游戏博主 头条文章作者 微博签约自媒体 知名游戏博主 前 百度LOL贴吧吧主 知名游戏博主 英雄联盟超话粉丝大咖 游戏视频自媒体 知名游戏博主 游戏视频自媒体 DOTA殿堂级明星选手820.CN 游戏女主持,《Miss排位日记》。魔兽3、星际2 女子冠军。 虎牙直播签约主播 英雄联盟官方主持人 香蕉计划签约艺人 《我是唱作人》百人评审 知名游戏博主 知名游戏博主 Bilibili直播 签约主播 QG电子竞技俱乐部QQ飞车项目职业选手 知名游戏博主 游戏视频自媒体 知名游戏博主 GK电子竞技俱乐部特约赛训指导、虎牙直播主播 腾讯企鹅电竞签约主播 知名游戏博主 eStar电子竞技俱乐部王者荣耀分部队员 知名游戏博主 知名游戏博主 游戏视频自媒体 上海奋荣投资公司董事长 KING电子竞技及篮球俱乐部投资人 知名游戏竞技博主 头条文章作者 微博签约自媒体 微博电子竞技官方微博 工作室宗旨:诚信,负责,效率 知名游戏博主 游戏视频自媒体 QG电子竞技俱乐部王者荣耀分部 队员 知名游戏博主 和平精英超话小主持人 新鲜事金牌作者 游戏视频自媒体 虎牙直播签约主播 微博vlog博主 微博故事红人 微博剪辑视频博主 知名游戏博主 娱乐综艺视频自媒体 知名游戏博主 知名游戏博主 知名游戏博主 全民手游攻略签约作者 头条文章作者 微博签约自媒体 AG超玩会王者荣耀项目选手 知名游戏博主 None EHOME电子竞技俱乐部DOTA2选手Cty 游戏人“多边形” 知名游戏博主 游戏视频自媒体 知名游戏博主 斗鱼TV签约主播 前 新浪看游戏人气主播;燃烧吧大脑100强 游戏视频自媒体 MarsTV主播,DOTA2官方解说 QG电子竞技俱乐部QQ飞车项目职业选手 虎牙直播签约主播 游戏解说、竞技选手,曾获得Iron Lady国际女子魔兽邀请赛冠军。 游戏视频自媒体 斗鱼签约主播 游戏视频自媒体 eStar电子竞技俱乐部王者荣耀分部队长 VG俱乐部花瓶分部现役职业选手 虎牙直播签约主播 知名游戏博主 qghappy超话小主持人 虎牙直播签约主播 快手签约主播 人气视频作者 知名游戏博主 知名游戏博主 知名游戏博主 知名游戏博主 《加油!Dota》选手 前LOL职业选手、英雄联盟最佳解说、德云色主播 全民手游攻略签约作者 头条文章作者 微博签约自媒体 优酷游戏解说 知名游戏博主 量子体育VSPN主持人/解说 微博VLOG博主 huya直播772700 微博游戏资讯博主 微博签约自媒体 知名游戏博主 NewBeeTV 运营经理 微博签约自媒体 游戏博主 新浪游戏玩家盛典王者荣耀人气王 知名游戏博主 王者荣耀超话粉丝大咖 知名游戏博主 游戏视频自媒体 知名游戏博主 游戏博主 EHOME电子竞技俱乐部官方微博 上海哔哩哔哩电竞公司 解说 AG超玩会王者荣耀项目选手 知名游戏博主 自由摄影师,《英雄联盟》AllStar等大型活动专题摄影。 虎牙直播签约主播 知名游戏博主 游戏视频自媒体 已关@,第一世界需要我拯救! 知名游戏视频制作人 知名游戏博主 王者荣耀超话小主持人 微博故事原创作者 游戏视频自媒体 游戏视频自媒体 人民体育电竞平台官方微博 上海貔卡貅文化工作室投资人 知名游戏博主 知名游戏博主 全民手游攻略签约作者 头条文章作者 微博签约自媒体 知名游戏博主 知名游戏博主 知名游戏博主 游戏视频自媒体 英雄联盟官方解说 视拳签约艺人 知名游戏博主 知名游戏博主 游戏视频自媒体 微博签约自媒体 虎牙直播签约主播 前 WE队长,中路AP,中国LOL首个世界冠军,在2012年率队连获十冠 游戏博主 斗鱼TV直播平台主播 英雄联盟官方主持人 斗鱼TV签约主播 知名游戏博主 知名游戏博主 知名游戏博主 前EDG打野选手,英雄联盟官方解说 香蕉计划签约艺人、知名游戏解说 微博vlog博主 LGD电子竞技俱乐部英雄联盟战队队长&辅助 ◇ EDG × Rookie 主剪辑 副✍声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。