当前位置:   article > 正文

Python爬虫与数据可视化案例(共享源码)_python爬取数据及可视化代码

python爬取数据及可视化代码

       计算机技术日新月异,编程语言众多,每种编程语言又有自己的特点和适用场景,究竟应该如何选择呢?众说纷纭。我们可以参考编程语言的热度排名,了解世界范围内,各种编程语言的热度及发展趋势

       TIOBE编程语言排行榜根据互联网上有经验的程序员、课程和第三方厂商的数量,并使用搜索引擎以及Wikipedia、Amazon、YouTube统计出排名数据,能够较好反映某个编程语言的热门程度,TIOBE排行榜每个月更新一次,网址为:https://www.tiobe.com/tiobe-index/。下面我们就 通过Python抓取2001年5月至今,TIOBE编程语言排行榜上编程语言的热度数据,并绘制成动态的效果图,最终效果如下。

1、数据抓取和保存

       首先打开TIOBE排行榜首页:https://www.tiobe.com/tiobe-index/,查看源代码,可发现源代码中就直接包含了排名前十的编程语言在各个时期的热度值,源代码部分截图如下:

       接下来可直接获取网页内容,然后通过正则表达式进行解析获取每一部分信息。首先,获取每一种编程语言的信息;然后循环解析这些信息,获取每一个月份的热度值;最后,将解析的结果保存到文件中去。关键代码参考如下:

2、绘制动态变化图

        首先,使用Pandas库中相关方法,直接读取csv文件,得到DataFrame类型对象,获取所有的不重复的时间信息;然后,循环遍历每一个时间信息,获取该时间下所有编程语言的热度,并根据热度值对数据以及编程语言进行排序,使得热度最高放在最上面;接着,根据排好序的热度值以及编程语言名称,绘制水平的条形图;最后,每个图停留0.05秒,清空图上的内容,继续绘制下一个时间对应的图。参考到代码如下:

 注意:代码中使用到了一些第三方库,要保证相关库已安装并且已导入,否则无法执行。相关导入内容如下:   

 
     

源代码及相关资源,可关注 Python资源分享 微信公众号,回复rank 即可获取。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/848686
推荐阅读
相关标签
  

闽ICP备14008679号