赞
踩
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
「你要悄悄学Python,然后惊艳所有人。」
现在,GitHub上一位博主告诉你:不用学,用sweetviz就行。
这是一个基于Python编写的数据分析软件,只要掌握3种函数用法,一行Python代码就能实现数据集可视化、分析与比较。
我们以Titanic数据集为例,输入一行代码:
一个1080p的清晰网页界面就出现在了眼前。
不仅根据性别、年龄等不同栏目纵向分析数据,每个栏目下还有众数、最大值、最小值等横向对比。
所有输入的数值、文本信息都会被自动检测,并进行数据分析、可视化和对比,最后帮你进行数据总结。
在这样的数据分析下,结果一目了然。
这样的效果,是基于3个主函数实现的。
数据分析函数中,有4个参数source,target_feat,feat_cfg和pairwise_analysis需要被设置。
source:以pandas中的DataFrame数据结构、或是DataFrame中的某一类字符串作为分析对象。
target_feat:需要被标记为目标对象的字符串。
feat_cfg:需要被跳过、或是需要被强制转换为某种数据类型的特征。
pairwise_analysis:相关性和其他类型的数据关联可能需要花费较长时间。如果超过了某个阈值,就需要设置这个参数为on或者off,以判断是否需要分析数据相关性。
如果想要对两个数据集进行对比分析,就使用这个比较函数。
例子中的my_dataframe和test_df是两个数据集,分别被命名为训练数据和测试数据。
除了这个被插入的数据集,剩余的参数与analyze中的一致。
想要对数据集中某个栏目下的参数进行分析,就采用这个函数进行。
例如,如果需要比较“性别”栏目下的“男性”和“女性”,就可以采用这个函数。
理解这几种函数的变量后,一行代码就能实现Python数据分析。
sweetviz支持Python 3.6+和Pandas0.25.3+环境,配置好环境后,使用万能的pip下载安装包:
但有一个条件需要注意:sweetviz需要用到基础「os」模块。所以,如果你在使用类似于Google Colab的自定义环境,可能会无法使用sweetviz,目前开发者也在探索解决方案。
下载好后,使用import快速导入sweetviz,就可以开始使用了~
sweetviz使用的原理是,使用一行代码,生成一个数据报告的对象(其中,my_dataframe是pandas中的DataFrame,一种表格型数据结构):
在这里,analyze函数可以被替换为compare或compare_intra函数,使用方法在上面已经给出,全看你需要什么类型的数据报告了。
最后,用show一键输出。(结果会以SWEETVIZ_REPORT.html网页形式展示)
由于在这个过程中,实际上真正需要编写的只有第二行的生成对象代码,可以说是名副其实的1行代码生成数据分析。
展示界面也非常简洁,只要鼠标停留在感兴趣的栏目上,右侧就会自动显示出数据分析的图表和报告。
不知道你们用的什么环境,我一般都是用的Python3.6环境和pycharm解释器,没有软件,或者没有资料,没人解答问题,都可以免费领取(包括今天的代码),过几天我还会做个视频教程出来,有需要也可以领取~
给大家准备的学习资料包括但不限于:
Python 环境、pycharm编辑器/永久激活/翻译插件
python 零基础视频教程
Python 界面开发实战教程
Python 爬虫实战教程
Python 数据分析实战教程
python 游戏开发实战教程
Python 电子书100本
Python 学习路线规划
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。