赞
踩
出走十年,归来仍是小白。如感弱智,轻喷轻喷。。。
最近在找数据集,看kaggle上数据集好多,搜索也方便,就在上面找了些数据集。但其实我看中了好多数据集,想用但只想用一部分,下载下来再处理又很慢。就想着先用kaggle的notebook先处理了,下载下来的数据集能直接用就好了。摸索好,结果在此记录下。
一、上网找数据集
Kaggle: Your Machine Learning and Data Science Community
kaggle官网链接。里面数据集好多呀,爽歪歪。我个人有个数据集“鄙视链”,总感觉大数据集记录东西更细,分析起来更带劲儿。当然,所有数据集的生产者都辛苦啦!不论大小数据集总是天生其才必有用哒!
我看中了“Daily Temperature of Major Cities” Daily Temperature of Major Cities | Kaggle,它这个是世界各地的主要城市19950101-20200513日平均温度的记录表。总共超过2.5m的词条,我的小破电脑估计得处理一天。关键我也不想要全世界的,只要美国的;也不想要1995-2020的,只想要2018-2020的。
二、处理数据并下载
<Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。