赞
踩
1: 导入三个数据文件,然后合并三个文件:
2:使用iloc和使用loc查看某个列的区别:
3:DateFrame与Series进行合并:
4:如果想将值加到DateFrame后面呢?
思路:创建一个DateFrame,然后合并到最后:
5: 使用append函数给DateFrame对象增加:
6: 给dataFrame对象追加一个字典:
7: 两个dataFrame连接,使用ignore_index = True:
1: 三个文件对象保留列合并:
2: 通过列名获取子集:
3:在DataFrame中增加一列:
4:使用Series增加一列:
5: 合并之后可以重置索引:
1: 使用concat连接的情况:
2:如果在连接的时候只想保留所有数据集中都有的数据,可以使用join参数,默认是’outer’保留所有数据,如果设置为’inner’ 只保留数据中共有的:
1:合并的情况,有行索引相同的就合并。
2: 只保留相同的。
1: 安装sqlalchemy:
2:使用sqlalchemy加载数据:
1: 先了解这两张表的数据基本机构:
2:一对一合并:(根据连接条件,左表和右表连接字段只有一个)
how = ’left‘ 对应SQL中的 left outer 保留左侧表中的所有key
how = ’right‘ 对应SQL中的 right outer 保留右侧表中的所有key
how = ‘outer’ 对应SQL中的 full outer 保留左右两侧侧表中的所有key
how = ‘inner’ 对应SQL中的 inner 只保留左右两侧都有的key
genre_track = genres.merge(tracks_subset[[‘TrackId’,‘GenreId’, ‘Milliseconds’]], on=‘GenreId’, how=‘left’)
print(genre_track)
这次我们使用tracks集,而不使用子集了,也就意味着tarcks中有好多GenreId(多),与genres的Genreld(一)相同。
从三张表中获取数据,用户表获取用户id,姓名
发票表,获取发表id,用户id
发票详情表,获取发票id,单价,数量
合并这三张表,然后展示表:
1: join合并,依据两个DataFrame的行索引,如果合并的两个数据有相同的列名,需要通过lsuffix,和rsuffix,指定合并后的列名的前缀。
2:join合并时,指定某个列为索引:
3:一个设置行索引,另一个设置连接条件。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。