当前位置:   article > 正文

Python DataFrame常用的数据转换操作_pythondataframe转换为常规

pythondataframe转换为常规

一、创建实例 DataFrame

# 创建一个空的 DataFrame
#df = pd.DataFrame(columns=['车牌号', '车型', '标签'])
df = pd.DataFrame([['沪C 100232', '奔驰', 'Y'], 
                   ['鲁A 801353', '奥迪', 'N'], 
                   ['豫H 666132', '宝马', 'Y']])
 
df.columns = ['车牌号', '车型', '标签']

	  车牌号	    车型  标签
0	沪C 100232	奔驰   Y
1	鲁A 801353	奥迪   N
2	豫H 666132	宝马   Y
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12

1.1 自定义字典,map转换’车型’数据

# 奔驰 -> 1, 奥迪 -> 2, 宝马 -> 3.
mapping_1 = {'奔驰': 1,
             '奥迪': 2,
             '宝马': 3}
             
df['车型'] = df['车型'].map(mapping_1)

        车牌号  车型  标签
0	沪C 100232	1    Y
1	鲁A 801353	2    N
2	豫H 666132	3    Y
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

1.2 提取’车牌号’列数据信息

# 沪C 100232 ->沪C , 鲁A 801353 ->鲁A , 豫H 666132 ->豫H.
df['车牌号'] = list(map(lambda var: var[:2],df['车牌号'].tolist()))

    车牌号  车型   标签
0	沪C	    1     Y
1	鲁A	    2	  N
2	豫H	    3 	  Y
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

1.3 处理’标签’列数据

# Y ->0 , N ->1 , Y ->0.
mapping_2 = {value:ind for ind,value in enumerate(set(df['标签']))}
df['标签'] = df['标签'].map(mapping_2)


    车牌号	 车型	标签
0	沪C    	  1	     0
1	鲁A	      2	     1
2	豫H	      3	     0
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9

1.4 one_hot’车牌号’列数据

pd.get_dummies(df)
#pd.get_dummies(df['车牌号'])


	车型    标签     车牌号_沪C   车牌号_豫H	车牌号_鲁A
0	 1	     0	        1	        0	        0
1	 2	     1      	0	        0	        1
2	 3	     0      	0	        1	        0
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

1.5 待更新

在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/604307
推荐阅读
相关标签
  

闽ICP备14008679号