当前位置:   article > 正文

Python每日一记176>>>pandas类别变量及自定义排序_pandas排序变量

pandas排序变量

今天遇到一个难题,需要用到自定义排序,如:微会员 < 金卡 < 红宝石卡 < 钻石卡,但是默认的排序是:微会员, 红宝石卡, 金卡, 钻石卡。
于是乎,起初的想法是将文本变量重编码为1,2,3,4,对应着再排序,我们知道数值型变量重编码可使用cut函数,文本型或者字符串型变量重编码可以使用map,但是有些多此一举,于是查阅资料是发现类别变量可满足自定义排序的需要,直接上代码了:

import pandas as pd
import numpy as np
data = pd.read_excel('C:\\Users\\17621802479\\Desktop\\源数据.xlsx')
print('默认排序------\n',data['卡别'].drop_duplicates().sort_values())

# 转化为类别变量,无序的,以后的排序操作还是默认的排序机制
data['卡别']=data['卡别'].astype('category')
print('转化为类别变量排序,同默认排序-----\n',data['卡别'].drop_duplicates().sort_values())

# 添加新列,且是类别变量,排序了的,以后的排序会按照我们设定的排序,而不是默认的排序机制
data['有序卡别']=pd.Categorical(data['卡别'],categories=['微会员','金卡','红宝石卡','钻石卡'],ordered=True)
print('有序排序------\n',data['有序卡别'].drop_duplicates().sort_values())

# 临时修改排序规则,inplace为真时,表示在原序列上操作
data['有序卡别']=data['有序卡别'].cat.reorder_categories(['钻石卡','红宝石卡','金卡','微会员'],ordered=True,inplace=False)
print('临时改变排序规则-------\n',data['有序卡别'].drop_duplicates().sort_values())

# 直接在原列上转化为类别变量并自定义排序
from pandas.api.types import CategoricalDtype #弥补astype的不足
data['卡别']=data['卡别'].astype(CategoricalDtype(categories=['微会员','金卡','红宝石卡','钻石卡'], ordered=True))
print('转化类型时直接有序排序-------\n',data['卡别'].drop_duplicates().sort_values())
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21

在这里插入图片描述
更详细可参考链接:
https://www.cnblogs.com/feffery/p/11436158.html

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/261942
推荐阅读
相关标签
  

闽ICP备14008679号