pandas中drop_duplicates 用法_.drop duplicates (subset ='')

作者：你好赵伟 | 2024-06-26 16:29:25

踩

.drop duplicates (subset ='')

drop_duplicates（subset=' 列名',keep='firsrt',inplace='True'）函数是删除DataFrame的某列中重复项的函数。

subset，输入列名，形式为subset='列名1'，可输入多列，形式为subset=['列名1','列名2']

keep包括'first'，'last'，False，三个参数，注意first和last带引号，而False没有，'first'是保留重复项中第一个，last是保留最后一个，False是都不保留

举例


import pandas as pd
dict={'x':[1,2,3,6],'y':[1,4,1,1],'z':[1,2,4,1]}
df=pd.DataFrame(dict)
df


df.drop_duplicates(subset=['y','z'],keep='first',inplace=True)
df

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/你好赵伟/article/detail/759883