当前位置:   article > 正文

python比较两份数据的差异_python比较两组数据的差异性

python比较两组数据的差异性

主要方法是将数据转化成DataFrame,利用pandas进行处理。

  • 相同数据:
data_same = pd.merge(data, data2, how='inner')
  • 1
  • 不同的数据
data_diff = pd.concat([data2, data, data]).drop_duplicates(keep=False)
  • 1

代码举例:
import pandas as pd

解决控制台输出显示补全

pd.set_option('display.max_rows', 50000)
pd.set_option('display.max_columns', 10000)
pd.set_option('display.width', 100000)

data = pd.read_excel('Excel_1路径')
data2 = pd.read_excel('Excel_2路径')

data_same = pd.merge(data, data2, how='inner')

data_diff = pd.concat([data2, data, data]).drop_duplicates(keep=False)
print("新增的数据:\n{0}\n".format(data_diff))
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

除此之外,pandas.compare()也可以比较两个DataFrame,不过必须得是大小相同的DataFrame,大小不一致会报错,这个只能用来检测表中的数据是否有修改,如果是新增的数据是没办法检测的,只能采用pd.concat()函数。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/681790
推荐阅读
相关标签
  

闽ICP备14008679号