当前位置:   article > 正文

hive 比较两个表数据的不同_hive比较两张表差异

hive比较两张表差异

工作中常会需要去对比两个表中某些数据的不同。以及关于join的操作。这里将遇到的记录一下。

 

比较两个表的不同

left Join 保证了左表的数据一定会存在,对于这类查Diff的场景很合适
下面这个语句可以查出来 T2中比T1新增的列与数据
key表示连接的关键值,唯一信息的那一列,例如用户ID之类

  1. SELECT * FOROM T1
  2. LEFT JOIN
  3. SELECT * FROM T2
  4. ON T1.key = T2.key
  5. WHERE
  6. T2.key is NULL

对于想进一步做筛选条件,可以后面加where

  1. SELECT * FOROM T1
  2. LEFT JOIN
  3. SELECT * FROM T2
  4. ON T1.key = T2.key
  5. WHERE
  6. T2.key is NULL OR T1.data_key != T2.data_key

Union ALL

  1. SELECT col1, col2, col3
  2. FROM
  3. (
  4. SELECT * FROM tableA
  5. UNION ALL
  6. SELECT * FROM tableB
  7. ) data
  8. GROUP BY col1, col2, col3
  9. HAVING count(*)!=2

UNION 命令只会选取不同的值,UNION ALL 会包括全部的值

 

鸣谢与参考:

本文近乎完全参考下文
https://www.jianshu.com/p/c7f46125d4c2

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/656501
推荐阅读
相关标签
  

闽ICP备14008679号