赞
踩
《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》,点击传送门,即可获取!
高 商贸
高 (除上述的其他行业分类)
中 IT互联网_IT信息技术
中 金融_银行业|金融_保险业|金融_资本市场_证券期货
中 教育
中 商贸
中 (除上述的其他行业分类)
这样便简化了大量的开发工作,直接基于SQL便可以做匹配处理了,但是发现行业字段含有多个行业的情况,同时行业也存在细分行业,于是,便有了下面我们要介绍的,列转行,同时,行转列以及一列转多列,下面做简单的记录:
介绍
==
列转行(一列转多行)
SQL操作都是固定函数,… lateral view explode(split(处理字段,‘分隔符’)) ,这里先基于行业字段industry,存在多个行业时,我们转化为多行。如下:
select 字段1,字段2,待转行字段 from 表名 lateral view explode(split(处理字段,‘分隔符’)) a as 别名;
我们的SQL,执行后的效果:
hive> select
arch_value, industry_type
from dim.company_arch_value_condition_tag
lateral view explode(split(industry,‘\|’)) a as industry_type limit 10;
…
…
高 IT互联网_IT信息技术
高 金融_银行业
高 金融_保险业
高 金融_资本市场_证券期货
高 教育
高 商贸
高 (除上述的其他行业分类)
中 IT互联网_IT信息技术
中 金融_银行业
中 金融_保险业
行转列(多行转一列)
下面,对于存在细分行业的字段,进行行转列操作,操作也是固定的函数 … concat_ws(‘分隔符’, collect_set(待处理字段))…,如下:
select 字段1,字段2, concat_ws(‘分隔符’, collect_set(待处理字段)) as 别名 from 表名 group by 字段1,字段2
我们的SQL,如下:
hive> select
arch_value, concat_ws(‘|’, collect_set(industry)) as industry
from
dim.company_arch_value_condition_tag
group by arch_value limit 10;
…
…
中 IT互联网_IT信息技术|金融_银行业|金融_保险业|金融_资本市场_证券期货|教育|商贸|(除上述的其他行业分类)|-|工业|物流
低 IT互联网_IT信息技术|金融_银行业|金融_保险业|金融_资本市场_证券期货|教育|商贸|(除上述的其他行业分类)|-|工业|物流
高 IT互联网_IT信息技术|金融_银行业|金融_保险业|金融_资本市场_证券期货|教育|商贸|(除上述的其他行业分类)|-|工业|物流
当然,按我们的业务,这里不需要行转列。我们需要对一列转多列。这里只是做一个行转列的演示。
一列转多列
我们需要在列转行的基础上,再进行一列转多列(细分行业,按我的业务最多四级,不够四级的我们直接补null,方便后面处理)。具体操作如下:
hive>
目录文档:
①Docker简介
②基本概念
③安装Docker
④使用镜像:
⑤操作容器:
⑥访问仓库:
⑦数据管理:
⑧使用网络:
⑨高级网络配置:
⑩安全:
⑪底层实现:
⑫其他项目:
《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》,点击传送门,即可获取!
6994560)]
⑪底层实现:
[外链图片转存中…(img-M1Ll4ngi-1714426994560)]
⑫其他项目:
[外链图片转存中…(img-ePM6QMJe-1714426994561)]
《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》,点击传送门,即可获取!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。