当前位置:   article > 正文

数据平台:湖仓一体、流批一体、存算分离的核心问题_湖仓一体和流批一体

湖仓一体和流批一体

一、为什么出现湖仓一体的技术架构

        目前数据仓库存储的数据结构单一,只能存储结构化的数据,对于非结构化数据的存储需求,以及存储成本是数据仓库的主要问题,而非结构化数据存储在业务库,也造成数据不能相融和利用,为了解决非结构化数据的低成本的存储诞生了湖仓一体的技术架构。

湖仓一体的技术架构是指将数据湖(Data Lake)和数据仓库(Data Warehouse)结合在一起,实现对各种类型的数据进行存储、管理和分析的一体化解决方案。湖仓一体的技术架构出现的原因主要有以下几点: 

数据多样性

随着大数据时代的到来,数据的种类和来源越来越多样化,包括结构化数据、半结构化数据和非结构化数据。数据湖可以灵活地存储各类数据,而数据仓库则更适合结构化数据的处理和分析。湖仓一体的架构能够同时满足不同类型数据的存储和处理需求。 

数据实时性

湖仓一体的技术架构可以实现实时数据的处理和分析。数据湖可以接收和存储实时数据流,而数据仓库则可以实现对实时数据的快速查询和分析。通过湖仓一体的架构,可以将实时数据流和离线数据在同一个平台上进行统一管理和分析,提高数据实时性。 

数据一致性

湖仓一体的技术架构可以保证数据一致性。数据湖可以作为中心化的数据存储和管理平台,将不同数据源的数据集中存储在一起。通过数据湖和数据仓库之间的数据同步与集成,可以保证数据的一致性和准确性,避免了数据冗余和不一致的问题。 

数据成本控制

湖仓一体的架构可以降低数据存储和处理的成本。数据湖可以使用成本相对较低的存储设备来存

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/970350
推荐阅读
相关标签
  

闽ICP备14008679号