赞
踩
谈及数据库的发展历史,就不得不提及三位数据库领域的开拓者,分别是Frank、Micheal和Jim Gray,他们为数据库理论奠定了坚实的基础,都获得了图灵奖。早在1972年,Micheal最早提出了Ingres数据库,于2014年获得图灵奖,Ingres数据库最后分化衍生为Sybase与Postgres两部分。其中Postgres数据库有大量分析函数,适用于分析型事务,尤其是OLAP。1972年,埃里森在硅谷开发了Oracle数据库,再到1983年IBM开发了DB2数据库,同年Tdata诞生,直到1995年MySQL数据库诞生。而如今的Oracle于2009年收购了MySQL,这样一来就同时拥有了Oracle和开源的MySQL两套数据库,MySQL的创始人在离开后又开发了一套数据库MariaDB,现在国内有很多银行,像亿联银行等新的银行都在使用MariaDB。
在此先回顾一下OLTP数据库的发展历程。2003-2006年,谷歌发布了几篇关于分布式关系型数据库的论文,以此为基础2012年开发了谷歌F1作为内部自用数据库;2014年CockroachDB研发分布式关系型数据库,2017年国内的刘奇团队也成功开发了PingCAP数据库;到了2015年,阿里巴巴的OcenaBase经过内部多年打磨最终对外推出使用。
然后是OLAP数据库的发展历程。OLAP最早为数据库一体机,由IBM Netezza、Oracle Exadata、Teradata应用于高端存储上,对于硬件要求非常高。到2000年后MPP数据库大规模应用,成功实现了软硬件分离,数据不再需要存储在专有服务器上。2006年到2008年期间,随着Hadoop的大规模普及出现第三代分析型数据库,数据存储与HDFS之上,能够存储、计算分离、实现各节点间的访问,具有很强的扩展性能。之后在Handoop的基础上进一步完善优化数据库性能,称之为最新一代数据仓库,代表的有HAWQ、Hive、Impala等。
首先,由于MPP和Hadoop各有优劣势,于是有创业公司尝试把MPP和Hadoop结合在一起使用。例如偶数科技利用了Hadoop的海量结构化和非结构化的特性,同时又利用了MPP实时性的优势。
第二个趋势是数据库都在从集中式逐渐转到分布式。Gartner的报告中指出以下三点原因:第一点,随着数据量的增加,硬件性能的瓶颈,尤其是摩尔定律的限制,传统的集中式架构完全无法满足客户的要求,不论是数据库还是整个应用软件,都有从集中式转分布式的趋势;第二点,由于数据库设计的理论存在CAP理论,即数据库的一致性、可用性、容错性三者不可兼得,那么未来数据库一定是一个分散的市场,每家的数据库一定是各有侧重点;第三点,随着业务的发展变化,未来交易型数据库和分析型数据库会逐渐融合,AP和TP在融合,所以HTAP必定是数据库的一个未来的发展方向。
第三个发展趋势是从SQL到NoSQL。Oracle、MySQL、SQLServer大部分是二位表结构,使用SQL语言,但是随着数据量的爆发式增长,像影音、文档、流媒体大幅度增加,Gartner认为数据未来一定是从SQL到NoSQL的方向发展,包括:文档数据库、健值数据库、图数据库和时序数据库。
**第四是关于NoSQL的发展趋势,根据DB Engines第三方的统计,图数据库是发展最快的,搜索数据库紧随其后,第三是文档数据库,第四是健值数据库。**在图数据库领域有两家明星公司——硅谷的Tigergraph和Neo4j,Tigergraph上一轮估值三亿美金,由百度华创投资;还有就是文档数据库,代表性公司MongD已经是上市公司,估值92亿美金,收入2.6亿,可以看到在这个领域存在能够实现国产替代的机会。
对数据库发展进行总结和回顾:首先,做数据库行业需要长时间的积累,例如Oracle从1978年开始至今已有40多年的历史,才发展成如今的规模;第二,做数据库一定要有一个生态,自从X86替换小型机,DB2的市场份额逐渐下降以及软硬件分离的趋势,导致Intel、微软的操作系统得以普遍应用,在此生态下才有Oracle、MySQL发展壮大的机会;第三,做数据库需要长时间的持续性投入,要几十年如一日,例如蚂蚁金服的Oceanbase、华为的高斯、腾讯的TBASE都做了很大的投入。
关于数据库行业的探讨:第一,在数据库领域,国产数据库发展还比较缓慢,在党政军领域应用较多,而在金融机构领域应用较少。国产数据库长期被Oracle、IBM、MySQL这类产品挤压,随着中美贸易战的升级、国家鼓励软件国产化,国产软件将会越来越被重视,这将是一大转变契机;第二,在国产数据库的OLTP领域,华为、阿里、腾讯等厂商有技术优势和资金优势,同时也有生态和渠道的优势;第三,创业公司进入OLTP领域门槛非常高,而在
OLAP领域,建立新一代数字据仓库以及NoSQL数据库方面,未来会涌现更多的创业公司,这块可能是很多投资机构接下来要重点关注的方向。
数据库的研发与应用场景密切相关。今天,中国数字经济规模已经达到32万亿,相当于GDP的1/3,涌现了大量新零售、新金融、新制造等数字业务场景,而这些场景从创新程度、创新规模和用户体量来看,都居世界前列。
随着消费互联网向产业互联网的推进,消费互联网的数据库技术也在向产业和企业互联网场景演化,特别是工业互联网、车联网、物联网等大规模产业和企业互联网,都为数据库创新提供了前所未有的机遇。
近期又逢《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》发布,其中第六部分是“加快培育数据要素市场”,这标志着中央给“数据”以新的历史定位,不再视其为信息化的产物,而是上升到了生产要素的重要地位。
数据要素的新定位,将为中国数据库技术发展释放政策红利,数据库与数据分析将是长期看好的创业投资领域。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。