当前位置:   article > 正文

专访李飞飞 :从清华附中高材生到阿里飞刀,一口井钻出「云原生」_飞刀 阿里云

飞刀 阿里云

如果要用一个关键词来定义中国当下的消费时代,“双11”是再贴切不过了。

从2009年11月起,它只花了十年的时间,就从一个只有27家商户参与的打折日,变成了一个全民狂欢的消费节,2019年已经有超过18万家品牌参加,累计成交额更是高达2684亿元。

每年的双11,都是互联网的流量洪峰。

面对逐年攀升的成交额数据,到底是什么作为支撑呢?

阿里巴巴集团副总裁、阿里云智能事业群数据库产品事业部总裁、达摩院数据库与存储实验室负责人李飞飞在新智元专访中透露,去年双11交易峰值达到了每秒55万笔,而每笔交易又能拆分成很多个事务,总的下来每秒会有几百万的transaction事务在0:00:01那一刻发生,交易量会暴涨133倍。比如说之前一秒有一个,现在就是一秒有133个。

短时间内如此高的增长,对后端的计算和存储系统的挑战巨大。系统的弹性、可扩展性及高可用性要非常好,不然难以支撑瞬间的交易暴涨。

这是对数据科学的极大挑战,也是每个有抱负的「数据科学家」最好的舞台,李飞飞为这个舞台准备了20年。

从清华附中起飞:李飞飞如何走上数据科学之路?

李飞飞从小喜欢深挖钻研,参加了很多数学和物理竞赛。

在清华附中的国家教委理科实验班,没有了高考的压力,李飞飞便一头扎进了竞赛里。

16岁是个分水岭。那一年,他初三毕业进入了国家教委理科实验班,确定了后续保送进清华的道路。

本科的毕业设计,让他第一次接触到了数据科学。那个年代,大数据还没有兴起,但在当时的李飞飞看来,这个工作具有前瞻性的意义。

即使来到了2017年,「数据科学家」这个岗位也依然很「感性」。

因为当时,数据科学还不是一门大热学科,「数据科学家」的概念还停留在表层,很少有人能透过枯燥和乏味参悟到其中的魅力。

从2001年初到2002年上半年,在这一年多的时间里,李飞飞都沉浸在自己的毕设项目里,每天都和外文网站上的海量数据打交道。

通过对BBC、CNN等网站信息的拆解并分析Hyperlink资源,成功将网站的结构拓扑出来,并描绘出一个完整的后台,还初步实现了对网站信息的自动化理解。

「现在回头来,我们当时这个项目看其实是非常超前的,以当时的技术确实也也不大可能lead to somewhere」,在谈到本科毕设的项目时,李飞飞如是说。

虽然当时只用了一些分词、词频统计等简单的方法,但是已经有了现代NLP技术的影子。真正有前瞻思考的人总是走在时代的前面。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/69150
推荐阅读
相关标签
  

闽ICP备14008679号