目录
1、业务背景介绍
2、架构演进考察
3、对公司底层技术的原理考察
4、系统难点的考察
5、擅长技术的考察
6、总结
“ 这篇文章,给大家分享一个同学面试阿里某个部门时的经历。
简单说一下这个同学面试的背景,本身技术底子还不错,在几个有一定知名度的中型互联网公司工作过,然后之前打算尝试一下阿里的职位,就去面试了。
第一轮和第二轮面试,全部都通过了,面试官评价也是基本技术素养还可以,基础也不错,定级都是P6+的职级。
但是第三面是那个部门老大P9出来面试他,结果就挂在这里了,所以把这个第三面的一些问题分享出来,给大家参考。
1、业务背景介绍
首先这个同学上来先阐述了一下自己的一些项目经历,当前他在公司里主要是负责一个数据类的系统,业务逻辑并不复杂,但是有一点技术难度。
主要是每天都会有人调用他的接口,然后有数据会落入数据库表中。
简化一下来说,大概是这个背景,如下图:
这个系统每天接口调用大概会落入数据库中有20万左右的数据量,那么每个月大概是600万左右的数据量,每年大概是近亿级的数据量会落入数据库中。
但是这是针对整个数据库来说的,平摊到里面核心的每个表,大概每个表每年新增个千万级别的数据量。
2、架构演进考察
系统就是这么个情况,接着面试官就开始发问了。。。
面试官
现在你的系统压力其实不大,每天20万新增数据量也不大,每年哪怕单表新增千万级数据其实也还算可以接受。
第一个问题:如果假设你的系统承载的业务量翻了10倍,每天新增200万数据,你的系统架构要如何演进?
如果你的系统承载的业务量翻了100倍,每天新增2000万数据,你的系统架构要如何演进?
候选人
这个。。。我们还没这种需求,所以我暂时还没想过这个问题。。。
面试官
心想:(这小伙子想面P6+ ?那是资深Java职位,起码得有点架构演进的意识吧,怎么一点意识都没有)
面试官对面试者的印象有点扣分了。。
【旁白解读】
实际上这类问题在BAT、美团、京东等大公司里面试,都是常问的,为什么呢?
因为大公司里的系统面对的就是业务经常翻倍的增长,系统压力越来越大,所以每年都要做几次技术升级,一直要进行架构演进。
所以在互联网公司里,架构设计能力中非常关键的一环,就是针对业务增长,架构演进的能力是非常核心的。
你要有一个意识说如果你的业务量10倍增长,100倍增长,你的系统架构要如何演进?这几乎是资深工程师必须要有的一个意识和能力。
其实大家可以思考一下,如果10倍增长,单表每年新增近亿数据,还能用单库单表的方式来承载吗?
肯定不行了,所以必然针对10倍增长的场景,需要引入分库分表的技术,保证每个库每个表分散一定的数据量,避免单表单库数据量过大。
那么大家再思考一下,如果100倍增长呢,每年单表新增近10亿数据,你分库分表也不一定够了。因为此时可能会有高并发访问的问题,数据库抗起来很吃力。
此时,你要不要考虑数据异构、冷热分离等数据存储的架构设计?
比如采用MySQL分库分表 + 分布式NoSQL数据库 + Elasticsearch分布式搜索 + Redis缓存的架构,来整体设计这个数据存储架构。
你可以先做冷热分离的架构,比如最热的数据放入分布式NoSQL数据库,专门承载当日数据的高并发写入,以及高性能的读写。
然后每过一段时间,做数据归档,把NoSQL里不再频繁使用的冷数据迁移到MySQL里去归档。
最后就是应对海量数据的检索,可以把索引构建在Elasticsearch里来应对,但是从NoSQL+MySQL的异构存储来提取明细数据即可。
而且针对一些特别热查询的数据,可以依托Redis做一个缓存。
其实那个P9面试官的面试评价里,期望的也是候选人把这一套架构说出来。虽然P6+的职级不一定说有能力完全hold住这个架构,但是起码要有这个意识。
结果候选人完全什么都说不出来,那当然会让人很失望了。
3、对公司底层技术的原理考察
这位同学他们的系统有一部分的数据是放在特殊存储服务里的,用的是云平台上的存储服务,而且存放在存储服务里的数据还是很核心的数据。
所以面试官就开始问第二个问题了。
面试官
你能说说你对这种特殊存储服务的理解吗,他的原理是什么?
你们用的云平台上的服务存储他的架构是什么样的,你们的存储是如何规划的?
候选人
我。。。一般是调用API往里面写数据,详细的还没太多关注过
面试官
心想:( 搞什么鬼,核心数据放这种特殊的存储服务里,结果从没关注过,起码也得了解一下他的原理,把人家的文档仔细看几遍吧 )
( 而且对于自己的存储是如何规划的,容量是否充足,他是怎么扩容的,怎么什么都不知道 )
【旁白分析】
这是该同学犯的第二个错误,不说资深工程师,就说作为一个高级工程师,应该对自己负责的系统使用到的方方面面都有一定的了解。
比如你要是用了语音转换API,或者是快递公司的查询API,那你起码知道人家背后大致在干什么,或者问清楚人家API的QPS极限,以及你们的访问量是多少。
你们用了特殊的存储服务,起码知道那种存储服务的实现原理是什么,存储的容量规划等等问题,这是一个高级工程师hold住自己工作的起码工作素养。
4、系统难点的考察
面试气氛尴尬,不过仍然继续。。。
面试官
那你觉得你们这个系统最大的技术难点是什么?
候选人
我想想(思索10秒后)。。。好像没什么难的,主要就是一些接口,然后数据就落入数据库了。。。
面试官
心想:(这家伙难道在公司混日子?)
【旁白分析】
大公司面试一定会问你系统的难点是什么,这代表你的项目经验有多少含金量。
哪怕你们项目很low,你硬凑平时也得想办法弄点新技术进去,没难点也要凑点儿难点出来,否则去面试必然给人鄙视。
举个例子,比如上面的这个系统,实际上他有一个步骤是要做数据迁移,也就是说把数据库里可能几百万数据量,一次性迁移到另外一套存储里去
那么这个数据迁移的步骤,其实涉及到千万级的数据量迁移。
你如何保证数据迁移的效率?如何保证迁移后的数据准确性?在迁移的过程中如何避免影响数据库的性能?
像这些问题,其实你平时都应该考虑一下,作为一个技术难点好好阐述一下吧。
5、擅长技术的考察
面试官
那你说说你认为自己最擅长最有深度的技术吧
候选人
我好像平时自己用MQ技术比较多一些
面试官
那你说说Kafka、RabbitMQ、RocketMQ几种MQ的对比,还有他们各自的原理。
它们分别如何实现分布式消息队列架构的,底层的机制都聊一下,对比一下特点以及优缺点。
候选人
心想:(。。。我要回家!)
【旁白分析】
大公司一定会考察你的技术深度,一般就是对你平时用的最多,或者最熟悉的技术深入挖掘和考察,看你的技术深度有多深。
结果这个同学自己说了MQ,但是对MQ的了解实际上非常的浅薄,深入的东西都说不出来,那么最后一定就是让面试官很无语了。
6、总结
其实这个同学技术底子还是不错的,包括一些技术的基础,所以前两轮面试都是过了的。但是第三轮面试考察的角度都是完全不同的,一下子暴露出来了他的能力缺陷。
对自己负责系统的架构演进完全无意识,负责系统的难点从没思考过,系统涉及的一些技术的细节不了解,没有技术深度的积累,都导致他在三面表现很不好,最后就是直接挂掉。
所以希望大家通过这篇文章,吸取这位同学的经验教训,平时多思考自己负责系统的技术难点,以及业务量成倍增长时架构如何演进,系统涉及到的各种技术的细节,以及积累相关技术的技术深度。
一大波微服务、分布式、高并发、高可用的原创系列文章正在路上,
欢迎关注公众号:石杉的架构笔记
周一至周五早八点半!精品技术文章准时送上!!!
十余年BAT架构经验倾囊相授