当前位置:   article > 正文

大数据的学习路线_研究生搞大数据,是否需要先找份java实习

研究生搞大数据,是否需要先找份java实习

 

1、为什么要学习大数据?

1.1,门槛

它比 Java 高一点,因为除了对数据库的操作之外,要学习大数据生态的东西,需要会分布式、数仓、中间件等知识。它比机器学习低一些,不需要你会很多的机器学习算法和数学知识,而像机器学习算法和数学知识是需要长时间的磨练和沉淀,所以做这块的研究生和博士居多。

无论是哪个学校的计算机专业,Java、数据、C、C++什么的都会接触到,但是大数据呢?第一批大数据专业的学生现在大二,所以现有的大数据岗位的人都是自学的,谈不上对口不对口,对口更多的指计算机基础。但是再过两年就不一定了,所以「早,就是优势」

1.2,薪资高

这个估计才是吸引大部分人学习的原因。同一家公司同一级别,普通开发岗和大数据开发薪资还是会差一个档次的,具体多少视公司而定。

1.3,积累性和挑战性

一些在传统企业或者国企的资深开发者,但是他们对自己的职业也迷茫和担忧,在群里经常讨论一些分布式,Redis、Zookeeper等知识的时候,他们显的格格不入。因为他们长期在企业里 CRUD(增删改查),与现在互联网技术发展产生隔阂了,既憧憬又畏惧。

为什么说大数据开发是积累性又有挑战性的呢?

了解过大数据的应该知道大数据的「4V理论」,随着时间的发展,企业产生的数据量肯定越来越大。在以前,我们对数据是不重视的,但是随着机器学习的发展,数据是越来越重要的。了解机器学习应该都知道,训练模型之前都会有一个特征工程的步骤,特征工程就是来处理数据的,然后喂给模型。又好又多质量又高的数据会让这个模型更聪明和健壮,相当于燃料,模型才能更好地自我训练,然后才有现在的「推荐喜欢」和「全民抖音」。

如果你只是进行一些数据库的增删该查或者一些页面展示什么的,这些套路都是可复用的,讲究能用就行。但是大数据不一样,无论你是做平台的建设,数仓,计算等,一些场景一些机制都是需要你去思考的。

1.4,推动你现有岗位的发展。

大数据+现有岗位是一个趋势。大数据来临的时候,你前端不用做一些静态化,或者一些缓存机制吗?会一些 Hive、Hadoop,做可视化或和后端对接的时候是不是更有优势呢?后端学一些大数据的觉得是必要的,例如Kafka、Zookeeper等分布式、缓存相关的数据存储和传输是进阶 Java 必会的,让你在现有企业需要转型的时候可以直接就上。而运维呢?分布式集群运维,各个大数据平台上的节点运维,这不是一个趋势吗?

什么都不学,认为现在的公司用不到,等公司要用到的时候,你会,可能就是一个负责人或者给你升职加薪巴结你试试,因为这样成本小,知根知底。不会呢,就直接招会的人过来了,而你就危险了。

1.5,过渡到机器学习人工智能的捷径

随着科技的进步,包括硬件和软件,机器学习的使用门槛会越来越低,为什么这里强调使用。因为研究部门在每一家公司都是极少数的,更多的是在调库,调参。而随着硬件的进步,很多算法都是封装好的,可以进行傻瓜化操作,我们只需要给他喂数据。

2、学习大数据门槛

无论什么岗位,英语好和数据学能摸到的天花板更高。但是大数据开发不像机器学习,日常阅读国外 paper 和对模型算法进行调优,不要求你去读西瓜书和统计学去弄懂线性回归等数学知识。

有些人可能说我智商不行,别人记住一个知识点要10分钟,我要一个小时。有些人会反驳「你的努力还谈不上比智商」。这边说一下我对「智商」的看法:智商其中是一个很广的东西,有些人学习上比你好,但生活上不一定比你聪明。我们不可否认初高中的时候,有些学霸没怎么读书就可以考的很好,有些人很努力但也没那么好。无法否认,这就是天赋。有些人天生逻辑思维好,对数学或者知识的抽象能力很厉害,能摸到的天花板更高。我们定位好自己就是了,智商高而且在顶层的总是那么几个人,而更多的是在中间那一层,而那一层拼的不仅仅智商,智商高的也不一定写代码写的比你好,所以百分之 98 的人的智商拿来开发够用了。

 

很多初学者,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习qq群:19942---7210,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系
 

所以大数据开发是一个既有门槛但又不是门槛特别高的方向,正常人只要找到适合自己的路线和找对学习方法都可以的。

3、学习路线

首先学大数据分为两种,学生和在职,请对号入座。

3.1,学生必读

首先要知道一点,只要你是在校生,无论你是不是科班,差别都不会很大。科班的意义是基础扎实,但是你看现在计算机专业的,哪几个扎实了。反而是非科班的,会意识到这一点,然后去补缺补漏。

如果你还是大一大二的话,可以扎实地补补基础。如果静不下心学基础的话,可以做做项目,然后赶紧去找实习。而且我也建议以找实习为目的进行学习,不然很容易迷茫和漫无目的地学习,最终学了什么自己都不知道,以目的为导向进行学习很重要。

如果你是大三大四,该准备春秋招了,大三的春季实习招聘要好好把握,这时如果找到一份大厂实习,那秋招就没什么压力。大四的春招也很重要,因为这是最后一次学生身份参加招聘,门槛还是低一下。

在校生的面试,无论大厂还是小厂都有一套方法论。首先要书写一份好的简历,防止卡在简历这关。简历的话我一直都有在帮我群里那帮兄弟参考,效果都很明显,因为这块不算今天的内容里面,有需要帮忙看的朋友可以加文章末的好友细聊。小公司注重项目,基础要求相对不高;大公司除了要求项目,还需要你基础够好。在校生要学大数据的话,建议先找份Java的实习,然后再跳到大数据岗位,因为大数据也是需要Java知识,这样一个过渡比较好。

3.2 学生学习路线:

  • Javase和项目我是建议同步进行,因为你想要完全学好一门语言再去接触项目,看似可行,实则不太好。反而是两者相辅相成,利于及时调整。
  • 当能把项目写在简历上的时候就去投,去面试,面试可以收获非常多东西。因为这时候JVM和多线程还不会,所以只能去投一些小公司。当后面把JVM和多线程补起来的时候可以进军大公司。
  • 数据结构和算法需要贯穿整个个学习周期。提高算法前期以刷剑指offer这本书为主,刷到能手写代码。建议先在大三找份Java实习,然后找到实习之后接着学大数据知识,这样既完成了阶段性目的,也为了下一阶段做准备。

3.3,在职人员必读

首先,不建议裸辞,除非你经济上无任何负担以及做好了各种准备。要转行的建议业余先抽时间出来了解了解,看自己是否真的想从事这个行业。

如果你之前已经是Java开发,那很好,要过渡到大数据先看看上面的8天Hadoop入门,或者直接看 Hadoop 权威指南都可以。然后结合我的面经学学一些理论知识,还有一些实战面试题,再做个项目就可以马上去面试了。学的差不多就可以投了,一定不要拖太久,越拖会越没信心。

如果你之前是 PHP 开发,或者DBA 什么的,建议重新回顾下Java。因为大数据目前还是以Java为主要开发语言,回顾完Java基础之后,可以直接看8天 Hadoop入门,然后做项目,除了大数据项目之外,建议补一到两个技术栈比较好的项目,不然简历面不好过。

如果你是零基础想转行的话,建议先找份Java开发,零基础一下子跨越到大数据有点大。建议先踏入编程这个行业,然后再去转大数据,过程会比较有反馈。零基础的话不建议一上来就算法什么计算机基础,先直接学Java,可以看看Java的基础视频,然后自己鼓捣几个项目,去找个小公司。这样周期会比较快,然后在这家公司快速学习,可以补补基础,或者学习学习大数据。

3.4,在职人员学习路线:

  • Javase视频我是用慕课网的三个视频入门的,我不太建议一次性看完黑马等那些培训视频,看完花都谢了,而且周期这么长,容易看了后面忘了前面,时不时的还怀疑自己。我是建议看完这三个视频入门一下,后面根据项目需要缺啥补啥。
  • 项目的话分两种情况,一种是平时练手的,一种是针对面试的。练手的话,无论大小,无论类型都可以。针对面试还是得选一些有特点,面试的是扯的开的。至于项目的获取渠道有慕课网以及培训视频,或者都没你中意的,你可以加我微信我针对性推给你。
  • 至于项目的面试,推荐「石杉的架构笔记」这个公众号,里面有很多关于项目的场景回答和分布式知识。我会经常将这个公众号的文章推到我的学习群进行解答一些群友的问题。
  • JVM & 多线程。自己做项目的话很难实质性地接触到这两块,更多的是应对面试。如果你直接啃这两块的话很晦涩,但是你经过项目训练之后再去做这两块就会有很多代入场景。
  • 大数据组件学习。无论你想做大数据的哪个方向,Hadoop 都是必学的,学完这个之后后面可以根据你想做的方向进行针对性学习。

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/630919
推荐阅读
相关标签
  

闽ICP备14008679号