赞
踩
先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
如果你需要这些资料,可以添加V获取:vip204888 (备注大数据)
SCALA_HOME
变量值替换成自己的安装路径
G:\scala-2.12.11
Path环境变量:
%SCALA_HOME%\bin
即可进入终端测试:
Scala解释器也称REPL(Read-Evaluate-Print-Loop,读取-计算-打印-循环)。Win+R输入“cmd”打开命令提示符,直接输入“scala”就能进入REPL。也可以直接在Win+R中运行对话框中输入“scala”。
Scala的REPL提供paste模式,用于编写大量的代码,输入“:paste”代码编写完成后可以通过“Ctrl+D”组合键退出paste模式。
:paste
Scala常用数据类型
| Int | 32位有符号补码整数。数值区间为-32 768~32 767 |
| Float | 32位IEEE754单精度浮点数 |
| Double | 64位IEEE754双精度浮点数 |
| String | 字符序列 |
| Boolean | true或false |
| Unit | 表示无值,和Java中的void等同,用作不返回任何结果的方法的结果类型。Unit只有一个实例值,写成() |
Float和Double都表示浮点数,浮点数后面有f或F后缀时,表示这是一个Float类型,否则为Double类型。
String表示字符串,其用法是双引号包含一系列字符,单引号会报错。
Scala会区分不同类型值,并基于使用值的方式来确定其类型,称之为类型推断。例如在加法中混用Int和Double类型时,Scala会确定其结果值为Double类型。
Scala中数据分为两种类型,常量(也称值)和变量。通过“val"定义常量,通过”var“定义变量。
val name:type=initial_value
val关键字后面跟着常量、类型、等号和初始值。由于Scala具备类型推断功能,因此定义常量时可以不用显示地说明其数据类型。
若是需要显式地指明常量类型,可以在常量名后通过”:type“说明其类型。
常量名要求以字母或下划线开头后面跟着其他的字母、数字或下划线。注意变量名中不能使用美元符号($)。
一旦初始化常量val,就不能再进行修改,若强行修改会提示”error: reassignment to val“的错误。
变量的命名规则与常量一样,变量也可以不显式地说明其数据类型,但值得注意的是,只能将同类型的值重新赋值给变量,否则会提示” error: type mismatch“的错误。
var name:type=initial_value
而与var则不同, 变量定义之后还能重新赋值,注意只能修改为同类型值。
Scala运算符
| 算术运算符 | + | 两数相加 | 1+2或1.+(2) |
| - | 两数相减 | 1-2或1.-(2) |
| * | 两数相乘 | 1*2或1.*(2) |
| / | 两数相除 | 1/2或1./(2) |
| % | 两数取余 | 1%2或1.%(2) |
| 关系运算符 | > | 判断左值是否大于右值,正为真,负为假 | 1>2或1.>(2) |
| < | 判断左值是否小于右值,正为真,负为假 | 1<2或1.<(2) |
| >= | 判断左值是否大于等于右值,正为真,负为假 | 1>=2或1.>=(2) |
| <= | 判断左值是否小于等于右值,正为真,负为假 | 1<=2或1.<=(2) |
| == | 判断左值是否等于右值,正为真,负为假 | 12或1.(2) |
| != | 判断左值是否不等于右值,正为真,负为假 | 1!=2或1.!=(2) |
| 逻辑运算符 | && | 逻辑与,若两个条件成立为真,否则为假 | 1>2&&2>3或1>2.&&(2>3) |
| || | 逻辑或,若两个条件有一个成立为真,否则为假 | 1>2||2>3或1>2.||(2>3) |
| ! | 逻辑非,对当前结果取反 | !(1>2) |
| 位运算符 | & | 位与,参加运算的两个数据,按进制位进行&运算,两位同时为1结果才为1,否则为0 | 0&1或0.&(1) |
| | | 位或,参加运算的两个数据,按进制位进行|运算,两位只要有一个为1结果则为1 | 0|1或0.|(1) |
| ^ | 位非,参加运算的两个数据,按进制位进行^运算,两位不同时为1,相同为0 | 01或0.(1) |
| 赋值运算符 | = | 将右侧值赋于左侧 | val/var a = 1 |
| += | 执行加法后再赋值左侧 | a += 2 |
| -= | 执行减法后再赋值左侧 | a -= 1 |
| *= | 执行乘法后再赋值左侧 | a *= 3 |
| /= | 执行除法后再赋值左侧 | a /= 3 |
| %= | 执行取余后再赋值左侧 | a %= 2 |
| <<= | 左移位后赋值左侧 | a <<= 2 |
| >>= | 右移位后赋值左侧 | a >>= 2 |
| &= | 按位运算&后赋值左侧 | a &= 2 |
| |= | 按位运算|后赋值左侧 | a |= 2 |
| ^= | 按位运算^后赋值左侧 | a ^= 2 |
数组是一种存储了相同类型元素的固定大小的顺序集合。
var name:Arry[type] = new Arraytype或
var name:Array[type] = Array[type](ele1, ele2, …)
例如,声明一个不可变数组array1,长度是3,并为每个元素设置值。
初始化方式1:
var array1:Array[String]=new Array[String](3)
array1(0)="baidu";array1(1)="google";array1(2)="edge"
初始化方式2:
var array1:Array[String]=Array[String]("baidu", "google", "edge")
多维数组一个数组中的值可以是另一个数组,另一个数组的值也可以是一个数组。定义一个包含3个数组的二维数组。
初始化方式1:
var mdarr:Array[Array[Int]]=new ArrayArray[Int]
mdarr(0)=Array();mdarr(1)=Array();mdarr(2)=Array()
下面定义一个 3行的二维数组mdarr。
var mdarr:Array[Array[Int]]=new Array[Array[Int]](3)
初始化方式2:
var mdarr:Array[Array[Int]]=Array(Array(),Array(),Array())
直接定义一个3行3列的二维数组madrr1。
var mdarr1:Array[Array[Int]]=Array(Array(1,2,3),Array(2,3,4),Array(3,4,5))
数组基本操作方法
| arr.length | 返回数组的长度 |
| arr.head | 查看数组第一个元素 |
| arr.tail | 查看数据中除了第一个元素外的其他元素 |
| arr.isEmpty | 判断数组是否为空,返回布尔型结果 |
| arr.contains(x) | 判断数组是否包含元素x |
下表中为Scala中处理数组的重要方法,使用前需要引入包 import Array._
数组的常用方法
| def concatT | 合并数组 |
| def fillT(elem:=>T) | 返回数组,长度为第一个参数指定,每个元素使用第二个参数进行填充 |
| def ofDim[T](ele1:Int, ele2:Int) | 创建二维数组,只有一个ele参数时为一维定长数组 |
| def range(start:Int, end:Int) | 创建指定区间内的数组,step为每个元素间的步长,默认为1 |
**合并连接数组:**连接两个数组既可以使用操作符“++”,也可以使用concat方法。但是使用concat方法需要先引入包“import Array._”。
初始化ArrayBuffer数组:
创建可变数组需要导入包 import scala.collection.mutable.ArrayBuffer
val arrbuf:ArrayBuffer[type]=new ArrayBuffertype
import scala.collection.mutable.ArrayBuffer
val arrbuf:ArrayBuffer[Int]=new ArrayBuffer[Int]()
使用+=操作符,可以添加一个或多个元素。
使用++=操作符,可以添加其它集合中的所有元素。
可变数组常用操作
| insert(ele1, ele2) | 在指定位置ele1插入元素ele2 |
| remove(ele1, ele2) | 移除指定位置的元素,有两个元素时移除区间位置内元素 |
| toArray | 由可变数组转换为不可变数组 |
| toBuffer | 由不可变数组转换为可变数组 |
定义函数
def functionName (参数列表) : [return type] = {}
例如,定义一个函数add,返回两个整型数据之和。
def add (x:Int, y:Int):Int = {x+y}
此处两种函数作用效果一样,上面函数直接返回相加的结果,下面函数通过定义中间量sum计算两个整型的和并返回。
:paste
def add (x:Int, y:Int):Int = {
var sum = 0
sum = x+y
return sum
}
函数的定义由def关键字开始,add为函数名,紧接着是可选的参数列表需要指定参数类型,之后冒号“:”后接着函数的返回类型,一个等号“=”,最后“{}”部分为函数的方法体。
如果函数无返回值,则函数的返回类型为Unit。
调用函数
函数一旦定义,可通过函数名调用。
functionName(参数列表)
函数可以赋值给变量,注意,赋值给变量需要在函数后面加空格和下划线。
函数一旦定义完成,可通过函数名调用函数。
:paste
def add (x:Int, y:Int):Int = {
var sum = 0
sum = x+y
return sum
}
匿名函数即在定义函数时不给出函数名,经常成为“Lambda表达式”。匿名函数使用箭头“=>”定义,箭头左边是参数列表,箭头右边是表达式,表达式将产生函数的结果。
(参数列表) => 表达式
调用匿名函数可以将函数赋值给一个常量或变量,通过常量名或变量名调用该函数 。
val addInt = (a:Int, b:Int)=>a+b
如果函数中的每个参数在函数中最多只出现一次,则可以用占位符“_“代替参数,与上个示例函数相同 。
高阶函数即操作其它函数的函数。高阶函数可以使用函数作为参数,也可以使用函数作为输出结果。
高阶函数经常将只需要执行一次的函数定义为匿名函数作为参数。
val f = (a:Int, b:Int)=>a+b
def addInt(f:Int, c:Int):Int={f+c}
addInt(f(2,3),4)
上函数将匿名函数单独定义调用,下函数在addInt函数内直接定义匿名函数f复用定义相加功能,实现三个数相加的功能。值得注意的是,下函数在函数中定义匿名函数f时只是进行了函数定义,并没有写明代码功能,再进行调用时,可以定义其它运算功能复用。
:paste
def addInt(a:Int, b:Int, c:Int, f:(Int, Int)=>Int):Int = {
return f(a,b)+c
}
val result = addInt(3,4,5,(x,y)=>{x+y})
有时需要将函数定义为参数个数可变的形式,此时可使用变长参数定义函数。
例如,定义一个函数sum传入int类型的数据列表sum,通过for循环遍历列表nums进行累加操作。
:paste
def sum(nums:Int*):Int = {
var res = 0
for (num<-nums) {
res += num
}
return res
}
if (布尔表达式1) {
// 若布尔表达式1为true 则执行该语句块
}else if (布尔表达式2) {
// 若布尔表达式2为true 则执行该语句块
}else {
// 若以上条件都为false 执行该语句块
}
例如,通过if循环判断i的大小区间并对各区间结果进行输出。
var i=5
:paste
if (i<5) {
println("i小于5")
} else if (i>5) {
println("i大于5")
} else {
println("i等于5")
}
while先判断后执行,do while先执行后判断。
当不满足循环条件时,while循环一次都不会执行,do while循环至少执行一次。
while (表达式) {
循环体
}
do {
循环体
} while (表达式)
var a=21
while (a<=20) {
println(a)
a+=1
}
var b=21
do {
println(b)
b+=1
} while (b<=20)
for (变量<-表达式) {
语句块
}
其中”变量<-表达式“被称为”生成器“。
to遍历方式,前后闭合
var a=0
for (a<-1 to 5) {
println("Value of a:"+a)
}
until遍历方式,前闭合后开
var a=0
for (a<-1 until 5) {
println("Value of a:"+a)
}
遍历数组列表
var a=0
val numArray=Array(1,2,3,5)
for (a<-numArray) {
println("Value of a:"+a)
}
for循环中使用if判断语句,循环守卫。等效for循环嵌套if判断。
var a=0
val numArray=Array(1,2,3,4,6,8,9)
for (a<-numArray if a!=3 if a<8) {
println("Value of a:"+a)
}
var a=0
val numArray=Array(1,2,3,4,6,8,9)
for (a<-numArray) {
if (a!=3 && a<8) {
println("Value of a:"+a)
}
}
for推导式,迭代原数组列表构造新数组列表。
for { 子句 } yield { 变量或表达式 }
var a=0
val numArray=Array(1,2,3,4,6,8,9)
var restVal=for {a<-numArray if a!=3 if a<8} yield a
for (a<-restVal) {println("Value of a:"+a)}
为了提前终止整个循环或跳到一下个循环,Scala没有break和continue关键字。
Scala提供了一个Breaks类(位于包scala.util.control)。
Breaks类有两个方法用于对循环结构进行控制,即breakable和break。
breakable {
…
if ( … ) break
…
}
import scala.util.control.Breaks._
for遍历在breakable方法体中
val array=Array(1,3,10,5,4)
breakable {
for (i<-array) {
if (i>5) break
println(i)
}
}
breakable方法在for循环方法内
val array=Array(1,3,10,5,4)
for (i<-array) {
breakable{
if (i>5) break
println(i)
}
}
元组与数组列表一样不可变,但与数组列表不同的是元组可以包含不同类型的元素。
元组的索引从1开始(_1、_2),最大长度支持22。
初始化方式1:
var tup=()
初始化方式2:
new Tuple后直接加数字表示数组列表的长度。
var tup=new TupleInt()
tup._1
tup.productIterator.foreach(i=>{println("Value:"+i)})
使用Tuple.toString()方法将元组的所有元素组合成一个字符串。
不同于Java的java.util.List,Scala的List一旦被定义就不能改变值,因此声明List时必须初始化。
初始化方式1:
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
初始化方式2:
new Tuple后直接加数字表示数组列表的长度。
var tup=new TupleInt()
tup._1
tup.productIterator.foreach(i=>{println("Value:"+i)})
使用Tuple.toString()方法将元组的所有元素组合成一个字符串。
不同于Java的java.util.List,Scala的List一旦被定义就不能改变值,因此声明List时必须初始化。
初始化方式1:
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
[外链图片转存中…(img-jpPLbqH6-1713323020014)]
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。