赞
踩
先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新Golang全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上Go语言开发知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
如果你需要这些资料,可以添加V获取:vip1024b (备注go)
分析:
slice2 := slice1
slice1
和slice2
指向的都是同一个底层数组,任何一个数组元素被改变,都可能会影响两个切片。slice1
和slice2
指向的都是相同数组,但在触发扩容操作后,二者指向的就不一定是相同的底层数组了,具体可参考上面的slice
扩容规则。深拷贝:拷贝的是数据本身,会创建一个新对象。
copy(slice2, slice1)
新对象和原对象不共享内存,在新建对象的内存中开辟一个新的内存地址,新对象的值修改不会影响原对象值,既然内存地址不同,释放内存地址时,可以分别释放。
当切片的底层数组很大,但切片所取元素数量很小时,底层数组占据的大部分空间都是被浪费的。
比如切片b的底层数组很大,切片a只引用了切片b很小的一部分,只要切片a还在,切片b底层数组就永远不会被回收,这样就造成了内存泄露!
代码示例:
var a []int
func test(b []int) {
a = b[:1] // 和b共用一个底层数组
return
}
解决方法:
不要引用切片b的底层数组,将需要的数据复制到一个新的切片中,这样新切片的底层数组,就和切片b的底层数组无任何关系了。
var a []int
func test(b []int) {
a = make([]int, 1)
copy(a, b[:0])
return
}
切片不是并发安全的,要并发安全,有两种方法:
面试题:切片和map的数据结构并发安全吗?
答:切片的写入和map
的写入一样都是非线程安全的,但是map
有sync.Map{}
,切片只能通过加锁
或channel
方式来实现线程安全的并发写操作。
加锁:适合于对性能要求不高的场景,毕竟锁的粒度太大,这种方式属于通过共享内存来实现通信。
代码示例:
func TestSliceConcurrencySafeByMutex(t *testing.T) {
var lock sync.Mutex //互斥锁
a := make([]int, 0)
var wg sync.WaitGroup
for i := 0; i < 10000; i++ {
wg.Add(1)
go func(i int) {
defer wg.Done()
lock.Lock()
defer lock.Unlock()
a = append(a, i)
}(i)
}
wg.Wait()
t.Log(len(a))
// equal 10000
}
channel:适合于对性能要求大的场景,channel
就是专用于goroutine
间通信的,这种方式属于通过通信来实现共享内存,而Go的箴言便是:尽量通过通信来实现内存共享,而不是通过共享内存来实现通信
,推荐此方法!
代码示例:
func TestSliceConcurrencySafeByChanel(t *testing.T) {
buffer := make(chan int)
a := make([]int, 0)
// 消费者
go func() {
for v := range buffer {
a = append(a, v)
}
}()
// 生产者
var wg sync.WaitGroup
for i := 0; i < 10000; i++ {
wg.Add(1)
go func(i int) {
defer wg.Done()
buffer <- i
}(i)
}
wg.Wait()
t.Log(len(a))
// equal 10000
}
参考3:Golang比较两个字符串切片是否相等
方式一:reflect.DeepEqual(s1, s2)方法
func equal( s1 []int , s2 []int ) bool {
return reflect.DeepEqual(s1, s2)
}
说明:reflect.DeepEqual()
接收的是两个interface{}
类型的参数,首先判断两个参数的类型是否相同,然后才会根据类型层层判断。
方式二:循环遍历切片逐个元素进行比较
func equal( s1 []int , s2 []int ) bool {
if len(s1) != len(s2) {
return false
}
for i := 0; i < len(s1); i++ {
if s1[i] != s2[i] {
return false
}
}
return true
}
在Go语言中,append函数用于向切片(slice)追加元素。append的时间复杂度是均摊 O(1) 的,这意味着在大多数情况下,单次append操作的时间复杂度是常数级别的。
append操作的均摊复杂度为O(1),是因为Go在进行append操作时,会使用一种动态扩容的机制。当切片的容量不足以容纳新增元素时,Go会创建一个新的底层数组,并将原始元素复制到新的数组中。这样做的目的是确保在大多数情况下,append的时间复杂度是常数级别的。
具体来说,append操作的均摊时间复杂度为O(1) 意味着执行N次append操作的总时间复杂度为O(N),其中N为元素的总个数。每次append操作的平均时间复杂度是常数级别的,但在某些情况下可能需要进行底层数组的重新分配和复制,导致某次append操作的耗时略高。
需要注意的是,虽然append的均摊时间复杂度是O(1),但在实际编程中,仍然需要注意避免频繁进行append操作,尤其是在循环中,因为每次append都可能触发底层数组的重新分配和复制,影响性能。
参考1:Golang协程详解和应用
Golang
的协程是为了解决多核CPU
利用率问题,Golang
语言层面并不支持多进程或多线程,但是协程更好用,它是一种轻量级的并发执行单元,是Golang
语言提供的一种特性,使得在同一个程序中可以同时执行多个函数或方法,实现高效的并发编程。协程被称为用户态线程,因为不存在CPU
上下文切换问题,所以效率非常高。
两两区分:进程与线程、线程与协程。
进程:
资源分配
的最小单位。线程:
资源调度
的最小单位)。栈空间
和寄存器
,因此CPU切换一个线程的开销远比进程要小很多,同时创建一个线程的开销也比进程要小很多。进程和线程的关系:
协程:
栈内存
消耗默认为2KB。创建一个线程则需要消耗MB级别以上的栈内存
。内核级
的,相对较重量级,通常解决的办法就是线程池。用户级
。因此在Go语言中可以轻松创建成千上万个协程而不会导致资源耗尽。这种特性使得Go语言在并发编程中非常高效,可以充分利用多核处理器的能力,实现高性能的并发程序。参考1:线程间到底共享了哪些进程资源
线程的私有信息:
线程的共享信息:线程之间共享除线程上下文信息
中的所有内容,包括栈区、堆区、代码区、数据区。
代码区:进程中的代码区存储的是编译后的可执行机器指令。而这些机器指令是从可执行文件中加载到内存的。
线程之间共享代码区,意味着任何函数都可以被线程执行。
堆区:malloc/new
出来的数据就存放在这个区域。
栈区:线程的上下文信息通常是私有的,但它们并没有严格的隔离机制来保护。因此, 若一个线程能拿到来自另一个线程栈帧上的指针,那么该线程就可以改变另一个线程的栈区。
文件:若线程保存有打开的文件信息,则进程打开的文件也可以被所有的线程使用,这也属于线程间的共享资源。
不可以,因为线程是资源调度的最小单位,一个进程至少要有一个线程来作为主线程。
共享
的内存区域,主要存放对象实例,这说明一个线程在堆上分配的内存可以被其他线程访问和使用,但需要注意对堆内存的访问进行同步控制,以避免竞态条件和内存访问冲突。独享
的内存区域,主要存放各种基本数据类型、对象的引用,一个线程的栈上的数据只能被自己的代码访问,其他线程无法直接访问。参考1:https://zhuanlan.zhihu.com/p/323271088
只看 二、Goroutine调度器的GMP模型的设计思想
往后的即可。
Golang
的协程调度是通过GMP模型
实现的。
P(Processor)在Golang中指的是逻辑处理器。每个P负责调度和管理一组协程的执行。逻辑处理器(P)是协程与操作系统线程(M)的中间层,它允许多个协程在一个操作系统线程(M)上进行并发执行,如果线程想运行协程,必须先获取逻辑处理器(P)。
P与处理器核心(物理处理器)是不同的概念。逻辑处理器(P)的数量默认情况下与处理器核心数相同,但Go运行时可以根据系统的负载情况动态地增加或减少逻辑处理器(P)的数量,以适应程序的并发需求。每个逻辑处理器(P)会从全局的运行队列中获取待执行的协程,并将其映射到一个空闲的操作系统线程(M)上执行。
面试官的回答:协程只是一个虚拟的概念,是Go
语言层面的一个东西。其实就是一段代码,依赖于操作系统来执行的,GMP本质是一个调度的工具,帮我们把程序代码怎么合理的分配到一个线程上的。
在Go
中,线程是最终运行协程实体,调度器的功能是把可运行的协程分配到工作线程上。
Global Queue
):存放等待运行的协程。GOMAXPROCS
(可配置)个。逻辑处理器(P)的数量默认与处理器核心数相同,但Go运行时可以在运行时动态增加或减少逻辑处理器的数量,以适应程序的并发需求。逻辑处理器的数量决定了并行执行的协程数目,当逻辑处理器的数量较多时,Go语言可以更充分地利用多核处理器。协程调度器和操作系统的调度器是通过线程结合起来的,每个线程都代表了1个内核线程,操作系统的调度器负责把内核线程分配到CPU
的核上执行。
逻辑处理器P的数量:默认情况下与物理处理器核心数相同,但Golang
运行时可以根据系统的负载情况动态地增加或减少逻辑处理器(P)的数量,以适应程序的并发需求。
线程M的数量:在Golang
中,M(Machine
)的数量由Golang
运行时(runtime
)根据系统的负载情况和配置参数进行决定。M
是Golang
语言运行时的操作系统线程,负责管理和执行Goroutine
。在运行时,Golang
语言会根据以下因素来确定M的数量:
Golang
运行时会根据当前系统的负载情况来调整M
的数量。如果系统负载较高,可能会增加M
的数量,以充分利用多核处理器的性能。相反,如果系统负载较低,可能会减少M
的数量,以节省资源。GOMAXGCTIME
是一个环境变量,用于控制垃圾回收的时间。Golang
运行时会根据垃圾回收的负载情况来调整M
的数量。垃圾回收是Golang
语言运行时的一个重要机制,它负责回收不再使用的内存。Golang
程序需要处理大量的并发任务,Golang
运行时可能会增加M
的数量以满足性能需求。反之,如果程序并发需求较低,Golang
运行时可能会减少M
的数量以减少资源占用。总的来说,M
的数量是由Golang
运行时动态调整的,目的是根据系统负载和性能需求,充分利用多核处理器的性能,实现高效的并发编程。开发者可以通过GOMAXPROCS
等环境变量来进行一定的调整,但一般情况下不需要手动管理M的数量,Golang
语言运行时会自动处理。
线程M
与逻辑处理器P
的数量没有绝对关系,一个线程M
阻塞,逻辑处理器P
就会去创建或者切换另一个线程M
,所以,即使逻辑处理器P
的默认数量是1,也有可能会创建很多个线程M
出来。
逻辑处理器P和线程M何时会被创建:
逻辑处理器P
何时创建:在确定了逻辑处理器P
的最大数量n后,系统启动时系统会根据这个数量创建n个逻辑处理器P
。线程M
何时创建:没有足够的线程M
来关联处理器P
并运行其中的可运行的Goroutine
。比如所有的线程M
此时都阻塞住了,而处理器P
中还有很多就绪任务,就会去寻找空闲的线程M
,而没有空闲的,就会去创建新的线程M
。参考:Golang高并发编程技巧:深入理解Goroutines的调度策略
Goroutine
的调度策略主要包括三个方面:抢占式调度、协作式调度、Work Stealing。
Golang
的调度器采用的是抢占式调度策略,即任何一个Goroutine
的执行都可能被其他Goroutine
随时中断。这种调度策略的好处是能够合理分配CPU
资源,防止某个Goroutine
长时间独占CPU
而导致其他Goroutine
无法执行。当一个Goroutine
被抢占时,调度器会将其状态保存,并切换到其他可执行的Goroutine
。Golang
的调度器还采用了协作式调度策略。在协作式调度中,Goroutine
会自动放弃CPU
的执行权利,而不是一直占用CPU
。通过在适当的时机主动让出CPU
,在Goroutine
之间合理切换,可以提高整个系统的并发性能。Work Stealing
是Golang
调度器中的一个非常重要的机制。它的核心思想是让处在空闲状态的线程主动“偷取”其他线程的任务来执行,从而实现线程之间的负载均衡。这种机制能够避免某些线程工作过多,而其他线程一直处于空闲状态的情况,进一步提高并发程序的性能。参考1:http://t.zoukankan.com/ExMan-p-12091738.html
计算机资源是有限的,所以Goroutine
肯定也是有限制的,单纯的Goroutine
,一开始每个占用2KB内存,所以这里会受到内存使用量的限制,还有Goroutine
是通过系统线程来执行的,Golang
默认最大的线程数是10000个。可以通过runtime/debug
中的SetMaxThreads
函数,设置M的最大数量。但要注意线程和Goroutine
不是一一对应关系,理论上内存足够大,而且Goroutine
不是计算密集型的话,可以开启无限个Goroutine
。
RWMutex
)channel
)协程是用户态。
来自GPT3.5的回答
func worker(stopCh <-chan struct{}) {
for {
select {
case <-stopCh:
// 收到停止信号,安全退出
return
default:
// 正常处理任务
}
}
}
func main() {
stopCh := make(chan struct{})
go worker(stopCh)
// 停止并退出协程
// 发送停止信号到通道
close(stopCh)
// 或者使用: stopCh <- struct{}{}
}
import (
“context”
)
func worker(ctx context.Context) {
for {
select {
case <-ctx.Done():
// 收到取消信号,安全退出
return
default:
// 正常处理任务
}
}
}
func main() {
ctx, cancel := context.WithCancel(context.Background())
defer cancel() // 释放资源
go worker(ctx)
// 停止并退出协程
cancel()
}
在这个例子中,我们使用context.WithCancel创建一个Context,并在main函数中调用cancel函数来发送取消信号给worker协程。
步骤:
package main
import (
“fmt”
“sync”
“time”
)
func worker(id int, wg *sync.WaitGroup) {
defer wg.Done()
fmt.Printf(“Worker %d started\n”, id)
time.Sleep(1 * time.Second) // 模拟耗时的工作
fmt.Printf(“Worker %d finished\n”, id)
}
func main() {
const numWorkers = 3
var wg sync.WaitGroup
wg.Add(numWorkers)
for w := 1; w <= numWorkers; w++ {
go worker(w, &wg)
}
wg.Wait()
fmt.Println(“All workers have finished. Continue with the main process.”)
}
在上面的例子中,我们使用了sync.WaitGroup来控制并发数。首先,我们调用wg.Add(numWorkers)来设置等待组的计数器为numWorkers,表示有numWorkers个协程需要等待。然后,在每个协程的处理函数中,我们使用defer wg.Done()在函数执行完成时通知等待组计数器减1。最后,我们调用wg.Wait()来阻塞主线程,直到所有协程完成。
通过这种方式,我们可以控制并发数为numWorkers,确保所有协程都完成后再继续执行主线程的后续逻辑。这是一种简单而有效的方式来管理并发协程。
每个Goroutine的栈内存大小默认为2KB,这在大多数情况下是足够的。但是,栈内存的大小可以通过Golang的runtime.Stack函数来查看或者通过runtime.GOMAXPROCS函数设置。
除了栈内存,每个Goroutine还会占用少量的额外内存,用于Goroutine的管理和调度。这些开销相对较小,通常在几KB的范围内。
defer+recover来捕获并处理异常。
来自GPT3.5的回答:
在Go语言中,协程(Goroutine)的异常不能被其他协程捕获或控制,而是会导致整个程序崩溃。这是Go语言设计的一种原则,即一个Goroutine的异常不应该影响其他的Goroutines,而应该由每个Goroutine自己负责处理异常。
当一个Goroutine发生了未被捕获的异常(例如数组越界、空指针等),Go语言运行时会把该异常视为致命错误,并会终止整个程序的运行。这是为了确保程序在出现严重错误时能够快速停止,避免继续运行可能导致更严重问题的状态。
虽然无法直接控制协程抛出的异常,但我们可以在每个Goroutine中使用recover函数来捕获并处理异常。recover函数只能在defer语句中调用,用于捕获panic引发的异常。通过在Goroutine的处理函数中使用defer和recover,可以捕获异常并在出现异常时采取一些处理措施,从而避免整个程序崩溃。
package main
import (
“fmt”
)
func worker() {
defer func() {
if r := recover(); r != nil {
fmt.Println(“Recovered from:”, r)
}
}()
// 模拟发生异常
var arr [5]int
fmt.Println(arr[10]) // 会导致数组越界异常
}
func main() {
go worker()
// 主协程休眠等待一段时间
// 这是为了让Goroutine有足够的时间执行
// 在实际应用中,可能需要采用更好的方式来等待Goroutine的执行
select {}
}
在上面的例子中,我们在worker协程中使用了defer和recover,用于捕获可能发生的异常。当数组越界异常发生时,recover会捕获该异常,并在控制台打印异常信息,但程序不会崩溃,而是继续执行。
需要注意的是,即使在一个协程中使用了recover捕获了异常,其他的协程仍然不受影响。异常只会影响当前的协程,而不会影响其他的协程。因此,在Golang中,建议每个协程都独立处理可能的异常,确保程序在出现异常时能够优雅地处理错误。
同 2.3 Golang最多能启动多少个协程
因素:计算机内存
和线程数
。
并发处理。有缓冲的channel可以控制并发数目,从而实现多线程的并发处理。
答:通过channel,将错误信息放入channel中,父级协程监听该channel就能获取到子级的错误信息了。
使用sync.WaitGroup来实现监听多个协程同步返回的情况。
在Go语言中,调用time.Sleep会使当前的goroutine进入休眠状态,让出CPU的执行权给其他可运行的goroutine。当一个goroutine调用time.Sleep时,它会被放入等待队列,等待指定的时间过去后再被重新放入可运行队列,准备再次执行。
Go语言的调度器采用抢占式调度,即在每个goroutine执行的适当点上,调度器都有机会检查是否有更高优先级的goroutine可以运行。因此,当一个goroutine调用time.Sleep时,它就放弃了CPU的执行权,调度器会在这个时候选择其他可运行的goroutine来执行。
具体的执行流程可以描述如下:
这种抢占式调度的机制使得在休眠期间,其他goroutine有机会继续执行,提高了并发程序的效率。需要注意的是,time.Sleep会导致当前goroutine休眠,但不会阻塞整个线程,因此其他goroutine仍然可以在同一个线程上执行。
首先要记住的是 Go语言使用的是基于标记-清除(Mark-Sweep)算法
改进后的三色标记法
来进行内存垃圾回收。
垃圾回收这块整理起来比较繁琐,特别是三色标记法这块,参考和结合的地方较多,所以在具体内容附近加了很多参考的链接,可以复制查找出处。
参考1:浅析 Golang 垃圾回收机制
参考2:Golang 垃圾回收
参考3:Golang 垃圾回收机制详解
参考4:Golang-垃圾回收原理解析
参考5:图解Golang垃圾回收机制!
常见的垃圾回收算法:
标记 — 清除法
三色标记法
按照对象生命周期长短划分不同的代空间,生命周期长的放入老年代,短的放入新生代,不同代有不同的回收算法和回收频率。浅析 Golang 垃圾回收机制
这样划分,堆就分成了Young和Old两个分区,因此GC也分为新生代GC和老年代GC。Golang-垃圾回收原理解析
对象的分配策略:Golang-垃圾回收原理解析
代表语言: Java
优点: 回收性能好。
缺点: 算法复杂。
浅析 Golang 垃圾回收机制
引用计数法会为每个对象维护一个计数器,当该对象被其他对象引用时,该引用计数加1,当引用该对象的对象销毁(引用失效)时减1,当引用计数为0后即可回收对象。浅析 Golang 垃圾回收机制
代表语言: Python、PHP、Swift。
优点: 对象回收快,因为引用计数为0则立即回收,不会出现内存耗尽或达到某个阈值时才回收。
缺点:
若是A引用了B,B也引用了A,形成循环引用,当A和B的引用计数更新到只剩彼此的相互引用时,引用计数便无法更新到0,也就不能回收对应的内存了
)Golang 垃圾回收机制详解参考:Golang-垃圾回收原理解析
主要分为标记和复制两个步骤:
优点:
缺点:
所以 标记 — 清除法
就是从根变量开始遍历所有引用的对象,然后对引用的对象进行标记,将没有被标记的进行回收。浅析 Golang垃圾回收机制
代表语言: Golang
(三色标记法)
优点:解决了引用计数的缺点。
缺点:需要STW(Stop The World)
,即暂时停掉程序运行。
算法分两个部分: 标记(mark)
和清除(sweep)
。标记阶段表明所有已使用的引用对象,清除阶段将未使用的对象回收。
具体步骤: 图解Golang垃圾回收机制!
STW
(Stop The World
即暂停程序业务逻辑),然后从main
函数开始找到不可达的内存占用和可达的内存占用。STW
,让程序继续运行,循环该过程直到main
生命周期结束。标记出所有可达对象,然后将可达对象移动到空间的另外一段,最后清理掉边界以外的内存。
优点:
缺点:
STW
时间比标记清除算法高。三色标记法只是为了叙述方便而抽象出来的一种说法,实际上的对象是没有三色之分的 浅析 Golang 垃圾回收机制。前面的标记-x类算法都有一个问题,那就是STW
(即gc时暂停整个应用程序),三色标记法是对标记阶段进行改进的算法,目的是在不暂停程序的情况下即可完成对象的可达性分析,垃圾回收线程将所有对象分为三类:Golang-垃圾回收原理解析
优点: 不需要STW
。Golang-垃圾回收原理解析
缺点: Golang-垃圾回收原理解析
三色标记算法属于增量式GC算法,回收器首先将所有对象着色成白色,然后从gc root出发,逐步把所有可达的对象变成灰色再到黑色,最终所有的白色对象都是不可达对象。Golang-垃圾回收原理解析
具体流程图:浅析 Golang 垃圾回收机制
具体流程文字描述:Golang-垃圾回收原理解析
Golang
语言的垃圾回收器(Garbage Collector,GC
)会导致程序的停顿,这种停顿被称为Stop-The-World(STW)
。在Golang
语言中,有两个主要的停顿事件:一是用于标记对象的停顿,二是用于清理和回收不再使用的对象的停顿。
STW
停顿。在Golang
语言中,标记阶段是由GCTime
触发的,默认情况下,GCTime
为100ms
,表示每隔100ms
就会进行一次标记阶段的垃圾回收。可以通过设置环境变量GOGC
来调整GCTime
的值。STW
停顿。在清理阶段,回收器会扫描和清理被标记为不再使用的对象,并将它们的内存释放回堆。清理阶段的时间通常较短。总的来说,垃圾回收的STW
停顿主要发生在标记阶段和清理阶段。标记阶段的频率由GCTime
控制,而清理阶段在标记阶段之后立即进行。Golang
语言的垃圾回收器的设计目标之一是尽量减小STW
时间,以提高程序的响应性。因此,Golang
的垃圾回收器采用了一些技术手段,如并发标记(Concurrent Marking
)和并发清理(Concurrent Sweeping
),以减小STW
的影响。
这种方法看似很好,但是将GC
和程序会放一起执行,会因为CPU
的调度可能会导致被引用的对象会被垃圾回收掉,从而出现错误。图解Golang垃圾回收机制!
分析问题的根源所在,主要是因为程序在运行过程中出现了下面俩种情况:图解Golang垃圾回收机制!
因此在此基础上拓展出了两种方法,强三色不变式和弱三色不变式。图解Golang垃圾回收机制!
参考:图解Golang垃圾回收机制!
为了实现这两种不变式的设计思想,从而引出了屏障机制,即在程序的执行过程中加一个判断机制,满足判断机制则执行回调函数。
屏障机制分为插入屏障
和删除屏障
,插入屏障实现的是强三色不变式
,删除屏障则实现了弱三色不变式
。需要注意的是为了保证栈
的运行效率,屏障只对堆
上的内存对象启用,栈
上的内存会在GC
结束后启用STW
重新扫描。
插入写屏障:对象被引用时触发的机制,当白色对象被黑色对象引用时,白色对象被标记为灰色(栈上对象无插入屏障)。
缺点:如果灰色对象在栈上新创建了一个新对象,由于栈没有屏障机制,所以新对象仍为白色节点会被回收。
删除写屏障:对象被删除时触发的机制。如果灰色对象引用的白色对象被删除时,那么白色对象会被标记为灰色。
缺点:这种做法回收精度较低,一个对象即使被删除仍可以活过这一轮再下一轮被回收。同样也存在对栈的二次扫描影响程序的效率。
参考:图解Golang垃圾回收机制!
但是插入写屏障
和删除写屏障
在结束时需要STW来重新扫描栈,带来了性能瓶颈,所以Go在1.8引入了混合写屏障
的方式实现了弱三色不变式的设计方式,混合写屏障分下面四步。
注意:混合写屏障也仅是在堆上启动。
参考:Golang-垃圾回收原理解析
前面提到的传统GC算法都会STW,这存在两个严重的弊端:
三色标记法结合写屏障技术使得GC避免了STW,因此后面的增量式GC和并发式GC都是基于三色标记和写屏障技术的改进。
增量式垃圾回收:可以分摊GC时间,避免程序长时间暂停。
存在的问题:内存屏障技术,需要额外时间开销,并且由于内存屏障技术的保守性,一些垃圾对象不会被回收,会增加一轮gc的总时长。
并发垃圾回收:GC和用户程序并行。
存在的问题:一定程度上利用多核计算机的优势减少了对用户程序的干扰,不过写屏障的额外开销和保守性问题仍然存在,这是不可避免的。
go v1.5至今都是基于三色标记法实现的并发式GC,将长时间的STW分为分割为多段短的STW,GC大部分执行过程都是和用户代码并行的。
参考:Golang 垃圾回收
辅助GC解决的问题是?
当用户分配内存的速度超过gc回收速度时,golang会通过辅助GC暂停用户程序进行gc,避免内存耗尽问题。
辅助GC干了什么?
辅助标记在垃圾回收标记的阶段进行,当用户程序分配内存的时候,先进行指定的扫描任务,即分配了多少内存就要完成多少标记任务。
参考:Golang 垃圾回收
runtime/proc.go
里的forcegcperiod
参数;runtime.GC()
手动触发;string
拼接时使用string.join
,而不是+号(go中string只读,每一个针对string的操作都会创建一个新的string)。三色标记法、混合写屏障。
参考1:深入理解屏障技术
Go1.8
版本引入了混合写屏障机制
,避免了对栈的重新扫描,大大减少了STW的时间。混合写屏障=插入屏障+删除屏障
,它是变形的弱三色不变性,结合了两者的优点。
channel主要用于协程之间
通信,属于内存级别
的通信。
参考1:channel的应用场景
应用场景:
select {
case <-time.After(time.Second):
select {
case <- time.Tick(time.Second)
ch := make(chan int, 5)
for _, url := range urls {
go func() {
ch <- 1
worker(url)
<- ch
}
}
channel的底层结构实现是hchan
,所在位置:src/runtime/chan.go
。
type hchan struct {
qcount uint // total data in the queue
dataqsiz uint // size of the circular queue
buf unsafe.Pointer // points to an array of dataqsiz elements
elemsize uint16
closed uint32
elemtype *_type // element type
sendx uint // send index
recvx uint // receive index
recvq waitq // list of recv waiters
sendq waitq // list of send waiters
// lock protects all fields in hchan, as well as several
// fields in sudogs blocked on this channel.
//
// Do not change another G’s status while holding this lock
// (in particular, do not ready a G), as this can deadlock
// with stack shrinking.
lock mutex
}
可以看到hchan
最后有一个mutex
(锁)类型的lock
字段,所有的发送和读取之前都要加锁,所以channel是线程安全
的。
hchan
各字段解读:
qcount:
channel中环形队列当前存在的元素总数,len()返回该值。dataqsiz:
环形队列的长度,即缓冲区可以容纳的元素数量,make时指定,cap()返回该值。buf:
是一个指针,指向实际存储数据的缓冲区,缓存区基于环形队列实现,是一个连续的内存区域,用于存储channel中的元素。elemsize:
单个元素的字节大小,用于确定每个元素在缓冲区中占用的空间。closed:
channel关闭标志,用于表示channel是否已经关闭。当channel被关闭时,这个字段的值会被设置为非零。elemtype:
元素的类型信息,包括元素的大小和对齐方式等。sendx:
向channel发送数据时,写入的位置索引。recvx:
从channel读数据时,读取的位置索引。recvq:
buf空时,用于接收数据的goroutine等待队列,存储的是等待从channel接收数据的goroutine。sendq:
buf满时,用于发送数据的goroutine等待队列,存储等待向channel发送数据的goroutine。lock:
互斥锁,所有发送和读取之前都要加锁,保证同一时刻,只允许一个协程操作,所以channel是线程安全的。channel在进行读写数据时,会根据无缓冲、有缓冲设置进行对应的阻塞唤起动作,它们之间还是有区别的。
总结: 有缓冲channel和无缓冲channel 的读写基本相差不大,只是多了缓冲数据区域的判断而已。
无缓冲的channel(也称为阻塞式channel)是一种用于在协程之间进行同步的通信方式。无缓冲的channel的读写操作具有阻塞特性,这意味着在特定条件下,读写先后顺序不同,处理也会有所不同,所以还得再进一步区分:
在这里,我们暂时认为有 2 个goroutine在使用channel通信,按先写再读的顺序,则具体流程如下:
可以看到,由于channel是无缓冲的,所以G1暂时被挂在sendq队列里,然后G1调用了gopark休眠了起来。
接着,又有goroutine G2来channel读取数据了:
此时G2发现sendq等待队列里有goroutine存在,于是直接从G1 copy数据过来,并且会对G1设置goready函数,这样下次调度发生时,G1就可以继续运行,并且会从等待队列里移除掉。
先读再写的流程跟上面一样。【只是流程一样】
G1暂时被挂在了recvq队列,然后休眠起来。
G2在写数据时,发现recvq队列有goroutine存在,于是直接将数据发送给G1。同时设置G1 goready函数,等待下次调度运行。
在分析完了无缓冲channel的读写后,我们继续看看有缓冲channel的读写。同样的,我们分为 2种情况。
这一次会优先判断缓冲数据区域是否已满,如果未满,则将数据保存在缓冲数据区域,即环形队列里。如果已满,则和之前的流程是一样的。
当G2要读取数据时,会优先从缓冲数据区域去读取,并且在读取完后,会检查sendq队列,如果goroutine有等待队列,则会将它上面的data补充到缓冲数据区域,并且也对其设置goready函数。
此种情况和无缓冲的先读再写是一样流程,此处不再重复说明。
ch := make(chan T)
无缓冲的channel是阻塞式的:
ch := make(chan T, 2)
第二个参数表示channel中可缓冲类型T的数据容量。只要当前channel里的元素总数不大于这个可缓冲容量,则当前的goroutine就不会被阻塞住。
参考1:golang 系列:channel 全面解析
创建这样一个nil的channel是没有意义,读、写channel都将会被阻塞住。一般为nil的channel主要用在select 上,让select不再从这个channel里读取数据,达到屏蔽case的目的。
ch1 := make(chan int)
ch2 := make(chan int)
go func() {
if !ok { // 某些原因,设置 ch1 为 nil
ch1 = nil
}
}()
for {
select {
case <-ch1: // 当 ch1 被设置为 nil 后,将不会到达此分支了。
doSomething1()
case <-ch2:
doSomething2()
}
}
当我们不再使用channel的时候,可以对其进行关闭:
close(ch)
提示:
有缓冲的通道和无缓冲的channel关闭结果都是一样的。
panic: send on closed channel
,然后退出程序。判断channel是否关闭可以通过返回状态是false或true来确定,返回false代表已经关闭。
if v, ok := <-ch; !ok {
fmt.Println(“channel 已关闭,读取不到数据”)
}
重复(多次)关闭channel会报panic: close of closed channel
(关闭已关闭的channel)。
关闭通道的注意事项有以下几点:
panic
。panic
。因此,在关闭通道之前,建议检查通道是否已经关闭。range
可以方便地遍历通道,当通道被关闭时,range
循环将会结束。在Golang
中,关闭一个通道时,通道中的值会被正常接收,即接收方会收到通道中的零值。因此,当关闭通道时,接收方无法通过接收到的零值来判断是否是因为通道关闭而接收到的。
通常来说,在Golang
中关闭通道时,是通过发送一个信号值告知接收方通道已经关闭。这样的信号值可以是某个特定的值,也可以通过额外的信息来传递。以下是一种常见的模式,使用一个额外的布尔类型的通道来表示是否关闭:
ch := make(chan int)
closeSignal := make(chan bool)
go func() {
// 一些业务逻辑,将结果发送到通道 ch
result := 42
ch <- result
// 关闭通道
close(ch)
// 发送关闭信号
closeSignal <- true
}()
// 接收结果
result := <-ch
fmt.Println(result)
// 等待关闭信号
<-closeSignal
fmt.Println(“Channel closed”)
在这个例子中,closeSignal
是一个用于传递关闭信号的通道。当通道ch
关闭时,会先发送结果值,然后再发送关闭信号。接收方先接收结果值,然后再等待关闭信号。这样可以确保接收方在接收到结果值后知道通道已经关闭。
总的来说,通常不依赖通道中的零值来判断通道是否关闭,而是使用额外的机制(如关闭信号通道)来明确地表示通道的关闭状态。这样可以更加清晰和可靠地处理通道的关闭。
参考1:golang 系列:channel 全面解析
不论是有缓冲通道和无缓冲通道,往channel里读写数据时是有可能被阻塞住的,一旦被阻塞,则需要其他的goroutine执行对应的读写操作,才能解除阻塞状态。
如果阻塞状态一直没有被解除,Go可能会报 fatal error: all goroutines are asleep - deadlock!
错误,所以在使用channel时要注意goroutine的一发一取,避免goroutine永久阻塞!
参考1:对未初始化的的chan进行读写,会怎么样?为什么?
综合:4.5.3 为nil的channel
和4.7 channel的deadlock(死锁)或channel一直阻塞会怎样
。
只声明未初始化的channel说的就是为nil时的情况,它会阻塞读写,如果一直处于阻塞状态会报死锁fatal error: all goroutines are asleep - deadlock!
。
答:读写未初始化的 chan 都会阻塞。
报 fatal error: all goroutines are asleep - deadlock!
为什么对未初始化的 chan 就会阻塞呢?
- 未初始化的 chan 此时是等于 nil,当它不能阻塞的情况下,直接返回 false,表示写 chan 失败。
- 当 chan 能阻塞的情况下,则直接阻塞 gopark(nil, nil, waitReasonChanSendNilChan, traceEvGoStop, 2), 然后调用 throw(s string) 抛出错误,其中 waitReasonChanSendNilChan 就是刚刚提到的报错 “chan send (nil chan)”。
- 未初始化的 chan 此时是等于 nil,当它不能阻塞的情况下,直接返回 false,表示读 chan 失败
- 当 chan 能阻塞的情况下,则直接阻塞 gopark(nil, nil, waitReasonChanReceiveNilChan, traceEvGoStop, 2), 然后调用 throw(s string) 抛出错误,其中 waitReasonChanReceiveNilChan 就是刚刚提到的报错 “chan receive (nil chan)”。
并发处理。有缓冲的channel可以控制并发数目,从而实现多线程并发处理。
首先判断channel是否关闭了,判断是关闭的channel后将这个通道设置为nil,因为设置为nil,这个通道就阻塞住了,select会选择其他没有阻塞的channel来执行,这样达到一个屏蔽的效果。
无缓冲的通道实质是通道容量为0,这是它和有缓冲通道的表象区别。
实质区别从4.2 channel 的数据结构
到4.3 无缓冲channel的读写
和4.4 有缓冲channel的读写
。
无缓冲的channel可以用来同步通信、超时等。有缓冲的channel可以用来解耦生产者、消费者,并发控制。
参考1:https://jishuin.proginn.com/p/763bfbd381cb
综合1、2、3可知,在操作为nil或关闭的channel会导致panic。
channel底层的结构是hchan,hchan最后有一个mutex(锁)类型的lock字段,所有的发送和读取之前都要加锁,所以channel是线程安全的。
是通过Go语言的通道特性和多重返回值的机制来实现的。
package main
import “fmt”
func main() {
//1、初始化
m1 := map[string]int{}
m2 := make(map[string]int, 10)
//2、插入数据
m1[“AA”] = 10
m1[“BB”] = 20
m1[“CC”] = 30
m2[“AA”] = 10
m2[“BB”] = 20
m2[“CC”] = 30
//3、访问数据
fmt.Println(“m1 AA=”, m1[“AA”])
fmt.Println(“m2 BB=”, m2[“BB”])
fmt.Println()
//4、删除
delete(m1, “AA”)
delete(m2, “BB”)
fmt.Println(“m1 AA=”, m1[“AA”])
fmt.Println(“m2 BB=”, m2[“BB”])
fmt.Println()
//5、遍历
for key, value := range m1 {
fmt.Println(“m1 Key=”, key, “;Value=”, value)
}
fmt.Println()
for key, value := range m2 {
fmt.Println(“m2 Key=”, key, “;Value=”, value)
}
}
未初始化的map的值是nil,使用函数len() 可以获取map中键值对的数目。
m1 := map[string]int{}
//或
person := map[string]string{
“name”: “John”,
“age”: “30”,
“city”: “New York”,
}
m2 := make(map[string]int, cap)
注意: 可以使用 make(),但不能使用 new() 来构造 map,如果错误的使用 new() 分配了一个引用对象,会获得一个空引用的指针,相当于声明了一个未初始化的变量并且取了它的地址。
map[key] = value
map[key]
delete(map, key)
Go语言中并没有为 map 提供任何清空所有元素的函数、方法,清空map的唯一办法就是重新 make一个新的map,不用担心垃圾回收的效率,Go语言中的并行垃圾回收效率比写一个清空函数要高效的多。
for key, value := range map {
fmt.Println(“map Key=”, key, “;Value=”, value)
}
map创建后实际是返回了hmap
结构体,是使用数组+链表的形式实现的,使用拉链法消除hash冲突。
参考1:Golang源码探究 — map
开放寻址法、拉链法。
参考1:开放寻址法(有更详细的介绍)
开放寻址法是一种将所有的键值对都存储在一个大数组中的方法。当发生哈希冲突(多个键映射到同一个位置)时,开放寻址法会尝试在数组中的其他位置继续寻找空闲槽位,直到找到一个空槽位或者遍历整个数组。开放寻址法有几种不同的策略,包括线性寻址、二次寻址和双重哈希寻址。
拉链法是一种在哈希表的每个槽位中存储一个链表(或其他数据结构,比如红黑树),用于存储冲突的键值对。当发生哈希冲突时,新的键值对会被添加到对应槽位的链表中。这样,每个槽位可以存储多个键值对,并且链表的操作可以在冲突的情况下更加高效。
拉链法可以扩展到更复杂的数据结构,如平衡二叉搜索树,以提高在冲突时的查找效率。
参考1:Golang 中 map 探究
参考2:golang map实现原理浅析
参考3:Golang Map原理(底层结构、查找/新增/删除、扩缩容)
map的底层实现是一个哈希表,因此实现map的过程实际上就是实现哈希表的过程。在这个哈希表中,主要出现的结构体有两个,一个叫hmap(a header for a go map),一个叫bmap(a bucket for a Go map,通常叫其bucket)。
map
底层的数据结构是由hmap
实现的,hmap
的结构体是在runtime/map.go
:
// A header for a Go map.
type hmap struct {
// Note: the format of the hmap is also encoded in cmd/compile/internal/reflectdata/reflect.go.
// Make sure this stays in sync with the compiler’s definition.
count int // # live cells == size of map. Must be first (used by len() builtin)
flags uint8
B uint8 // log_2 of # of buckets (can hold up to loadFactor * 2^B items)
noverflow uint16 // approximate number of overflow buckets; see incrnoverflow for details
hash0 uint32 // hash seed
buckets unsafe.Pointer // array of 2^B Buckets. may be nil if count==0.
oldbuckets unsafe.Pointer // previous bucket array of half the size, non-nil only when growing
nevacuate uintptr // progress counter for evacuation (buckets less than this have been evacuated)
extra *mapextra // optional fields
}
hmap
各字段解读:
count
:当前map中的键值对数量,调用len(map)返回这个值。flags
:标志位,用于表示map的状态。B
:2^B表示bucket的数量,B表示取hash后多少位来做bucket的分组,再多就要扩容了。noverflow
:溢出桶的个数。hash0
:hash seed
(hash 种子)一般是一个素数,用于计算哈希值。buckets
:指向bucket数组的指针(存储key val);大小:2^B,如果没有元素存入,这个字段可能为nil。oldbuckets
:在扩容期间,将旧的bucket数组放在这里,新buckets会是oldbuckets的两倍大,用于实现平滑的扩容操作。nevacuate
:即将迁移的旧桶编号,可以作为搬迁进度,小于nevacuate的表示已经搬迁完成。extra
:用于存储额外的信息,如迭代器状态等。bucket数组里存储的是bmap
,bmap
在runtime/map.go
中,它的所有字段如下:
// A bucket for a Go map.
type bmap struct {
// tophash generally contains the top byte of the hash value
// for each key in this bucket. If tophash[0] < minTopHash,
// tophash[0] is a bucket evacuation state instead.
tophash [bucketCnt]uint8
// Followed by bucketCnt keys and then bucketCnt elems.
// NOTE: packing all the keys together and then all the elems together makes the
// code a bit more complicated than alternating key/elem/key/elem/… but it allows
// us to eliminate padding which would be needed for, e.g., map[int64]int8.
// Followed by an overflow pointer.
}
但这只是表面,实际上在golang runtime时,编译器会动态为bmap
创建一个新结构:
type bmap struct {
topbits [8]uint8 //高位哈希值数组
keys [8]keytype // 存储key的数组
values [8]valuetype // 存储val的数组
pad uintptr // 内存对齐使用,可能不需要
overflow uintptr // bucket的8个key存满了之后,指向当前bucket的溢出桶
}
bmap就是hmap中的的bucket(桶)的底层数据结构,一个桶中可以存放最多8个key/value,map使用hash函数得到hash值决定分配到哪个桶,然后又会根据hash值的高8位来寻找放在桶的哪个位置,具体的map的组成结构如下图所示:
参考1:Golang Map 底层实现
参考2:Golang底层实现系列——map的底层实现
参考3:golang笔记——map底层原理
参考4:Golang源码探究 —— map
Golang源码探究 —— map
golang笔记——map底层原理
overflow
的bucket
数量过多:(等量扩容)bucket
总数 2^ B小于2^15时,如果overflow
的bucket
数量超过 2^B(未用于存储的bucket数量过多),就会触发扩容;【即bucket
数目不大于2 ^ 15,但是使用overflow
数目超过 2^B
就算是多了。】bucket
总数2^ B大于等于2^15,如果overflow
的bucket
数量超过 2^ 15,就会触发扩容。【即bucket
数目大于2^ 15,那么使用overflow
数目一旦超过2^15
就算是多了。】不难想像造成2. 溢出桶的数量太多。
这种情况的原因:不停地插入、删除元素。先插入很多元素,导致创建了很多bucket,但是负载因子达不到第 1 点的临界值,未触发扩容来缓解这种情况。之后,删除元素降低元素总数量,再插入很多元素,导致创建很多的overflow bucket,但就是不会触发第1点的规定,你能拿我怎么办?overflow bucket 数量太多,导致 key 会很分散,查找插入效率低得吓人,因此出台第2点规定。这就像是一座空城,房子很多,但是住户很少,都分散了,找起人来很困难。
在mapassign
中会判断是否要扩容:Golang源码探究 —— map
//触发扩容的时机
func mapassign(t *maptype, h *hmap, key unsafe.Pointer) unsafe.Pointer {
…
// If we hit the max load factor or we have too many overflow buckets,
// and we’re not already in the middle of growing, start growing.
// 如果达到了最大的负载因子或者有太多的溢出桶
// 或是是已经在扩容中
if !h.growing() && (overLoadFactor(h.count+1, h.B) || tooManyOverflowBuckets(h.noverflow, h.B)) {
hashGrow(t, h)
goto again // Growing the table invalidates everything, so try again
}
}
判断负载因子超过 6.5:golang笔记——map底层原理
func overLoadFactor(count int, B uint8) bool {
return count > bucketCnt && uintptr(count) > loadFactorNum*(bucketShift(B)/loadFactorDen)
}
判断overflow buckets 太多:golang笔记——map底层原理
func tooManyOverflowBuckets(noverflow uint16, B uint8) bool {
// If the threshold is too low, we do extraneous work.
// If the threshold is too high, maps that grow and shrink can hold on to lots of unused memory.
// “too many” means (approximately) as many overflow buckets as regular buckets.
// See incrnoverflow for more details.
if B > 15 {
B = 15
}
// The compiler doesn’t see here that B < 16; mask B to generate shorter shift code.
return noverflow >= uint16(1)<<(B&15)
}
map的两个扩容的时机,都会发生扩容。但是扩容的策略并不相同,毕竟两种条件应对的场景不同。但map扩容采用的都是渐进式,桶被操作(增删改)时才会重新分配。
Golang Map 底层实现
翻倍扩容
:针对的是 达到最大的负载因子 的情况,扩容后桶的数量为原来的两倍。Golang源码探究 —— map对于达到最大的负载因子的扩容,它是因为元素太多,而bucket数量太少,解决办法很简单:将B加 1,bucket 最大数量(2^ B)直接变成原来bucket数量的2倍。于是,就有新老bucket了。
注意: 这时候元素都在老bucket里,还没迁移到新的bucket来。而且,新bucket只是最大数量变为原来最大数量(2^ B)的 2 倍(2^B * 2)。golang笔记——map底层原理
等量扩容
:针对的是溢出桶的数量太多的情况,溢出桶太多了,导致查询效率低。扩容时,桶的数量不增加。Golang源码探究 —— map对于溢出桶的数量太多的扩容,其实元素没那么多,但是overflow bucket数特别多,说明很多bucket都没装满。解决办法就是开辟一个新bucket空间,将老bucket中的元素移动到新bucket,使得同一个bucket 中的key排列地更紧密。这样,原来在overflow bucket中的key可以移动到bucket中来。节省空间,提高bucket利用率,map的查找和插入效率自然就会提升。golang笔记——map底层原理
Golang源码探究 —— map
步骤一:
步骤二:
迁移数据
步骤三:
所有旧桶驱逐完成后,回收所有旧桶(oldbuckets)。
golang笔记——map底层原理
由于map扩容需要将原有的key/value重新搬迁到新的内存地址,如果有大量的key/value需要搬迁,会非常影响性能。因此Go map的扩容采取了一种称为“渐进式”地方式,每次最多只会搬迁2个bucket。
翻倍扩容(达到最大的负载因子):【可能会变,也可能不会变】因为新的buckets数量是之前的一倍,所以在迁移时要重新计算 key的哈希,才能决定它到底落在哪个bucket。例如,原来 B = 5,计算出key的哈希后,只用看它的低 5 位,就能决定它落在哪个bucket。扩容后,B变成了 6,因此需要多看一位,它的低 6 位决定key落在哪个bucket。因此,某个key在搬迁前后bucket序号可能和原来相等,也可能是相比原来加上 2^B(原来的 B 值),取决于hash值 第6位bit位是 0 还是 1。golang笔记——map底层原理
等量扩容(溢出桶的数量太多):【可能会变,也可能不会变】从老的buckets搬迁到新的buckets,由于bucktes数量不变,因此可以按序号来搬,比如原来在0号bucktes,到新的地方后,仍然放在0号buckets。【如果迁移后是紧密的按顺序排列,则不变;如果不按顺序排列,会变】golang笔记——map底层原理
参考1:为什么说Go的Map是无序的?
首先是For ... Range ...
遍历Map的索引的起点是随机的。
其次,往map中存入时就不是按顺序存储的,所以是无序的。
翻倍扩容和等量扩容都可能会发生无序的情况,原因看 5.3.6 翻倍扩容、等量扩容中Key的变化
。
map在扩容后,会发生key的搬迁,原来落在同一个bucket中的key,搬迁后,有些key就要远走高飞了(bucket序号加上了 2^B)。而遍历的过程,就是按顺序遍历bucket,同时按顺序遍历bucket中的key。搬迁后,key的位置发生了重大的变化,有些 key飞上高枝,有些key则原地不动。这样,遍历map的结果就不可能按原来的顺序了。
当我们在遍历go中的map时,并不是固定地从0号bucket开始遍历,每次都是从一个随机值序号的bucket开始遍历,并且是从这个 bucket的一个随机序号的cell开始遍历。这样,即使你是一个写死的map,仅仅只是遍历它,也不太可能会返回一个固定序列的 key/value对了。
从语法上看,是可以的。Go 语言中只要是可比较的类型都可以作为 key。除开 slice,map,functions 这几种类型,其他类型都是 OK 的。具体包括:布尔值、数字、字符串、指针、通道、接口类型、结构体、只包含上述类型的数组。这些类型的共同特征是支持 == 和 != 操作符,k1 == k2 时,可认为 k1 和 k2 是同一个 key。如果是结构体,只有 hash 后的值相等以及字面值相等,才被认为是相同的 key。很多字面值相等的,hash出来的值不一定相等,比如引用。
float 型可以作为 key,但是由于精度的问题,会导致一些诡异的问题,慎用之。
map 并不是一个线程安全的数据结构。多个协程同时读写同时读写一个 map,如果被检测到,会直接 panic。
如果在同一个协程内边遍历边删除,并不会检测到同时读写,理论上是可以这样做的。但是,遍历的结果就可能不会是相同的了,有可能结果遍历结果集中包含了删除的 key,也有可能不包含,这取决于删除 key 的时间:是在遍历到 key 所在的 bucket 时刻前或者后。
如果想要并发安全的读写,可以通过读写锁来解决:sync.RWMutex。
读之前调用 RLock() 函数,读完之后调用 RUnlock() 函数解锁;写之前调用 Lock() 函数,写完之后,调用 Unlock() 解锁。
无法对 map 的 key 或 value 进行取址,将无法通过编译。
如果通过其他 hack 的方式,例如 unsafe.Pointer 等获取到了 key 或 value 的地址,也不能长期持有,因为一旦发生扩容,key 和 value 的位置就会改变,之前保存的地址也就失效了。
不安全,只读是线程安全的,主要是不支持并发写操作的,原因是 map 写操作不是并发安全的,当尝试多个 Goroutine 操作同一个 map,会产生报错:fatal error: concurrent map writes
。所以map适用于读多写少的场景。
解决办法
:要么加锁,要么使用sync包中提供了并发安全的map,也就是sync.Map,其内部实现上已经做了互斥处理。
golang的map用的是hashmap,是使用数组+链表的形式实现的,使用拉链法
消除hash冲突。拉链法见:5.2.2 拉链法(map使用的方式)
参考1:https://www.jianshu.com/p/1132055d708b
map是检查是否有另外线程修改h.flag
来判断,是否有并发问题。
// 在更新map的函数里检查并发写
if h.flags&hashWriting == 0 {
throw(“concurrent map writes”)
}
// 在读map的函数里检查是否有并发写
if h.flags&hashWriting != 0 {
throw(“concurrent map read and map write”)
}
参考1:http://c.biancheng.net/view/34.html
map 在并发情况下,只读是线程安全的,同时读写是线程不安全的。会报panic:fatal error: concurrent map read and map write
,因为Go语言原生的map并不是并发安全的,对它进行并发读写操作的时候,需要加锁。
参考1:golang对map排序
golang中map元素是随机无序的,所以在对map range遍历的时候也是随机的,如果想按顺序读取map中的值,可以结合切片来实现。
如果想按顺序读取map中的值,可以结合切片来实现。
参考1:https://www.cnblogs.com/wuchangblog/p/16393070.html
不能,每个协程只能捕获到自己的 panic 不能捕获其它协程。
sync.Map是并发安全的。底层通过分离读写map和原子指令来实现读的近似无锁,并通过延迟更新的方式来保证读的无锁化。
sync.Map
特性:
sync.Map
的基本操作的完整代码:
package main
import (
“fmt”
“sync”
)
func main() {
//1、初始化
var sMap sync.Map
//2、插入数据
sMap.Store(1,“a”)
sMap.Store(“AA”,10)
sMap.Store(“BB”,20)
sMap.Store(3,“CC”)
//3、访问数据
fmt.Println(“Load方法”)
//Load:①如果待查找的key存在,则返回key对应的value,true;
lv1,ok1 := sMap.Load(1)
fmt.Println(ok1,lv1) //输出结果:true a
//Load:②如果待查找的key不存在,则返回nil,false
lv2,ok2 := sMap.Load(2)
fmt.Println(ok2,lv2) //输出结果:false
fmt.Println()
fmt.Println(“LoadOrStore方法”)
//LoadOrStore:①如果待查找的key存在,则返回key对应的value,true;
losv1,ok1 := sMap.LoadOrStore(1,“aaa”)
fmt.Println(ok1,losv1) //输出结果:true a
//LoadOrStore:②如果待查找的key不存在,则返回添加的value,false
losv2,ok2 := sMap.LoadOrStore(2,“bbb”)
fmt.Println(ok2,losv2) //输出结果:false bbb
fmt.Println()
fmt.Println(“LoadAndDelete方法”)
//LoadAndDelete:①如果待查找的key存在,则返回key对应的value,true,同时删除该key-value;
ladv1,ok1 := sMap.LoadAndDelete(1)
fmt.Println(ok1,ladv1) //输出结果:true a
//LoadAndDelete:②如果待查找的key不存在,则返回nil,false
ladv2,ok2 := sMap.LoadAndDelete(1)
fmt.Println(ok2,ladv2) //输出结果:false
//4、删除
fmt.Println()
fmt.Println(“Delete方法”)
sMap.Delete(2)
fmt.Println()
fmt.Println(“Range方法”)
// 5、遍历所有sync.Map中的键值对
sMap.Range(func(k, v interface{}) bool {
fmt.Println(“k-v:”, k, v)
return true
})
}
sync.Map无须初始化,直接声明即可使用。
var sMap sync.Map
sync.Map插入数据使用自带的Store(key,value)。源码解读 Golang 的 sync.Map 实现原理 有对Store
的源码分析。
sMap.Store(1,“a”)
sMap.Store(“AA”,10)
注意:Store(key, value interface{})
参数都是interface{}类型,所以同一个sync.Map能存储不同类型的数据。源码:
func (m *Map) Store(key, value interface{}) {
}
sync.Map访问有三个方法:Load()、LoadOrStore()、LoadAndDelete()
Load(key interface{}) (value interface{}, ok bool)
源码解读 Golang 的 sync.Map 实现原理 有对 Load
的源码分析。lv1,ok1 := sMap.Load(1)
fmt.Println(ok1,lv1) //输出结果:true a
lv2,ok2 := sMap.Load(2)
fmt.Println(ok2,lv2) //输出结果:false
LoadOrStore(key, value interface{}) (actual interface{}, loaded bool)
losv1,ok1 := sMap.LoadOrStore(1,“aaa”)
fmt.Println(ok1,losv1) //输出结果:true a
losv2,ok2 := sMap.LoadOrStore(2,“bbb”)
fmt.Println(ok2,losv2) //输出结果:false bbb
LoadAndDelete(key interface{}) (value interface{}, loaded bool)
ladv1,ok1 := sMap.LoadAndDelete(1)
fmt.Println(ok1,ladv1) //输出结果:true a
ladv2,ok2 := sMap.LoadAndDelete(1)
fmt.Println(ok2,ladv2) //输出结果:false
sync.Map删除用 Delete(key interface{})
,查看源码会发现它是调用的LoadAndDelete(key)
最终来实现的。源码解读 Golang 的sync.Map实现原理 有对Delete
的源码分析。
源码:
func (m *Map) Delete(key interface{}) {
m.LoadAndDelete(key)
}
同map一样,Go语言也没有为sync.Map提供任何清空所有元素的函数、方法,清空sync.Map的唯一办法就是重新声明一个新的sync.Map。
sync.Map使用Range
配合一个回调函数进行遍历操作,通过回调函数返回内部遍历出来的值,Range参数中回调函数的返回值在需要继续迭代遍历时,返回 true,终止迭代遍历时,返回 false。
sMap.Range(func(k, v interface{}) bool {
fmt.Println(“k-v:”, k, v)
return true
})
sync.Map 的实现原理可概括为:
保证读写一致
)参考1:源码解读 Golang 的 sync.Map 实现原理
参考2:Golang的Map并发性能以及原理分析
sync.Map是在sync/map.go
:
type Map struct {
mu Mutex
read atomic.Pointer[readOnly]
dirty map[any]*entry
misses int
}
sync.Map
各字段解读:
mu
:互斥锁,保护dirty字段,当涉及到dirty数据的操作的时候,需要使用这个锁。read
:只读的数据,实际数据类型为readOnly,也是一个map,因为只读,所以不会有读写冲突。实际上,实际也会更新read的entries,如果entry是未删除的(unexpunged),并不需要加锁。如果entry已经被删除了,需要加锁,以便更新dirty数据。dirty
:dirty中的数据除了包含当前的entries,它也包含最新的entries(包括read中未删除的数据,虽有冗余,但是提升dirty字段为read的时候非常快,不用一个一个的复制,而是直接将这个数据结构作为read字段的一部分),有些数据还可能没有移动到read字段中(即直接将dirty晋升为read)
。misses
:当从Map中读取entry的时候,如果read中不包含这个entry,会尝试从dirty中读取,这个时候会将misses加一,当misses累积到dirty的长度的时候, 就会将dirty晋升为read,避免从dirty中miss太多次。因为操作dirty需要加锁。【保证读写一致
】readOnly
结构体:
type readOnly struct {
m map[interface{}]*entry
amended bool
}
readOnly
各字段解读:
m
:内建map,m的value的类型为*entry
。
amended
:用于判断dirty
里是否存在read
里没有的key
,通过该字段决定是否加锁读dirty
,如果有则为true。
readOnly.m
和Map.dirty
存储的值类型是*entry,它包含一个指针p,指向用户存储的value值。
entry
数据结构则用于存储sync.Map中值的指针:
type entry struct {
p unsafe.Pointer // 等同于 *interface{}
}
当p指针指向expunged这个指针的时候,则表明该元素被删除,但不会立即从map中删除,如果在未删除之前又重新赋值则会重新使用该元素。
entry
各字段解读:
p
:指向用户存储的value值,p有三种状态。
参考1:Golang的Map并发性能以及原理分析
从图中可以看出,read map
和dirty map
中含有相同的一部分entry
,我们称作是normal entries
,是双方共享的。状态是p的值为nil
和unexpunged
时。
但是read map
中含有一部分entry
是不属于dirty map
的,而这部分entry
就是状态为expunged
状态的entry
。而dirty map
中有一部分entry
也是不属于read map
的,而这部分其实是来自Store
操作形成的(也就是新增的 entry
),换句话说就是新增的entry
是出现在dirty map
中的。
读取数据时首先从m.read
中读取,不存在的情况下,并且m.dirty
中有新数据,对m.dirty
加锁,然后从m.dirty
中读取。
read map
:是用来进行lock free操作的(其实可以读写,但是不能做删除操作,因为一旦做了删除操作,就不是线程安全的了,也就无法 lock free)。
dirty map
:是用来在无法进行lock free操作的情况下,需要lock来做一些更新工作的对象。
当需要不停地新增和删除的时候,会导致dirty map不停地更新,甚至在misses过多之后,导致dirty成为nil,并进入重建的过程,所以sync.Map适用于读多写少的场景
。
是否支持多协程并发安全。
参考1:sync.Map详解
sync.Map 适用于读多写少的场景。
对于写多的场景,会导致不断地从dirty map中读取,导致dirty map晋升为read map,这是一个 O(N) 的操作,会进一步降低性能。
接口的底层实现结构有两个结构体iface
和eface
,区别在于iface
类型的接口包含方法,而eface
则是不包含任何方法的空接口:interface{}
。这两个结构体都在runtime/runtime2.go
中。(Golang之接口底层分析)
iface
结构体,是在runtime/runtime2.go
中,它的所有字段如下:
type iface struct {
tab *itab
data unsafe.Pointer
}
iface
各字段解读:
tab
:指针类型,指向一个itab实体,它表示接口的类型以及赋给这个接口的实体类型。data
:则指向接口具体的值,一般而言是一个指向堆内存的指针。itab
结构体,是在runtime/runtime2.go
中,它的所有字段如下:
type itab struct {
inter *interfacetype
_type *_type
hash uint32 // copy of _type.hash. Used for type switches.
_ [4]byte
fun [1]uintptr // variable sized. fun[0]==0 means _type does not implement inter.
}
itab
各字段解读:
inter
:接口自身定义的类型信息,用于定位到具体interface
类型。_type
:接口实际指向值的类型信息,即实际对象类型,用于定义具体interface
类型;hash
:_type.hash
的拷贝,是类型的哈希值,用于快速查询和判断目标类型和接口中类型是否一致。fun
:动态数组,接口方法实现列表(方法集),即函数地址列表,按字典序排序,如果数组中的内容为空表示_type
没有实现inter
接口。itab.inter
是interface
的类型元数据,它里面记录了这个接口类型的描述信息,接口要求的方法列表就记录在interfacetype.mhdr
里。
interfacetype
结构体,是在runtime/type.go
中,它的所有字段如下:
type interfacetype struct {
typ _type
pkgpath name
mhdr []imethod
}
interfacetype
各字段解读:
typ
:接口的信息。pkgpath
:接口的包路径。mhdr
:接口要求的方法列表。iface
结构体详解:
tab._type
就是接口的动态类型,也就是被赋给接口类型的那个变量的类型元数据。itab
中的_type
和iface
中的data
能简要描述一个变量。_type
是这个变量对应的类型,data
是这个变量的值。
itab.fun
记录的是动态类型实现的那些接口要求的方法的地址,是从方法元数据中拷贝来的,为的是快速定位到方法。如果itab._type
对应的类型没有实现这个接口,则itab.fun[0]=0
,这在类型断言时会用到。
当fun[0]
为0时,说明_type
并没有实现该接口,当有实现接口时,fun
存放了第一个接口方法的地址,其他方法依次往下存放,这里就简单用空间换时间,其实方法都在_type
字段中能找到,实际在这记录下,每次调用的时候就不用动态查找了。
eface
结构体,是在runtime/runtime2.go
中,它的所有字段如下:
type eface struct {
_type *_type
data unsafe.Pointer
}
eface
各字段解读:
_type
:类型信息。data
:数据信息,指向数据指针。_type
结构体,是在runtime/type.go
中,它的所有字段如下:
type _type struct {
size uintptr
ptrdata uintptr // size of memory prefix holding all pointers
hash uint32
tflag tflag
align uint8
fieldAlign uint8
kind uint8
// function for comparing objects of this type
// (ptr to object A, ptr to object B) -> ==?
equal func(unsafe.Pointer, unsafe.Pointer) bool
// gcdata stores the GC type data for the garbage collector.
// If the KindGCProg bit is set in kind, gcdata is a GC program.
// Otherwise it is a ptrmask bitmap. See mbitmap.go for details.
gcdata *byte
str nameOff
ptrToThis typeOff
}
_type
各字段解读:
size
:类型占用内存大小。ptrdata
:包含所有指针的内存前缀大小。hash
:类型hash。tflag
:标记位,主要用于反射。align
:对齐字节信息。fieldAlign
:当前结构字段的对齐字节数。kind
:基础类型枚举值。equal
:比较两个形参对应对象的类型是否相等。gcdata
:GC类型的数据。str
:类型名称字符串在二进制文件段中的偏移量。ptrToThis
:类型元信息指针在二进制文件段中的偏移量。重点说明:
kindMask
取出特殊标记位。const (
kindBool = 1 + iota
kindInt
kindInt8
kindInt16
kindInt32
kindInt64
kindUint
kindUint8
kindUint16
kindUint32
kindUint64
kindUintptr
kindFloat32
kindFloat64
kindComplex64
kindComplex128
kindArray
kindChan
kindFunc
kindInterface
kindMap
kindPtr
kindSlice
kindString
kindStruct
kindUnsafePointer
kindDirectIface = 1 << 5
kindGCProg = 1 << 6
kindMask = (1 << 5) - 1
)
str
和ptrToThis
,对应的类型是nameoff
和typeOff
。分表表示name
和type
针对最终输出文件所在段内的偏移量。在编译的链接步骤中,链接器将各个.o
文件中的段合并到输出文件,会进行段合并,有的放入.text
段,有的放入.data
段,有的放入.bss
段。nameoff
和typeoff
就是记录了对应段的偏移量。参考1:Go语言接口的nil判断
答:可以比较,因为nil
在Go语言中只能被赋值给指针和接口。接口在底层的实现主要考虑eface
结构体,它有两个部分:type
和data
。
两种情况:
nil
赋值给接口时,接口的type
和data
都将为nil
。此时,接口与nil
值判断是相等的。nil
赋值给接口时,只有data
为nil
,而type
不为nil
,此时,接口与nil
判断将不相等。参考1:golang中接口值(interface)的比较
这个问题,接口在底层的实现主要考虑eface
结构体,它有两个部分:type
和data
。interface
可以使用==
或!=
比较。
2个interface 相等有以下 2 种情况:
参考1:golang的context
在Golang
的http
包的Server
中,每一个请求都有一个对应的goroutine
负责处理,请求处理函数通常会启动额外的goroutine
去处理,当一个请求被取消或者超时,所有用来处理该请求的goroutine都应该及时退出,这样系统才能释放这些goroutine占用的资源,就不会有大量的goroutine去占用资源。
注意:go1.6及之前版本请使用golang.org/x/net/context。go1.7及之后已移到标准库context。
参考1:golang 系列:context 详解
参考2:快速掌握 Golang context 包,简单示例
Context
的功能可以看出来,它是用来传递信息
的。这种传递并不仅仅是将数据塞给被调用者,它还能进行链式传递
,通过保存父子Context
关系,不断的迭代遍历来获取数据。Context
可以链式传递,这就使得goroutine
之间能够进行链式的信号通知了,从而进而达到自上而下的通知效果。例如通知所有跟当前context有关系的goroutine进行取消处理。
Context
的调用是链式的,所以通过WithCancel
,WithDeadline
,WithTimeout
或WithValue
派生出新的Context
。当父Context
被取消时,其派生的所有Context
都将取消。context.WithXXX
都将返回新的Context
和CancelFunc
。调用CancelFunc
将取消子代,移除父代对子代的引用,并且停止所有定时器。未能调用CancelFunc
将泄漏子代,直到父代被取消或定时器触发。go vet
工具检查所有流程控制路径上使用CancelFuncs
。参考1:https://www.qycn.com/xzx/article/9390.html 本文中的四种使用场景的分析和相关代码同参考1完全相同。
1. RPC调用
在主goroutine上有4个RPC,RPC2/3/4是并行请求的,我们这里希望在RPC2请求失败之后,直接返回错误,并且让RPC3/4停止继续计算。这个时候,就使用的到Context。
代码:
package main
import (
“context”
“sync”
“github.com/pkg/errors”
)
func Rpc(ctx context.Context, url string) error {
result := make(chan int)
err := make(chan error)
go func() {
// 进行RPC调用,并且返回是否成功,成功通过result传递成功信息,错误通过error传递错误信息
isSuccess := true
if isSuccess {
result <- 1
} else {
err <- errors.New(“some error happen”)
}
}()
select {
case <- ctx.Done():
// 其他RPC调用调用失败
return ctx.Err()
case e := <- err:
// 本RPC调用失败,返回错误信息
return e
case <- result:
// 本RPC调用成功,不返回错误信息
return nil
}
}
func main() {
ctx, cancel := context.WithCancel(context.Background())
// RPC1调用
err := Rpc(ctx, “http://rpc_1_url”)
if err != nil {
return
}
wg := sync.WaitGroup{}
// RPC2调用
wg.Add(1)
go func(){
defer wg.Done()
err := Rpc(ctx, “http://rpc_2_url”)
if err != nil {
cancel()
}
}()
// RPC3调用
wg.Add(1)
go func(){
defer wg.Done()
err := Rpc(ctx, “http://rpc_3_url”)
if err != nil {
cancel()
}
}()
// RPC4调用
wg.Add(1)
go func(){
defer wg.Done()
err := Rpc(ctx, “http://rpc_4_url”)
if err != nil {
cancel()
}
}()
wg.Wait()
}
这里使用了waitGroup
来保证main函数在所有RPC调用完成之后才退出。
在Rpc函数中,第一个参数是一个CancelContext,这个Context形象的说,就是一个传话筒,在创建CancelContext的时候,返回了一个听声器(ctx)和话筒(cancel函数)。所有的goroutine都拿着这个听声器(ctx),当主goroutine想要告诉所有goroutine要结束的时候,通过cancel函数把结束的信息告诉给所有的goroutine。当然所有的goroutine都需要内置处理这个听声器结束信号的逻辑(ctx->Done())。我们可以看Rpc函数内部,通过一个select来判断ctx的done和当前的rpc调用哪个先结束。
这个WaitGroup和其中一个RPC调用就通知所有RPC的逻辑,其实有一个包已经帮我们做好了。errorGroup。具体这个errorGroup包的使用可以看这个包的test例子。
有人可能会担心我们这里的cancel()会被多次调用,context包的cancel调用是幂等的。可以放心多次调用。
我们这里不妨品一下,这里的Rpc函数,实际上我们的这个例子里面是一个“阻塞式”的请求,这个请求如果是使用http.Get或者http.Post来实现,实际上Rpc函数的Goroutine结束了,内部的那个实际的http.Get却没有结束。所以,需要理解下,这里的函数最好是“非阻塞”的,比如是http.Do,然后可以通过某种方式进行中断。
比如像这篇文章Cancel http.Request using Context中的这个例子:
func httpRequest(
ctx context.Context,
client *http.Client,
req *http.Request,
respChan chan []byte,
errChan chan error
) {
req = req.WithContext(ctx)
tr := &http.Transport{}
client.Transport = tr
go func() {
resp, err := client.Do(req)
if err != nil {
errChan <- err
}
if resp != nil {
defer resp.Body.Close()
respData, err := ioutil.ReadAll(resp.Body)
if err != nil {
errChan <- err
}
respChan <- respData
} else {
errChan <- errors.New(“HTTP request failed”)
}
}()
for {
select {
case <-ctx.Done():
tr.CancelRequest(req)
errChan <- errors.New(“HTTP request cancelled”)
return
case <-errChan:
tr.CancelRequest(req)
return
}
}
}
它使用了http.Client.Do,然后接收到ctx.Done的时候,通过调用transport.CancelRequest来进行结束。
我们还可以参考net/dail/DialContext。
换而言之,如果希望实现的包是“可中止/可控制”的,那么在包实现的函数里面,最好是能接收一个Context
函数,并且处理了Context.Done。
2. PipeLine
pipeline
模式就是流水线模型,流水线上的几个工人,有n个产品,一个一个产品进行组装。其实pipeline模型的实现和Context并无关系,没有context我们也能用chan实现pipeline模型。但是对于整条流水线的控制,则是需要使用上Context的。这篇文章Pipeline Patterns in Go的例子是非常好的说明。这里就大致对这个代码进行下说明。
runSimplePipeline的流水线工人有三个,lineListSource负责将参数一个个分割进行传输,lineParser负责将字符串处理成int64,sink根据具体的值判断这个数据是否可用。他们所有的返回值基本上都有两个chan,一个用于传递数据,一个用于传递错误。(<-chan string, <-chan error)输入基本上也都有两个值,一个是Context,用于传声控制的,一个是(in <-chan)输入产品的。
我们可以看到,这三个工人的具体函数里面,都使用switch处理了case <-ctx.Done()。这个就是生产线上的命令控制。
func lineParser(ctx context.Context, base int, in <-chan string) (
<-chan int64, <-chan error, error) {
…
go func() {
defer close(out)
defer close(errc)
for line := range in {
n, err := strconv.ParseInt(line, base, 64)
if err != nil {
errc <- err
return
}
select {
case out <- n:
case <-ctx.Done():
return
}
}
}()
return out, errc, nil
}
3. 超时请求
我们发送RPC请求的时候,往往希望对这个请求进行一个超时的限制。当一个RPC请求超过10s的请求,自动断开。当然我们使用CancelContext,也能实现这个功能(开启一个新的goroutine,这个goroutine拿着cancel函数,当时间到了,就调用cancel函数)。
鉴于这个需求是非常常见的,context包也实现了这个需求:timerCtx。具体实例化的方法是 WithDeadline 和 WithTimeout。
具体的timerCtx里面的逻辑也就是通过time.AfterFunc来调用ctx.cancel的。
官方的例子:
package main
import (
“context”
“fmt”
“time”
)
func main() {
ctx, cancel := context.WithTimeout(context.Background(), 50*time.Millisecond)
defer cancel()
select {
case <-time.After(1 * time.Second):
fmt.Println(“overslept”)
case <-ctx.Done():
fmt.Println(ctx.Err()) // prints “context deadline exceeded”
}
}
在http的客户端里面加上timeout也是一个常见的办法。
uri := “https://httpbin.org/delay/3”
req, err := http.NewRequest(“GET”, uri, nil)
if err != nil {
log.Fatalf(“http.NewRequest() failed with ‘%s’\n”, err)
}
ctx, _ := context.WithTimeout(context.Background(), time.Millisecond*100)
req = req.WithContext(ctx)
resp, err := http.DefaultClient.Do(req)
if err != nil {
log.Fatalf(“http.DefaultClient.Do() failed with:\n’%s’\n”, err)
}
defer resp.Body.Close()
在http服务端设置一个timeout如何做呢?
package main
import (
“net/http”
“time”
)
func test(w http.ResponseWriter, r *http.Request) {
time.Sleep(20 * time.Second)
w.Write([]byte(“test”))
}
func main() {
http.HandleFunc(“/”, test)
timeoutHandler := http.TimeoutHandler(http.DefaultServeMux, 5 * time.Second, “timeout”)
http.ListenAndServe(“:8080”, timeoutHandler)
}
我们看看TimeoutHandler的内部,本质上也是通过context.WithTimeout来做处理。
func (h *timeoutHandler) ServeHTTP(w ResponseWriter, r *Request) {
…
ctx, cancelCtx = context.WithTimeout(r.Context(), h.dt)
defer cancelCtx()
…
go func() {
…
h.handler.ServeHTTP(tw, r)
}()
select {
…
case <-ctx.Done():
…
}
}
context还提供了valueCtx的数据结构。这个valueCtx最经常使用的场景就是在一个http服务器中,在request中传递一个特定值,比如有一个中间件,做cookie验证,然后把验证后的用户名存放在request中。
我们可以看到,官方的request里面是包含了Context的,并且提供了WithContext的方法进行context的替换。
package main
import (
“net/http”
“context”
)
type FooKey string
var UserName = FooKey(“user-name”)
var UserId = FooKey(“user-id”)
func foo(next http.HandlerFunc) http.HandlerFunc {
return func(w http.ResponseWriter, r *http.Request) {
ctx := context.WithValue(r.Context(), UserId, “1”)
ctx2 := context.WithValue(ctx, UserName, “yejianfeng”)
next(w, r.WithContext(ctx2))
}
}
func GetUserName(context context.Context) string {
if ret, ok := context.Value(UserName).(string); ok {
return ret
}
return “”
}
func GetUserId(context context.Context) string {
if ret, ok := context.Value(UserId).(string); ok {
return ret
}
return “”
}
func test(w http.ResponseWriter, r *http.Request) {
w.Write([]byte("welcome: “))
w.Write([]byte(GetUserId(r.Context())))
w.Write([]byte(” "))
w.Write([]byte(GetUserName(r.Context())))
}
func main() {
http.Handle(“/”, foo(test))
http.ListenAndServe(“:8080”, nil)
}
在使用ValueCtx的时候需要注意一点,这里的key不应该设置成为普通的String或者Int类型,为了防止不同的中间件对这个key的覆盖。最好的情况是每个中间件使用一个自定义的key类型,比如这里的FooKey,而且获取Value的逻辑尽量也抽取出来作为一个函数,放在这个middleware的同包中。这样,就会有效避免不同包设置相同的key的冲突问题了。
参考1:快速掌握 Golang context 包,简单示例
Context
放入结构体,相反context
应该作为第一个参数传入,命名为ctx
。 func DoSomething(ctx context.Context,arg Arg)error { // ... use ctx ... }
。nil
的Context
。如果不知道用哪种Context
,可以使用context.TODO()
。context
的Value
相关方法只应该用于在程序和接口中传递的和请求相关的元数据,不要用它来传递一些可选的参数。Context
可以传递给在不同的goroutine
;Context
是并发安全的。context
的Done()
方法往往需要配合select { case }
使用,以监听退出。context
执行取消动作,所有派生的context
都会触发取消。参考1:快速掌握 Golang context 包,简单示例
参考2:golang 系列:context 详解
参考3:golang的context
Context是一个接口
,是在context/context.go
中,它的所有抽象方法如下:
type Context interface {
Deadline() (deadline time.Time, ok bool)
Done() <-chan struct{}
Err() error
Value(key interface{}) interface{}
}
Context
接口中抽象方法解读:
Deadline()
:返回截止时间和ok。
deadline
时间,同时ok为true
是表示设置了截止时间;Done()
:返回一个只读channel
(只有在被cancel后才会返回),它的数据类型是struct{}
,一个空结构体。当times out
或者父级Context
调用cancel
方法后,将会close channel
来进行通知,但是不会涉及具体数据传输,根据这个信号,开发者就可以做一些清理动作,比如退出goroutine
。多次调用Done
方法会返回的是同一个Channel
。
Err()
:返回一个错误。如果上面的Done()
的channel
没被close
,则error
为nil
;如果channel
已被close
,则error
将会返回close
的原因,说明该context
为什么被关掉,比如超时
或手动取消
。
Value()
:返回被绑定到Context
的值,是一个键值对,所以要通过一个Key
才可以获取对应的值,这个值一般是线程安全的。对于同一个上下文来说,多次调用Value
并传入相同的Key
会返回相同的结果,该方法仅用于传递跨API和进程间请求域的数据
。
参考1:golang中的context
参考2:golang的context
参考3:golang 系列:context 详解
Background()&TODO()
Background():
是所有派生Context
的根Context
,该Context
通常由接收request
的第一个goroutine
创建。它不能被取消、没有值、也没有过期时间,常作为处理request
的顶层context
存在。TODO():
也是返回一个没有值的Context
,目前不知道它具体的使用场景,如果我们不知道该传什么类型的Context
的时候,可以使用这个。
Background()
和TODO()
本质上是emptyCtx
结构体类型,是一个不可取消,没有设置截止时间,没有携带任何值的空Context
,是直接return默认值,没有具体功能代码。一般的将它们作为Context的根,往下派生。
2. WithCancel(parent Context) (ctx Context, cancel CancelFunc)
:用来取消通知用的context
。
返回一个继承的Context
和CancelFunc取消方法
,在父协程context
的Done
函数被关闭时会关闭自己的Done
通道,或者在执行了CancelFunc取消方法
之后,会关闭自己的Done通道。这种关闭的通道可以作为一种广播的通知操作,告诉所有context
相关的函数停止当前的工作直接返回。通常使用场景用于主协程用于控制子协程的退出,用于一对多处理。
3. WithDeadline(parent Context, d time.Time) (Context, CancelFunc)
:timerCtx
类型的context
,用来超时通知。
参数是传递一个上下文,等待超时时间,超时后,会返回超时时间,并且会关闭context的Done通道,其他传递的context收到Done关闭的消息的,直接返回即可。同样用户通知消息出来。
以下三种情况会取消该创建的context:
1、到达指定时间点;
2、调用了CancelFunc取消方法;
3、父节点context关闭。
4. WithTimeout(parent Context, timeout time.Duration) (Context, CancelFunc)
:timerCtx
类型的context
,用来超时通知。
WithTimeout()
里是直接调用并返回的WithDeadline()
,所以它和WithDeadline()
功能是一样,只是传递的时间是从当前时间加上超时时间。
func WithTimeout(parent Context, timeout time.Duration) (Context, CancelFunc) {
return WithDeadline(parent, time.Now().Add(timeout))
}
WithValue(parent Context, key, val interface{}) Context
:valueCtx
类型的context
,用来传值的context
。每个context
都可以放一个key-value
对, 通过WithValue
方法可以找key
对应的value
值,如果没有找到,就从父context
中找,直到找到为止。
WithCancel
、WithDeadline
、 WithTimeout
、WithValue
四个方法在创建的时候都会要求传父级context
进来,以此达到链式传递信息的目的。
参考1:https://blog.csdn.net/weixin_38664232/article/details/123663759
context本身是线程安全的,所以context携带value也是线程安全的。
context包提供两种创建根context的方式:
又提供了四个函数(WithCancel
、WithDeadline
、WithTimeout
、WithValue
)基于父Context
牌生,其中使用WithValue
函数派生的context
来携带数据,每次调用WithValue
函数都会基于当前context
派生一个新的子context
,WithValue
内部主要就是调用valueCtx类:
func WithValue(parent Context, key, val interface{}) Context {
if parent == nil {
panic(“cannot create context from nil parent”)
}
if key == nil {
panic(“nil key”)
}
if !reflectlite.TypeOf(key).Comparable() {
panic(“key is not comparable”)
}
return &valueCtx{parent, key, val}
}
说明:参数中的parent
是当前valueContext
的父节点。
valueCtx
结构如下:
type valueCtx struct {
Context
key, val interface{}
}
valueContext
继承父Context
,这种是采用匿名接口的继承实现方式,key
、val
用来存储携带的键值对。
通过上面的代码分析,可以发现:
父Context
结构体上直接添加,而是以此context
作为父节点,重新创建一个新的valueContext子节点
,将键值对添加到子节点上,由此形成一条context
链。根Context(emptyCtx)
返回nil。如下图所示:context
包是Go
语言中用于在协程之间传递取消信号、截止时间和共享数据的一种机制。context
的并发安全性体现在以下几个方面:
context
的设计中鼓励不可变性,也就是说,一旦创建了context
,它的值就不会被改变。这确保了在协程之间传递context
时的线程安全性,因为不会有并发修改的情况。context
时,它可以基于已有的context
创建一个新的实例,并向其中添加或修改一些值。这个过程中,原始的context
实例不会受到影响,保证了并发安全。context
的方法返回一个新的context
,而不是修改原始的context
。例如,WithValue
方法就是返回一个带有新值的新context
实例,而不是在原始的context
上修改。这样的设计符合不可变性原则,从而确保并发安全。context
的取消机制,一个协程可以通知其他协程停止工作。这是通过context
的Done
通道来实现的。当一个协程调用cancel
函数时,Done
通道会被关闭,所有基于该context
的协程都能感知到取消信号。总体来说,context
的设计强调了不可变性和值的复制,这使得它在并发环境下能够提供一种安全而有效的机制,用于在协程之间传递相关信息,控制取消,以及传递截止时间等。在并发编程中,使用context
能够更容易地管理和传递与协程相关的信息,同时避免了共享状态带来的并发安全性问题。
参考1:go中select语句
select
语句是用来监听和channel
有关的IO
操作的,当IO
操作发生时,触发对应的case
动作。有了select
语句,可以实现main主线程
与goroutine线程
之间的互动。
//for {
select {
case <-ch1 : // 检测有没有数据可读
// 一旦成功读取到数据,则进行该case处理语句
case ch2 <- 1 : // 检测有没有数据可写
// 一旦成功向ch2写入数据,则进行该case处理语句
default:
// 如果以上都没有符合条件,那么进入default处理流程
}
}//
select语句外面可使用for循环来实现不断监听IO的目的。
注意事项:
select
语句只能用于channel
的IO操作,每个case
都必须是一个channel。default
条件,在没有IO
操作发生时,select
语句就会一直阻塞;如果有一个或多个IO操作同时发生时,Go运行时会随机选择一个case执行,但此时将无法保证执行顺序;
对于case语句,如果存在channel值为nil的读写操作,则该分支将被忽略,可以理解为相当于从select语句中删除了这个case;
default
条件,又一直没有IO
操作发生的情况,select
语句会引起死锁(fatal error: all goroutines are asleep - deadlock!
),如果不希望出现死锁,可以设置一个超时时间的case来解决;for
中的select
语句,不能添加default
,否则会引起CPU
占用过高的问题;参考1:go语言中select实现优先级
在 9.1 注意事项3
中已知无法保证执行顺序的情况。
问题描述:我们有一个函数会持续不间断地从ch1
和ch2
中分别接收任务1
和任务2
,如何确保当ch1
和ch2
同时达到就绪状态时,优先执行任务1
,在没有任务1
的时候再去执行任务2
呢?
实现代码:
func worker2(ch1, ch2 <-chan int, stopCh chan struct{}) {
for {
select {
case <-stopCh:
return
case job1 := <-ch1:
fmt.Println(job1)
case job2 := <-ch2:
priority:
for {
select {
case job1 := <-ch1:
fmt.Println(job1)
default:
break priority
}
}
fmt.Println(job2)
}
}
}
使用了嵌套的select,还组合使用了for
循环和label
来解决问题。上面的代码在外层select选中执行job2 := <-ch2
时,进入到内层select
循环继续尝试执行job1 := <-ch1
,当ch1
就绪时就会一直执行,否则跳出内层select
,继续执行job2
。
这是两个任务的情况,在任务数可数的情况下可以层层嵌套来实现对多个任务排序,对于有规律的任务可以使用递归的。
参考1:https://blog.csdn.net/eddycjy/article/details/122053524
注意:
关闭的channel
不是nil
,所以在select
语句中依然可以监听并执行对应的case
,只不过在读取关闭后的channel
时,读取到的数据是零值,ok是false。要想知道某个通道是否关闭,判断ok是否为false即可。
要想判断某个通道是否关闭,当返回的ok为false时,执行c = nil 将通道置为nil,相当于读一个未初始化的通道,则会一直阻塞。至于为什么读一个未初始化的通道会出现阻塞,可以看我的另一篇 对未初始化的的chan进行读写,会怎么样?为什么? 。select中如果任意某个通道有值可读时,它就会被执行,其他被忽略。则select会跳过这个阻塞case,可以解决不断读已关闭通道的问题。
参考1:https://blog.csdn.net/eddycjy/article/details/122053524
要想屏蔽某个已经关闭的通道,判断通道的ok是false
后,将channel
置为nil
,select
再监听该通道时,相当于监听一个未初始化的通道,则会一直阻塞,select
会跳过这个阻塞,从而达到屏蔽的目的。
参考1:https://blog.csdn.net/eddycjy/article/details/122053524
只有一个case的情况下,则会死循环。
关闭的channel
不是nil
,所以在select
语句中依然可以监听并执行对应的case
,只不过在读取关闭后的channel
时,读取到的数据是零值,ok是false。
参考1:https://blog.csdn.net/eddycjy/article/details/122053524
答:因为只有一个已经关闭的channel,且已经置为了nil,这时select会先阻塞,最后发生死锁(fatal error: all goroutines are asleep - deadlock!
)。
对于既不设置default
条件,又一直没有IO
操作发生的情况,select
语句会引起死锁(fatal error: all goroutines are asleep - deadlock!
),如果不希望出现死锁,可以设置一个超时时间的case来解决;
defer
的作用就是把defer
关键字之后的函数执行压入一个栈中延迟执行
,多个defer
的执行顺序是后进先出
LIFO,也就是先执行最后一个defer,最后执行第一个defer。
在这些操作中,最容易忽略的就是在每个函数退出处正确地释放和关闭资源。
参考1:go defer、return的执行顺序
多个defer
的执行顺序是后进先出
LIFO,也就是先执行最后一个defer,最后执行第一个defer。
参考1:go defer、return的执行顺序
参考2:Go语言中defer和return执行顺序解析
return返回值的运行机制:
return并非原子操作,共分为赋值、返回值两步操作。
defer、return、返回值三者的执行是:
return最先执行,先将结果写入返回值中(即赋值);接着defer开始执行一些收尾工作;最后函数携带当前返回值退出(即返回值)。
如果函数的返回值是无名的(不带命名返回值),则go语言会在执行return的时候会执行一个类似创建一个临时变量作为保存return值的动作,所以defer里面的操作不会影响返回值
。
package main
import (
“fmt”
)
func main() {
fmt.Println(“return:”, Demo()) // 打印结果为 return: 0
}
func Demo() int {
var i int
defer func() {
i++
fmt.Println(“defer2:”, i) // 打印结果为 defer: 2
}()
defer func() {
i++
fmt.Println(“defer1:”, i) // 打印结果为 defer: 1
}()
return i
}
代码示例,实际上一共执行了3步操作:
1)赋值,因为返回值没有命名,所以return 默认指定了一个返回值(假设为s),首先将i赋值给s,i初始值是0,所以s也是0。
2)后续的defer操作因为是针对i,进行的,所以不会影响s,此后因为s不会更新,所以s不会变还是0。
3)返回值,return s,也就是return 0
相当于:
var i int
s := i
return s
有名返回值的函数,由于返回值在函数定义的时候已经将该变量进行定义,在执行return的时候会先执行返回值保存操作,而后续的defer函数会改变这个返回值(虽然defer是在return之后执行的,但是由于使用的函数定义的变量,所以执行defer操作后对该变量的修改会影响到return的值
)。
由于返回值已经提前定义了,不会产生临时零值变量,返回值就是提前定义的变量,后续所有的操作也都是基于已经定义的变量,任何对于返回值变量的修改都会影响到返回值本身。
package main
import (
“fmt”
)
func main() {
fmt.Println(“return:”, Demo2()) // 打印结果为 return: 2
}
func Demo2() (i int) {
defer func() {
i++
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip1024b (备注Go)
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
ase job1 := <-ch1:
fmt.Println(job1)
default:
break priority
}
}
fmt.Println(job2)
}
}
}
使用了嵌套的select,还组合使用了for
循环和label
来解决问题。上面的代码在外层select选中执行job2 := <-ch2
时,进入到内层select
循环继续尝试执行job1 := <-ch1
,当ch1
就绪时就会一直执行,否则跳出内层select
,继续执行job2
。
这是两个任务的情况,在任务数可数的情况下可以层层嵌套来实现对多个任务排序,对于有规律的任务可以使用递归的。
参考1:https://blog.csdn.net/eddycjy/article/details/122053524
注意:
关闭的channel
不是nil
,所以在select
语句中依然可以监听并执行对应的case
,只不过在读取关闭后的channel
时,读取到的数据是零值,ok是false。要想知道某个通道是否关闭,判断ok是否为false即可。
要想判断某个通道是否关闭,当返回的ok为false时,执行c = nil 将通道置为nil,相当于读一个未初始化的通道,则会一直阻塞。至于为什么读一个未初始化的通道会出现阻塞,可以看我的另一篇 对未初始化的的chan进行读写,会怎么样?为什么? 。select中如果任意某个通道有值可读时,它就会被执行,其他被忽略。则select会跳过这个阻塞case,可以解决不断读已关闭通道的问题。
参考1:https://blog.csdn.net/eddycjy/article/details/122053524
要想屏蔽某个已经关闭的通道,判断通道的ok是false
后,将channel
置为nil
,select
再监听该通道时,相当于监听一个未初始化的通道,则会一直阻塞,select
会跳过这个阻塞,从而达到屏蔽的目的。
参考1:https://blog.csdn.net/eddycjy/article/details/122053524
只有一个case的情况下,则会死循环。
关闭的channel
不是nil
,所以在select
语句中依然可以监听并执行对应的case
,只不过在读取关闭后的channel
时,读取到的数据是零值,ok是false。
参考1:https://blog.csdn.net/eddycjy/article/details/122053524
答:因为只有一个已经关闭的channel,且已经置为了nil,这时select会先阻塞,最后发生死锁(fatal error: all goroutines are asleep - deadlock!
)。
对于既不设置default
条件,又一直没有IO
操作发生的情况,select
语句会引起死锁(fatal error: all goroutines are asleep - deadlock!
),如果不希望出现死锁,可以设置一个超时时间的case来解决;
defer
的作用就是把defer
关键字之后的函数执行压入一个栈中延迟执行
,多个defer
的执行顺序是后进先出
LIFO,也就是先执行最后一个defer,最后执行第一个defer。
在这些操作中,最容易忽略的就是在每个函数退出处正确地释放和关闭资源。
参考1:go defer、return的执行顺序
多个defer
的执行顺序是后进先出
LIFO,也就是先执行最后一个defer,最后执行第一个defer。
参考1:go defer、return的执行顺序
参考2:Go语言中defer和return执行顺序解析
return返回值的运行机制:
return并非原子操作,共分为赋值、返回值两步操作。
defer、return、返回值三者的执行是:
return最先执行,先将结果写入返回值中(即赋值);接着defer开始执行一些收尾工作;最后函数携带当前返回值退出(即返回值)。
如果函数的返回值是无名的(不带命名返回值),则go语言会在执行return的时候会执行一个类似创建一个临时变量作为保存return值的动作,所以defer里面的操作不会影响返回值
。
package main
import (
“fmt”
)
func main() {
fmt.Println(“return:”, Demo()) // 打印结果为 return: 0
}
func Demo() int {
var i int
defer func() {
i++
fmt.Println(“defer2:”, i) // 打印结果为 defer: 2
}()
defer func() {
i++
fmt.Println(“defer1:”, i) // 打印结果为 defer: 1
}()
return i
}
代码示例,实际上一共执行了3步操作:
1)赋值,因为返回值没有命名,所以return 默认指定了一个返回值(假设为s),首先将i赋值给s,i初始值是0,所以s也是0。
2)后续的defer操作因为是针对i,进行的,所以不会影响s,此后因为s不会更新,所以s不会变还是0。
3)返回值,return s,也就是return 0
相当于:
var i int
s := i
return s
有名返回值的函数,由于返回值在函数定义的时候已经将该变量进行定义,在执行return的时候会先执行返回值保存操作,而后续的defer函数会改变这个返回值(虽然defer是在return之后执行的,但是由于使用的函数定义的变量,所以执行defer操作后对该变量的修改会影响到return的值
)。
由于返回值已经提前定义了,不会产生临时零值变量,返回值就是提前定义的变量,后续所有的操作也都是基于已经定义的变量,任何对于返回值变量的修改都会影响到返回值本身。
package main
import (
“fmt”
)
func main() {
fmt.Println(“return:”, Demo2()) // 打印结果为 return: 2
}
func Demo2() (i int) {
defer func() {
i++
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip1024b (备注Go)
[外链图片转存中…(img-q7nViTG8-1713131561586)]
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。