Go 语言官方文档详细阐述了 Go 语言编译器的具体执行过程,Go1.21 版本可以看这个:https://github.com/golang/go/tree/release-branch.go1.21/src/cmd/compile
解析 (cmd/compile/internal/syntax
类型检查 (cmd/compile/internal/types2
包是 go/types
的一个移植版本,它使用 syntax
包的 AST(抽象语法树)而不是 go/ast
。IR 构建(“noding”):
表示形式到 ir
和 types
)Walk (cmd/compile/internal/walk
通用 SSA (cmd/compile/internal/ssa
和 cmd/compile/internal/ssagen
生成机器代码 (cmd/compile/internal/ssa
和 cmd/internal/obj
)转换为机器代码,并写出最终的目标文件。Go 程序的编译过程符合经典编译原理的过程拆解,即三阶段编译器,分别为编译器前端、中端和后端:
参考《Go 语言底层原理剖析(郑建勋)》一书,本文将 Go 语言编译器执行流程拆分为以下几个阶段:
下面本文将以此书为参考并结合 Go1.21.0 版本,对每个过程进行阐述。
如果只想对 Go 程序的编译过程做一个简单的了解,那阅读到这里就已经足够了。
词法解析过程主要负责将源代码中的字符序列转换成一系列的标记(tokens),这些标记是编译器更进一步处理的基本单位。在 Go 语言的编译器中,tokens.go
我们来看以下 tokens.go 文件中的 token
定义,它们实质上是用 iota
const ( _ token = iota _EOF // EOF // names and literals _Name // name _Literal // literal // operators and operations // _Operator is excluding '*' (_Star) _IncOp // opop _Define // := ... // delimiters _Lparen // ( _Rparen // ) ... // keywords _Break // break ... // empty line comment to exclude it from .String tokenCount // )
举个例子,a := b + c(12)
Go 语言采用了标准的自上而下的递归下降(Top-Down Recursive-Descent)算法,以简单高效的方式完成无须回溯的语法扫描。
下面我们来看下 nodes.go
文件中对各个节点的声明(以下都省略了 struct 中的具体属性):
type (
Decl interface {
ImportDecl struct {} // 导入声明
ConstDecl struct {} // 常量声明
TypeDecl struct {} // 类型声明
VarDecl struct {} // 变量声明
FuncDecl struct {} // 函数声明
type ( Expr interface { Node typeInfo aExpr() } // 省略了结构体属性 BadExpr struct {} // 无效表达式 Name struct {} // Value BasicLit struct {} // Value CompositeLit struct {} // Type { ElemList[0], ElemList[1], ... } KeyValueExpr struct {} // Key: Value FuncLit struct {} // func Type { Body } ParenExpr struct {} // (X) SelectorExpr struct {} // X.Sel IndexExpr struct {} // X[Index] SliceExpr struct {} // X[Index[0] : Index[1] : Index[2]] AssertExpr struct {} // X.(Type) TypeSwitchGuard struct {} // Lhs := X.(type) Operation struct {} // 操作 +-*\ CallExpr struct {} // Fun(ArgList[0], ArgList[1], ...) ListExpr struct {} // ElemList[0], ElemList[1], ... ArrayType struct {} // [Len]Elem SliceType struct {} // []Elem DotsType struct {} // ...Elem StructType struct {} // struct { FieldList[0] TagList[0]; FieldList[1] TagList[1]; ... } Field struct {} // Name Type InterfaceType struct {} // interface { MethodList[0]; MethodList[1]; ... } FuncType struct {} // type FuncName func (param1, param2) return1, return2 MapType struct {} // map[Key]Value ChanType struct {} // chan Elem, <-chan Elem, chan<- Elem )
type ( // 所有语句的通用接口 Stmt interface { Node aStmt() } // 更加简单语句的通用接口 SimpleStmt interface {} EmptyStmt struct {} // 空语句 LabeledStmt struct {} // 标签语句 BlockStmt struct {} // 代码块语句 ExprStmt struct {} // 表达式语句 SendStmt struct {} // 发送语句,用于 channel DeclStmt struct {} // 声明语句 AssignStmt struct {} // 赋值语句 BranchStmt struct {} // 分支语句,break, continue CallStmt struct {} // 调用语句 ReturnStmt struct {} // 返回语句 IfStmt struct {} // if 条件语句 ForStmt struct {} // for 循环语句 SwitchStmt struct {} // switch 语句 SelectStmt struct {} // select 语句 )
type AssignStmt struct {
Op Operator // 操作符 0 means no operation
Lhs, Rhs Expr // 左右两个表达式 Rhs == nil means Lhs++ (Op == Add) or Lhs-- (Op == Sub)
package main
import "fmt"
const name = "hedon"
type String string
var s String = "hello " + word
func main() {
再来看一个赋值语句是如何解析的,就以之前的 a := b + c(12)
编译器前端必须构建程序的中间表示形式,以便在编译器中端及后端使用,抽象语法树(Abstract Syntax Tree,AST)是一种常见的树状结构的中间态。
抽象语法树(AST,Abstract Syntax Tree)是源代码的树状结构表示,它用于表示编程语言的语法结构,但不包括所有语法细节。AST 是编译器设计中的关键概念,广泛应用于编译器的各个阶段。
在 Go 语言源文件中的任何一种 Declarations 都是一个根节点,如下 pkgInit(decls)
函数将源文件中的所有声明语句都转换为节点(Node),代码位于:syntax/syntax.go 和 syntax/parser.go 中。
func Parse(base *PosBase, src io.Reader, errh ErrorHandler, pragh PragmaHandler, mode Mode) (_ *File, first error) { defer func() { if p := recover(); p != nil { if err, ok := p.(Error); ok { first = err return } panic(p) } }() var p parser p.init(base, src, errh, pragh, mode) p.next() return p.fileOrNil(), p.first }
下面是对 Parse()
: 位置基础信息。src
: 要解析的源文件。errh
: 错误处理函数。pragh
: 用于处理每个遇到的编译指令(pragma)。mode
: 解析模式。File
类型的指针,表示解析后的 AST,以及可能的错误。errh
不为空:将会调用它处理每个遇到的错误,解析器尽可能多地处理源文件。此时,只有在没有找到正确的包声明时,返回的语法树才为 nil
为空:解析器在遇到第一个错误时立即终止,返回的语法树为 nil
。其中 File
type File struct {
Pragma Pragma // 编译指令
PkgName *Name // 包名
DeclList []Decl // 源文件中的各种声明
EOF Pos // 解析位置
GoVersion string // go 版本
node // 该源文件的 AST 根节点
具体的解析过程在 parser.fileOrNil()
func (p *parser) fileOrNil() *File { if trace { defer p.trace("file")() } // 1. 初始化文件节点 f := new(File) f.pos = p.pos() // 2. 解析包声明 f.GoVersion = p.goVersion p.top = false if !p.got(_Package) { // 包声明必须放在第一位,这跟我们学 Go 语法对应上了 p.syntaxError("package statement must be first") return nil } f.Pragma = p.takePragma() // 获取编译指令 f.PkgName = p.name() // 获取包名 p.want(_Semi) // _Semi 在之前的 tokens.go 中可以发现是分号(;),是的,包声明后面就是得带分号 // 3. 处理包声明错误 if p.first != nil { return nil } // 4. 循环解析顶层声明 // 循环处理文件中的所有声明,包括 import、const、type、var 和 func // 对每种类型的声明,调用其解析函数,如 importDecl、constDecl 进行解析 prev := _Import for p.tok != _EOF { if p.tok == _Import && prev != _Import { p.syntaxError("imports must appear before other declarations") } prev = p.tok switch p.tok { case _Import: p.next() f.DeclList = p.appendGroup(f.DeclList, p.importDecl) case _Const: p.next() f.DeclList = p.appendGroup(f.DeclList, p.constDecl) case _Type: p.next() f.DeclList = p.appendGroup(f.DeclList, p.typeDecl) case _Var: p.next() f.DeclList = p.appendGroup(f.DeclList, p.varDecl) case _Func: p.next() if d := p.funcDeclOrNil(); d != nil { f.DeclList = append(f.DeclList, d) } default: // 5. 处理异常和错误 if p.tok == _Lbrace && len(f.DeclList) > 0 && isEmptyFuncDecl(f.DeclList[len(f.DeclList)-1]) { p.syntaxError("unexpected semicolon or newline before {") } else { p.syntaxError("non-declaration statement outside function body") } p.advance(_Import, _Const, _Type, _Var, _Func) continue } // Reset p.pragma BEFORE advancing to the next token (consuming ';') // since comments before may set pragmas for the next function decl. p.clearPragma() if p.tok != _EOF && !p.got(_Semi) { p.syntaxError("after top level declaration") p.advance(_Import, _Const, _Type, _Var, _Func) } } // 6. 完成解析,记录文件结束的位置 p.clearPragma() f.EOF = p.pos() return f }
总结 parser.fileOrNil()
f := new(File)
: 创建一个新的 File
节点。f.pos = p.pos()
: 设置节点的位置信息。f.GoVersion = p.goVersion
: 记录 Go 版本。p.top = false
: 设置状态,表示不再处于文件顶层。if !p.got(_Package) {...}
: 检查是否存在包声明,如果没有,则报错并返回 nil
。f.Pragma = p.takePragma()
: 获取与包声明相关的编译指令。f.PkgName = p.name()
: 获取包名。p.want(_Semi)
: 确认包声明后有分号。if p.first != nil {...}
: 如果已有错误,停止解析并返回 nil
在遇到错误时跳过一些标记,以尝试恢复到一个已知的稳定状态。f.EOF = p.pos()
: 记录文件结束的位置。File
节点。AST 每个节点都包含了当前节点属性的 Op 字段,定义在 ir/node.go
中,以 O 开头。与词法解析阶段中的 token 相同的是,Op 字段也是一个整数。不同的是,每个 Op 字段都包含了语义信息。例如,当一个节点的 Op 操作为 OAS 时,该节点代表的语义为 Left := Right,而当节点的操作为 OAS2 时,代码的语义为 x,y,z = a,b,c。
这里仅展示部分 Op 字段的定义:
type Op uint8 // Node ops. const ( OXXX Op = iota // names ONAME // var or func name // Unnamed arg or return value: f(int, string) (int, error) { etc } // Also used for a qualified package identifier that hasn't been resolved yet. ONONAME OTYPE // type name OLITERAL // literal ONIL // nil // expressions OADD // X + Y ... // X = Y or (if Def=true) X := Y // If Def, then Init includes a DCL node for X. OAS // Lhs = Rhs (x, y, z = a, b, c) or (if Def=true) Lhs := Rhs // If Def, then Init includes DCL nodes for Lhs OAS2 ... // statements OLABEL // Label: ... OEND )
以前面举例的赋值语句 a := b + c(12)
完成 AST 的初步构建后,就进入类型检查阶段遍历节点树并决定节点的类型。具体的代码在 types2/check,go。
其中最核心的方法就是 checker.CheckFiles()
func (check *Checker) checkFiles(files []*syntax.File) (err error) { // 1. 不检查 unsafe 包 if check.pkg == Unsafe { return nil } // 2. 检查 go 版本 check.version, err = parseGoVersion(check.conf.GoVersion) if err != nil { return err } if check.version.after(version{1, goversion.Version}) { return fmt.Errorf("package requires newer Go version %v", check.version) } if check.conf.FakeImportC && check.conf.go115UsesCgo { return errBadCgo } // 3. 错误处理 defer check.handleBailout(&err) // 4. 详细检查每个地方 print := func(msg string) { if check.conf.Trace { fmt.Println() fmt.Println(msg) } } print("== initFiles ==") check.initFiles(files) print("== collectObjects ==") check.collectObjects() print("== packageObjects ==") check.packageObjects() print("== processDelayed ==") check.processDelayed(0) // incl. all functions print("== cleanup ==") check.cleanup() print("== initOrder ==") check.initOrder() if !check.conf.DisableUnusedImportCheck { print("== unusedImports ==") check.unusedImports() } print("== recordUntyped ==") check.recordUntyped() if check.firstErr == nil { check.monomorph() } check.pkg.goVersion = check.conf.GoVersion check.pkg.complete = true // 5. 更新和清理 check.imports = nil check.dotImportMap = nil check.pkgPathMap = nil check.seenPkgMap = nil check.recvTParamMap = nil check.brokenAliases = nil check.unionTypeSets = nil check.ctxt = nil return }
总结 checker.checkFiles()
: 初始化文件。collectObjects
: 收集对象。packageObjects
: 打包对象。processDelayed
: 处理延迟的任务(包括所有函数)。cleanup
: 清理。initOrder
: 初始化顺序。unusedImports
: 检查未使用的导入。recordUntyped
: 记录未定类型。monomorph
: 如果没有错误,进行单态化处理。可以看出具体的检查步骤都封装在第 4 点的各个函数中,其实检查的东西我们学习 Go 语言时所需要掌握的那些语法,我们以 initFiles
为例子来分析一下,对于其他检查函数,你有兴趣的话也可以了解一下,这里推荐将函数源代码拷贝发给 ChatGPT-4,相信对你会有很大的帮助。
// initFiles 初始化与文件相关的类型检查器 // 参数中的 files 必须都属于同一个 package func (check *Checker) initFiles(files []*syntax.File) { // 1. 初始化 check.files = nil check.imports = nil check.dotImportMap = nil check.firstErr = nil check.methods = nil check.untyped = nil check.delayed = nil check.objPath = nil check.cleaners = nil // 2. 确定包名和有效文件 pkg := check.pkg for _, file := range files { switch name := file.PkgName.Value; pkg.name { case "": if name != "_" { pkg.name = name } else { check.error(file.PkgName, BlankPkgName, "invalid package name _") } fallthrough case name: check.files = append(check.files, file) default: check.errorf(file, MismatchedPkgName, "package %s; expected %s", name, pkg.name) // ignore this file } } // 3. 对每个文件,解析其中指定的 Go 版本 for _, file := range check.files { v, _ := parseGoVersion(file.GoVersion) if v.major > 0 { if v.equal(check.version) { continue } // Go 1.21 introduced the feature of setting the go.mod // go line to an early version of Go and allowing //go:build lines // to “upgrade” the Go version in a given file. // We can do that backwards compatibly. // Go 1.21 also introduced the feature of allowing //go:build lines // to “downgrade” the Go version in a given file. // That can't be done compatibly in general, since before the // build lines were ignored and code got the module's Go version. // To work around this, downgrades are only allowed when the // module's Go version is Go 1.21 or later. // If there is no check.version, then we don't really know what Go version to apply. // Legacy tools may do this, and they historically have accepted everything. // Preserve that behavior by ignoring //go:build constraints entirely in that case. if (v.before(check.version) && check.version.before(version{1, 21})) || check.version.equal(version{0, 0}) { continue } if check.posVers == nil { check.posVers = make(map[*syntax.PosBase]version) } check.posVers[base(file.Pos())] = v } } }
总结 checker.initFiles()
结构体中与文件相关的多个字段,如 files
, imports
, dotImportMap
行的处理。可以看到 Go 语言开发团队在这里写了一大段关于 Go1.21 的注释,这段注释描述了 Go 1.21 版本引入的关于 Go 版本设置的两个新特性,这里简单解释一下:
文件里设置一个较旧的Go版本,同时允许在源文件中通过 //go:build
行来指定一个更高的 Go 版本。这样做可以向后兼容,即允许旧版本代码在新版本的 Go 环境中运行。//go:build
行来降低源文件中的 Go 版本。但这通常不是向后兼容的,因为在以前,//go:build
行被忽略,代码总是使用模块定义的 Go 版本。为了避免兼容性问题,仅当模块的 Go 版本为 1.21 或更高时,才允许这种降级。未指定版本的情况:如果没有明确指定 check.version
,编译器就不确定应该使用哪个 Go 版本。为了保持与旧工具的兼容,如果没有明确的版本约束,编译器将忽略 //go:build
类型检查阶段完成后,编译器前端工作基本完成,后面就进入中端了。这个阶段 Go 语言编译器将对 AST 进行分析和重构,从而完成一系列优化。
第一部分是死代码消除(dead code elimination),过程识别并移除不会在运行时执行的代码。这包括未使用的变量、函数、常量等。通过删除这些无用代码片段,可以减小最终程序的大小并提高运行效率。
这部分的代码在:deadcode/deadcode.go。打开代码文件,可以看到核心就是 Func()
和 stmt()
这 2 个函数。
func Func(fn *ir.Func) { // 1. 对函数体进行预处理 stmts(&fn.Body) // 2. 空函数体直接返回 if len(fn.Body) == 0 { return } // 3. 遍历函数体,对其中每个节点进行处理 for _, n := range fn.Body { // 节点有任何初始化操作,则不可消除,提前返回。 if len(n.Init()) > 0 { return } switch n.Op() { case ir.OIF: n := n.(*ir.IfStmt) // 如果 if 语句判断条件不是常量,或者 if else 中的 body 不为空,则不可消除,提前返回 if !ir.IsConst(n.Cond, constant.Bool) || len(n.Body) > 0 || len(n.Else) > 0 { return } case ir.OFOR: n := n.(*ir.ForStmt) // 如果 for 循环条件不是常量或一直为真,则不可消除,提前返回 if !ir.IsConst(n.Cond, constant.Bool) || ir.BoolVal(n.Cond) { return } default: return } } // 4. 标记隐藏闭包为死代码 ir.VisitList(fn.Body, markHiddenClosureDead) // 5. 重置函数体,替换为一个空语句,进行清理和优化 fn.Body = []ir.Node{ir.NewBlockStmt(base.Pos, nil)} }
和 For
:如果 If
语句的条件不是常量布尔值,或者 If
语句有非空的 body 或 else 分支,则提前返回,因为这些分支可能包含重要的代码。ir.OFOR
:对于 For
func stmts(nn *ir.Nodes) { // 1. 标记最后一个标签,其对应的 Op 字段就是 OLABEL var lastLabel = -1 for i, n := range *nn { if n != nil && n.Op() == ir.OLABEL { lastLabel = i } } // 2. 处理 if 和 switch 语句 for i, n := range *nn { cut := false if n == nil { continue } if n.Op() == ir.OIF { n := n.(*ir.IfStmt) n.Cond = expr(n.Cond) // if 语句根据条件是否为常量来保留和移除分支 if ir.IsConst(n.Cond, constant.Bool) { var body ir.Nodes if ir.BoolVal(n.Cond) { ir.VisitList(n.Else, markHiddenClosureDead) n.Else = ir.Nodes{} body = n.Body } else { ir.VisitList(n.Body, markHiddenClosureDead) n.Body = ir.Nodes{} body = n.Else } // 如果 then 或 else 分支以 panic 或 return 语句结束,那么可以安全地移除该节点之后的所有语句。 // 这是因为 panic 或 return 会导致函数终止,后续的代码永远不会被执行。 // 同时,注释提到要避免移除标签(labels),因为它们可能是 goto 语句的目标, // 而且为了避免 goto 相关的复杂性,没有使用 isterminating 标记。 // might be the target of a goto. See issue 28616. if body := body; len(body) != 0 { switch body[(len(body) - 1)].Op() { case ir.ORETURN, ir.OTAILCALL, ir.OPANIC: if i > lastLabel { cut = true } } } } } // 尝试简化 switch 语句,根据条件值决定哪个分支始终被执行 if n.Op() == ir.OSWITCH { n := n.(*ir.SwitchStmt) func() { if n.Tag != nil && n.Tag.Op() == ir.OTYPESW { return // no special type-switch case yet. } var x constant.Value // value we're switching on if n.Tag != nil { if ir.ConstType(n.Tag) == constant.Unknown { return } x = n.Tag.Val() } else { x = constant.MakeBool(true) // switch { ... } => switch true { ... } } var def *ir.CaseClause for _, cas := range n.Cases { if len(cas.List) == 0 { // default case def = cas continue } for _, c := range cas.List { if ir.ConstType(c) == constant.Unknown { return // can't statically tell if it matches or not - give up. } if constant.Compare(x, token.EQL, c.Val()) { for _, n := range cas.Body { if n.Op() == ir.OFALL { return // fallthrough makes it complicated - abort. } } // This switch entry is the one that always triggers. for _, cas2 := range n.Cases { for _, c2 := range cas2.List { ir.Visit(c2, markHiddenClosureDead) } if cas2 != cas { ir.VisitList(cas2.Body, markHiddenClosureDead) } } // Rewrite to switch { case true: ... } n.Tag = nil cas.List[0] = ir.NewBool(c.Pos(), true) cas.List = cas.List[:1] n.Cases[0] = cas n.Cases = n.Cases[:1] return } } } if def != nil { for _, n := range def.Body { if n.Op() == ir.OFALL { return // fallthrough makes it complicated - abort. } } for _, cas := range n.Cases { if cas != def { ir.VisitList(cas.List, markHiddenClosureDead) ir.VisitList(cas.Body, markHiddenClosureDead) } } n.Cases[0] = def n.Cases = n.Cases[:1] return } // TODO: handle case bodies ending with panic/return as we do in the IF case above. // entire switch is a nop - no case ever triggers for _, cas := range n.Cases { ir.VisitList(cas.List, markHiddenClosureDead) ir.VisitList(cas.Body, markHiddenClosureDead) } n.Cases = n.Cases[:0] }() } // 3. 对节点的初始化语句递归调用 stmt 函数进行处理 if len(n.Init()) != 0 { stmts(n.(ir.InitNode).PtrInit()) } // 4. 遍历其他控制结构,递归处理它们的内部语句 switch n.Op() { case ir.OBLOCK: n := n.(*ir.BlockStmt) stmts(&n.List) case ir.OFOR: n := n.(*ir.ForStmt) stmts(&n.Body) case ir.OIF: n := n.(*ir.IfStmt) stmts(&n.Body) stmts(&n.Else) case ir.ORANGE: n := n.(*ir.RangeStmt) stmts(&n.Body) case ir.OSELECT: n := n.(*ir.SelectStmt) for _, cas := range n.Cases { stmts(&cas.Body) } case ir.OSWITCH: n := n.(*ir.SwitchStmt) for _, cas := range n.Cases { stmts(&cas.Body) } } // 5. 如果确定了是可以消除的代码,则对函数体进行阶段,且标记其中的闭包为死代码 if cut { ir.VisitList((*nn)[i+1:len(*nn)], markHiddenClosureDead) *nn = (*nn)[:i+1] break } } }
和 switch
语句,它尝试简化 switch
和 switch
这部分的代码在 devirtuailze/devirtualize.go。
核心就 2 个函数:
:遍历函数中的所有节点,尤其注意跳过在 go
或 defer
:针对一个具体的接口方法调用,如果可能,将其替换为直接的具体类型方法调用,以优化性能。func Static(fn *ir.Func) { ir.CurFunc = fn goDeferCall := make(map[*ir.CallExpr]bool) // 1. VisitList 对 fn.Body 中所有节点调用后面的 func ir.VisitList(fn.Body, func(n ir.Node) { switch n := n.(type) { // 2. 跳过 go 和 defer 语句 case *ir.GoDeferStmt: if call, ok := n.Call.(*ir.CallExpr); ok { goDeferCall[call] = true } return // 3. 调用 staticCall 尝试进行去虚拟化 case *ir.CallExpr: if !goDeferCall[n] { staticCall(n) } } }) }
和 defer
或 defer
语句中的接口方法调用,调用 staticCall
函数尝试进行去虚拟化。func staticCall(call *ir.CallExpr) { // 1. 检查调用是否为接口方法调用,如果不是,直接返回 if call.Op() != ir.OCALLINTER { return } // 2. 获取接收器和相关类型 sel := call.X.(*ir.SelectorExpr) r := ir.StaticValue(sel.X) // 3. 检查接收器是否是接口转换,如果不是,直接返回 if r.Op() != ir.OCONVIFACE { return } recv := r.(*ir.ConvExpr) // 4. 提取接收器类型 typ := recv.X.Type() if typ.IsInterface() { return } // 5. shape 类型直接返回,因为这一般涉及到泛型,需要通过字典进行间接调用 if typ.IsShape() { return } if typ.HasShape() { if base.Flag.LowerM != 0 { base.WarnfAt(call.Pos(), "cannot devirtualize %v: shaped receiver %v", call, typ) } return } if sel.X.Type().HasShape() { if base.Flag.LowerM != 0 { base.WarnfAt(call.Pos(), "cannot devirtualize %v: shaped interface %v", call, sel.X.Type()) } return } // 6. 类型断言和方法选择,尝试确定调用的具体方法 dt := ir.NewTypeAssertExpr(sel.Pos(), sel.X, nil) dt.SetType(typ) x := typecheck.Callee(ir.NewSelectorExpr(sel.Pos(), ir.OXDOT, dt, sel.Sel)) switch x.Op() { case ir.ODOTMETH: x := x.(*ir.SelectorExpr) if base.Flag.LowerM != 0 { base.WarnfAt(call.Pos(), "devirtualizing %v to %v", sel, typ) } call.SetOp(ir.OCALLMETH) call.X = x case ir.ODOTINTER: x := x.(*ir.SelectorExpr) if base.Flag.LowerM != 0 { base.WarnfAt(call.Pos(), "partially devirtualizing %v to %v", sel, typ) } call.SetOp(ir.OCALLINTER) call.X = x default: if base.Flag.LowerM != 0 { base.WarnfAt(call.Pos(), "failed to devirtualize %v (%v)", x, x.Op()) } return // 7. 根据类型断言的结果,尝试将接口方法调用转换为直接方法调用或保留为接口方法调用。 types.CheckSize(x.Type()) switch ft := x.Type(); ft.NumResults() { case 0: case 1: call.SetType(ft.Results().Field(0).Type) default: call.SetType(ft.Results()) } // 8. 对可能修改后的方法调用进行进一步的类型检查和调整。 typecheck.FixMethodCall(call) }
在 Go 语言中,可以通过 //go:noinline
这部分的主要实现在 inline.inl.go,核心函数是:CanInline()
和 InlineImpossible()
// Inlining budget parameters, gathered in one place const ( // budget 是内联复杂度的衡量, // 超过 80 表示编译器认为这个函数太复杂了,就不进行函数内联了 inlineMaxBudget = 80 ) // CanInline 用于判断 fn 是否可内联。 // 如果可以,会将 fn.Body 和 fn.Dcl 拷贝一份放到 fn.Inl, // 其中 fn 和 fn.Body 需要确保已经经过类型检查了。 func CanInline(fn *ir.Func, profile *pgo.Profile) { // 函数名必须有效 if fn.Nname == nil { base.Fatalf("CanInline no nname %+v", fn) } // 如果不能内联,输出原因 var reason string if base.Flag.LowerM > 1 || logopt.Enabled() { defer func() { if reason != "" { if base.Flag.LowerM > 1 { fmt.Printf("%v: cannot inline %v: %s\n", ir.Line(fn), fn.Nname, reason) } if logopt.Enabled() { logopt.LogOpt(fn.Pos(), "cannotInlineFunction", "inline", ir.FuncName(fn), reason) } } }() } // 检查是否符合不可能内联的情况,如果返回的 reason 不为空,则表示有不可以内联的原因 reason = InlineImpossible(fn) if reason != "" { return } if fn.Typecheck() == 0 { base.Fatalf("CanInline on non-typechecked function %v", fn) } n := fn.Nname if n.Func.InlinabilityChecked() { return } defer n.Func.SetInlinabilityChecked(true) cc := int32(inlineExtraCallCost) if base.Flag.LowerL == 4 { cc = 1 // this appears to yield better performance than 0. } // 设置内联预算,后面如果检查函数的复杂度超过预算了,就不内联了 budget := int32(inlineMaxBudget) if profile != nil { if n, ok := profile.WeightedCG.IRNodes[ir.LinkFuncName(fn)]; ok { if _, ok := candHotCalleeMap[n]; ok { budget = int32(inlineHotMaxBudget) if base.Debug.PGODebug > 0 { fmt.Printf("hot-node enabled increased budget=%v for func=%v\n", budget, ir.PkgFuncName(fn)) } } } } // 遍历函数体,计算复杂度,判断是否超过内联预算 visitor := hairyVisitor{ curFunc: fn, budget: budget, maxBudget: budget, extraCallCost: cc, profile: profile, } if visitor.tooHairy(fn) { reason = visitor.reason return } // 前面检查都没问题,则标记为可以内联,并复制其函数体和声明到内联结构体中 n.Func.Inl = &ir.Inline{ Cost: budget - visitor.budget, Dcl: pruneUnusedAutos(n.Defn.(*ir.Func).Dcl, &visitor), Body: inlcopylist(fn.Body), CanDelayResults: canDelayResults(fn), } // 日志和调试 if base.Flag.LowerM > 1 { fmt.Printf("%v: can inline %v with cost %d as: %v { %v }\n", ir.Line(fn), n, budget-visitor.budget, fn.Type(), ir.Nodes(n.Func.Inl.Body)) } else if base.Flag.LowerM != 0 { fmt.Printf("%v: can inline %v\n", ir.Line(fn), n) } if logopt.Enabled() { logopt.LogOpt(fn.Pos(), "canInlineFunction", "inline", ir.FuncName(fn), fmt.Sprintf("cost: %d", budget-visitor.budget)) } }
结构用于遍历函数体,判断是否超出了内联预算。这涉及对函数体的复杂度和大小的评估。func InlineImpossible(fn *ir.Func) string { var reason string // reason, if any, that the function can not be inlined. if fn.Nname == nil { reason = "no name" return reason } // If marked "go:noinline", don't inline. if fn.Pragma&ir.Noinline != 0 { reason = "marked go:noinline" return reason } // If marked "go:norace" and -race compilation, don't inline. if base.Flag.Race && fn.Pragma&ir.Norace != 0 { reason = "marked go:norace with -race compilation" return reason } // If marked "go:nocheckptr" and -d checkptr compilation, don't inline. if base.Debug.Checkptr != 0 && fn.Pragma&ir.NoCheckPtr != 0 { reason = "marked go:nocheckptr" return reason } // If marked "go:cgo_unsafe_args", don't inline, since the function // makes assumptions about its argument frame layout. if fn.Pragma&ir.CgoUnsafeArgs != 0 { reason = "marked go:cgo_unsafe_args" return reason } // If marked as "go:uintptrkeepalive", don't inline, since the keep // alive information is lost during inlining. // // TODO(prattmic): This is handled on calls during escape analysis, // which is after inlining. Move prior to inlining so the keep-alive is // maintained after inlining. if fn.Pragma&ir.UintptrKeepAlive != 0 { reason = "marked as having a keep-alive uintptr argument" return reason } // If marked as "go:uintptrescapes", don't inline, since the escape // information is lost during inlining. if fn.Pragma&ir.UintptrEscapes != 0 { reason = "marked as having an escaping uintptr argument" return reason } // The nowritebarrierrec checker currently works at function // granularity, so inlining yeswritebarrierrec functions can confuse it // (#22342). As a workaround, disallow inlining them for now. if fn.Pragma&ir.Yeswritebarrierrec != 0 { reason = "marked go:yeswritebarrierrec" return reason } // If a local function has no fn.Body (is defined outside of Go), cannot inline it. // Imported functions don't have fn.Body but might have inline body in fn.Inl. if len(fn.Body) == 0 && !typecheck.HaveInlineBody(fn) { reason = "no function body" return reason } // If fn is synthetic hash or eq function, cannot inline it. // The function is not generated in Unified IR frontend at this moment. if ir.IsEqOrHashFunc(fn) { reason = "type eq/hash function" return reason } return "" }
指令并在 -race
编译模式下:在竞态检测编译模式下不内联标记为 norace
指令并在 -d checkptr
编译模式下:在指针检查编译模式下不内联标记为 nocheckptr
指令:对于标记为 cgo_unsafe_args
指令:不内联标记为 uintptrkeepalive
指令:不内联标记为 uintptrescapes
指令:为了防止写屏障记录检查器的混淆,不内联标记为 yeswritebarrierrec
func SayHello() string { s := "hello, " + "world" return s } func Fib(index int) int { if index < 2 { return index } return Fib(index-1) + Fib(index-2) } func ForSearch() int { var s = []int{1, 2, 3, 4, 5, 6, 7, 8, 9, 0} res := 0 for i := 0; i < len(s); i++ { if s[i] == i { res = i } } return res } func main() { SayHello() Fib(65) ForSearch() }
在编译时我们可以加入 -m=2
标签,来打印函数的内联调试信息。在 main.go
go tool compile -m=2 main.go
main.go:3:6: can inline SayHello with cost 7 as: func() string { s := "hello, " + "world"; return s }
main.go:8:6: cannot inline Fib: recursive
main.go:15:6: can inline ForSearch with cost 45 as: func() int { s := []int{...}; res := 0; for loop; return res }
main.go:26:6: cannot inline main: function too complex: cost 116 exceeds budget 80
main.go:27:10: inlining call to SayHello
main.go:29:11: inlining call to ForSearch
main.go:16:15: []int{...} does not escape
main.go:29:11: []int{...} does not escape
可以看到 SayHello()
和 ForSearch
都被内联了,而 Fib()
逃逸分析是 Go 语言中非常重要的优化阶段,用于标识变量内存应该被分配在栈上还是堆上。
在传统的 C 或 C++ 开发中,开发者经常会犯的错误就是函数返回了一个栈上的对象指针,在函数执行完毕后,函数栈会被销毁,如果继续访问被销毁栈上的对象指针,那么就会出现问题。
Go 语言能够通过编译时的逃逸分析识别这种问题,自动将这类变量放置到堆区,并借助 Go 运行时的垃圾回收机制自动释放内存。编译器会尽可能地将变量放置在栈上,因为栈中的对象会随着函数调用结束被自动销毁,这可以减轻运行时分配和垃圾回收的负担。
在 Go 语言中,开发者模糊了栈区和堆区的区别,不管是字符串、数组字面量,还是通过 new、make 标识符创建的对象,都既可能被分配到栈上,也可能被分配到堆上。但是,整体上会遵循 2 个原则:
这部分的代码主要在 escape。
Go 语言通过对 AST 的静态数据流分析来实现逃逸分析(escape/graph.go),在这个过程,它会构建带权重的有向图,其中权重可以表面当前变量引用和解引用的数量。
func (k hole) deref(where ir.Node, why string) hole { return k.shift(1).note(where, why) } // 解引用
func (k hole) addr(where ir.Node, why string) hole { return k.shift(-1).note(where, why) } // 引用
具体来说,Go 逃逸分析会按照如下规则生成数据流图(带权重的有向图):
操作会给边的权重 +1;&
操作会给边权重 -1。其中:节点权重 = 指向的节点权重 + 边权重
逃逸分析的目标就是找到其中节点权重为 -1 的变量,并结合上述提到的 2 个原则,来判断要不要将变量分配到堆上。
package main
var o *int
func main() {
l := new(int)
*l = 42
m := &l
n := &m
o = **n
是加 1,&
然后根据引用和解引用给边赋权重,因为 new(int)
其实就是分配一个 int(0)
并取地址,相当于 &
,所以指向 l
的边权重是 -1
节点权重 = 边权重 + 指向节点权重,因为没有对 o
变量进行任何的操作,所以 o
权重为 0,从右往左推可以得到:
经过分析,我们就找到了节点权重为 -1
的节点 new(int)
,又由于它的节点变量地址最终会被传递到变量 o
上,结合之前的 2 个原则,o
是一个全局变量,声明周期是超过函数栈的,所以 new(int)
go tool compile -m main.go
/escape/main.go:5:6: can inline main
/escape/main.go:6:10: new(int) escapes to hea
go build -gcflags="-m -m -l" main.go
# command-line-arguments ./main.go:6:10: new(int) escapes to heap: ./main.go:6:10: flow: l = &{storage for new(int)}: ./main.go:6:10: from new(int) (spill) at ./main.go:6:10 ./main.go:6:10: from l := new(int) (assign) at ./main.go:6:4 ./main.go:6:10: flow: m = &l: ./main.go:6:10: from &l (address-of) at ./main.go:8:7 ./main.go:6:10: from m := &l (assign) at ./main.go:8:4 ./main.go:6:10: flow: n = &m: ./main.go:6:10: from &m (address-of) at ./main.go:9:7 ./main.go:6:10: from n := &m (assign) at ./main.go:9:4 ./main.go:6:10: flow: {heap} = **n: ./main.go:6:10: from *n (indirection) at ./main.go:10:7 ./main.go:6:10: from *(*n) (indirection) at ./main.go:10:6 ./main.go:6:10: from o = *(*n) (assign) at ./main.go:10:4 ./main.go:6:10: new(int) escapes to heap
如果我们试一下,把 o
放在 main()
func main() {
var o *int
l := new(int)
*l = 42
m := &l
n := &m
o = **n
o = o // 让编译通过
go tool compile -m main.go
/escape/main.go:3:6: can inline main
/escape/main.go:5:10: new(int) does not escape
如我们所想,虽然 new(int)
的权重为 -1
,但是它的声明周期始终没有超过 main()
这一过程在前面提到的逃逸分析过程中进行,具体实现在 escape/escape.go 的 flowClosure()
func (b *batch) flowClosure(k hole, clo *ir.ClosureExpr) { // 遍历闭包中的所有变量 for _, cv := range clo.Func.ClosureVars { n := cv.Canonical() loc := b.oldLoc(cv) // 如果变量未被捕获,则触发错误 if !loc.captured { base.FatalfAt(cv.Pos(), "closure variable never captured: %v", cv) } // 根据变量的特性决定是通过值还是引用捕获 // 如果变量未被重新赋值或取址,并且小于等于 128 字节,则通过值捕获 n.SetByval(!loc.addrtaken && !loc.reassigned && n.Type().Size() <= 128) if !n.Byval() { n.SetAddrtaken(true) // 特殊情况处理:字典变量不通过值捕获 if n.Sym().Name == typecheck.LocalDictName { base.FatalfAt(n.Pos(), "dictionary variable not captured by value") } } // 记录闭包捕获变量的方式(值或引用) if base.Flag.LowerM > 1 { how := "ref" if n.Byval() { how = "value" } base.WarnfAt(n.Pos(), "%v capturing by %s: %v (addr=%v assign=%v width=%d)", n.Curfn, how, n, loc.addrtaken, loc.reassigned, n.Type().Size()) } // 建立闭包变量的数据流 k := k if !cv.Byval() { k = k.addr(cv, "reference") } b.flow(k.note(cv, "captured by a closure"), loc) } }
package main
func main() {
a := 1
b := 2
go func() {
add(a, b)
a = 99
func add(a, b int) {
a = a + b
go tool compile -m=2 main.go | grep "capturing"
main.go:4:2: main capturing by ref: a (addr=false assign=true width=8)
main.go:5:2: main capturing by value: b (addr=false assign=false width=8)
可以看到 a
是通过 ref 地址引用
的方式进行引用的,而 b
是通过 value 值传递
简单分析一下:上述例子中,闭包引用了 a
和 b
这 2 个闭包外声明的变量,而变量 a
在闭包之前又做了一些其他的操作,而 b 没有,所以对于 a
,因为闭包外有操作,所以闭包内的操作可能是有特殊意义的,需要反馈到闭包外,就需要用 ref 地址引用
了,而 b
在闭包外并不关心,所以闭包内的操作不会影响到闭包外,故直接使用 value 值传递
逃逸分析后,现在我们进入 walk
阶段了。这里首先会进行闭包重写。其核心逻辑在 walk/closure.go 中。
闭包重写分为 2 种情况:
func main() {
a := 1
b := 2
go func() {
add(a, b)
a = 99
func add(a, b int) {
a = a + b
func main() {
a := 1
b := 2
go func1(&a, b)
a = 99
// 注意这里 a 的类型的 *int,因为在变量捕获阶段,判断了 a 应该用地址引用
func func1(a *int, b int) {
add(*a, b)
func add(a, b int) {
a = a + b
编译器具体的处理逻辑在 directClosureCall()
// directClosureCall rewrites a direct call of a function literal into // a normal function call with closure variables passed as arguments. // This avoids allocation of a closure object. // // For illustration, the following call: // // func(a int) { // println(byval) // byref++ // }(42) // // becomes: // // func(byval int, &byref *int, a int) { // println(byval) // (*&byref)++ // }(byval, &byref, 42) func directClosureCall(n *ir.CallExpr) { clo := n.X.(*ir.ClosureExpr) clofn := clo.Func // 如果闭包足够简单,不进行处理,留给 walkClosure 处理。 if ir.IsTrivialClosure(clo) { return // leave for walkClosure to handle } // 将闭包中的每个变量转换为函数的参数。对于引用捕获的变量,创建相应的指针参数。 var params []*types.Field var decls []*ir.Name for _, v := range clofn.ClosureVars { if !v.Byval() { // 对于引用捕获的变量,创建相应的指针参数。 addr := ir.NewNameAt(clofn.Pos(), typecheck.Lookup("&"+v.Sym().Name)) addr.Curfn = clofn addr.SetType(types.NewPtr(v.Type())) v.Heapaddr = addr v = addr } v.Class = ir.PPARAM decls = append(decls, v) fld := types.NewField(src.NoXPos, v.Sym(), v.Type()) fld.Nname = v params = append(params, fld) } // 创建一个新的函数类型,将捕获的变量作为前置参数,并更新函数的声明。 f := clofn.Nname typ := f.Type() typ = types.NewSignature(nil, append(params, typ.Params().FieldSlice()...), typ.Results().FieldSlice()) f.SetType(typ) clofn.Dcl = append(decls, clofn.Dcl...) // 将原始的闭包调用重写为对新函数的调用,并将捕获的变量作为实际参数传递。 n.X = f n.Args.Prepend(closureArgs(clo)...) // 调整调用表达式的类型,以反映参数和返回值类型的变化。 if typ.NumResults() == 1 { n.SetType(typ.Results().Field(0).Type) } else { n.SetType(typ.Results()) } // 虽然不再是传统意义上的闭包,但为了确保函数被编译,将其添加到待编译列表中。 ir.CurFunc.Closures = append(ir.CurFunc.Closures, clofn) }
这段代码是 Go 编译器中的 directClosureCall
编译器具体的处理逻辑在 walkClosure()
func walkClosure(clo *ir.ClosureExpr, init *ir.Nodes) ir.Node { clofn := clo.Func // 如果没有闭包变量,闭包被视为全局函数,直接返回函数名。 if ir.IsTrivialClosure(clo) { if base.Debug.Closure > 0 { base.WarnfAt(clo.Pos(), "closure converted to global") } return clofn.Nname } // 对于复杂闭包,设置需要上下文标记,并进行运行时检查。 ir.ClosureDebugRuntimeCheck(clo) clofn.SetNeedctxt(true) // 确保闭包函数不会被重复添加到编译队列。 if !clofn.Walked() { clofn.SetWalked(true) ir.CurFunc.Closures = append(ir.CurFunc.Closures, clofn) } // 构造一个复合字面量表达式来表示闭包实例。 typ := typecheck.ClosureType(clo) // 将闭包函数和捕获的变量作为字段添加到闭包结构中。 clos := ir.NewCompLitExpr(base.Pos, ir.OCOMPLIT, typ, nil) clos.SetEsc(clo.Esc()) clos.List = append([]ir.Node{ir.NewUnaryExpr(base.Pos, ir.OCFUNC, clofn.Nname)}, closureArgs(clo)...) for i, value := range clos.List { clos.List[i] = ir.NewStructKeyExpr(base.Pos, typ.Field(i), value) } // 创建闭包结构的地址,并进行类型转换以符合闭包类型。 addr := typecheck.NodAddr(clos) addr.SetEsc(clo.Esc()) cfn := typecheck.ConvNop(addr, clo.Type()) // 如果存在预分配的闭包对象,进行相关处理。 if x := clo.Prealloc; x != nil { if !types.Identical(typ, x.Type()) { panic("closure type does not match order's assigned type") } addr.Prealloc = x clo.Prealloc = nil } // 对最终构建的闭包表达式进行进一步处理。 return walkExpr(cfn, init) }
闭包重写后,会进入 walk 阶段,如官方 文档所说:这是对 IR 表示的最后一次遍历,它有两个目的:
函数针对不同类型的 range
func walkRange(nrange *ir.RangeStmt) ir.Node { // ... 省略代码 ... // 遍历 range 语句的不同情况 switch t.Kind() { default: base.Fatalf("walkRange") // 处理数组、切片、指针(指向数组)的情况 case types.TARRAY, types.TSLICE, types.TPTR: // ... 省略代码 ... // 处理映射的情况 case types.TMAP: // ... 省略代码 ... // 处理通道的情况 case types.TCHAN: // ... 省略代码 ... // 处理字符串的情况 case types.TSTRING: // ... 省略代码 ... } // ... 省略代码 ... // 构建并返回新的 for 语句 nfor.PtrInit().Append(init...) typecheck.Stmts(nfor.Cond.Init()) nfor.Cond = typecheck.Expr(nfor.Cond) nfor.Cond = typecheck.DefaultLit(nfor.Cond, nil) nfor.Post = typecheck.Stmt(nfor.Post) typecheck.Stmts(body) nfor.Body.Append(body...) nfor.Body.Append(nrange.Body...) var n ir.Node = nfor n = walkStmt(n) base.Pos = lno return n }
这部分代码在 walk,对其他优化感兴趣的读者可以阅读这部分的代码。
遍历函数(Walk)阶段后,编译器会将 AST 转换为下一个重要的中间表示形态,称为 SSA,其全称为 Static Single Assignment,静态单赋值。SSA 被大多数现代的编译器(包括 GCC 和 LLVM)使用,用于编译过程中的优化和代码生成。其核心特点和用途如下:
官方对 SSA 生成阶段进行了详细的描述:Introduction to the Go compiler’s SSA backend
Go 提供了强有力的工具查看 SSA 初始及其后续优化阶段生成的代码片段,可以通过编译时指定 GOSSAFUNC={pkg.func}
package main
var d uint8
func main() {
var a uint8 = 1
a = 2
if true {
a = 3
d = a
我们可以自行简单分析一下,这段代码前面 a
的所有操作其实都是无意义的,整段代码其实就在说 d = 3
在 linux 或者 mac 上执行:
GOSSAFUNC=main.main go build main.go
在 Windows 上执行:
go build .\main.go
dumped SSA to .\ssa.html
通过浏览器打开生成的 ssa.html
文件,我们可以看到 SSA 的初始阶段、优化阶段和最终阶段的代码片段。
可以看到这一行:00003 (**+11**) MOVB $3, main.d(SB)
,那其实就是直接 d = 3
在 SSA 阶段,编译器先执行与特定指令集无关的优化,再执行与特定指令集有关的优化,并最终生成与特定指令集有关的指令和寄存器分配方式。如 ssa/_gen/genericOps.go 中包含了与特定指令集无关的 Op 操作,在 ssa/_gen/AMD64Ops.go 中包含了和 AMD64 指令集相关的 Op 操作。
模块的汇编器处理,转换为机器代码,并输出最终的目标文件。Go 为我们了解 Go 语言程序的编译和链接过程提供了一个非常好用的命令:
go build -n
其中 -n
表示只输出编译过程中将要执行的 shell 命令,但不执行。
package main
import (
func main() {
i := cast.ToInt("1")
这个程序引入了标准库 fmt
以及第三方库 github.com/spf13/cast
go build -n -o main
mkdir -p $WORK/b001/
cat >$WORK/b001/importcfg.link << 'EOF' # internal
packagefile go-compilation=/Users/wangjiahan/Library/Caches/go-build/48/48745ff5ef7f8945297b5894ec377f47e246d94739e0b8f00e86b6d58879e71d-d
packagefile fmt=/Users/wangjiahan/Library/Caches/go-build/10/10ab74ff0df27a2f4bdbe7651290f13ad466f3df63e11241e07ccd21c169b206-d
packagefile github.com/spf13/cast=/Users/wangjiahan/Library/Caches/go-build/77/77eed0b7028cfc4c90d78d6670325d982325399573dff9d7f82ffbf76e4559e8-d
packagefile net/url=/Users/wangjiahan/Library/Caches/go-build/72/72d0ef9b8f99a52bf1de760bb2f630998d6bb66a3d2a3fa66bd66f4efddfbc71-d
modinfo "0w\xaf\f\x92t\b\x02A\xe1\xc1\a\xe6\xd6\x18\xe6path\tgo-compilation\nmod\tgo-compilation\t(devel)\t\ndep\tgithub.com/spf13/cast\tv1.6.0\th1:GEiTHELF+vaR5dhz3VqZfFSzZjYbgeKDpBxQVS4GYJ0=\nbuild\t-buildmode=exe\nbuild\t-compiler=gc\nbuild\tCGO_ENABLED=1\nbuild\tCGO_CFLAGS=\nbuild\tCGO_CPPFLAGS=\nbuild\tCGO_CXXFLAGS=\nbuild\tCGO_LDFLAGS=\nbuild\tGOARCH=arm64\nbuild\tGOOS=darwin\n\xf92C1\x86\x18 r\x00\x82B\x10A\x16\xd8\xf2"
mkdir -p $WORK/b001/exe/
cd .
/opt/homebrew/opt/go/libexec/pkg/tool/darwin_arm64/link -o $WORK/b001/exe/a.out -importcfg $WORK/b001/importcfg.link -buildmode=pie -buildid=FDJiS-4glijTlqBbjVbe/UWsngURatTblImv3DE6-/OjO-hZGekrr-XpHFs_zA/FDJiS-4glijTlqBbjVbe -extld=cc /Users/wangjiahan/Library/Caches/go-build/48/48745ff5ef7f8945297b5894ec377f47e246d94739e0b8f00e86b6d58879e71d-d
/opt/homebrew/opt/go/libexec/pkg/tool/darwin_arm64/buildid -w $WORK/b001/exe/a.out # internal
mv $WORK/b001/exe/a.out main
经过分析,上述过程可以分为以下 8 个步骤:
mkdir -p $WORK/b001/
创建一个临时工作目录,用于存放编译过程中的临时文件。cat >$WORK/b001/importcfg.link << 'EOF'
命令开始创建一个名为 importcfg.link
标志着 importcfg.link
文件内容的结束。mkdir -p $WORK/b001/exe/
创建一个目录,用于存放最终的可执行文件。/opt/homebrew/opt/go/libexec/pkg/tool/darwin_arm64/link -o $WORK/b001/exe/a.out ...
这一步是编译链接的核心,它使用Go的链接工具,根据之前生成的 importcfg.link
文件,将代码编译成可执行文件。/opt/homebrew/opt/go/libexec/pkg/tool/darwin_arm64/buildid -w $WORK/b001/exe/a.out
这一步更新了可执行文件的构建ID。mv $WORK/b001/exe/a.out main
将编译好的可执行文件移动到当前目录,并重命名为 main
以上便是 Go 语言在 1.21.0 这个版本下编译过程的整个过程,笔者会在阅读完《用 Go 语言自制解释器》和《用 Go 语言自制编译器》这两本书后,若有对编译原理有更深入的体会和感悟,再回过来对本文的内容进行勘误和进一步提炼。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。