当前位置:   article > 正文

arm64汇编sp fp寄存器叶子函数非叶子函数的栈平衡_汇编命令 sp和fp

汇编命令 sp和fp

sp 栈顶指针寄存器

这个跟win32的esp一样.始终指向栈顶的地址.编译器可能用sp-偏移量来表示要读写栈的地址

fp 栈底指针寄存器 (x29)

这个跟 win32的ebp一样,用来指向当前函数的栈底.编译器优惠有时候会用 fp+偏移量 来表示要读写栈的地址,

arm64没有push 和 pop操作栈

在arm64汇编中没有win32汇编里的push和pop指令,所以sp只能通过sub和add修改sp的值
往栈里写入数据改成了用str指令往内存中写入数据,把栈空间当做内存空间来处理.
如果要在win32中,push 4次32位数字
win32中的汇编代码push4次到栈中如下

mov eax,1
push eax 
mov eax ,2
push eax 
mov eax ,3
push eax 
mov eax ,4
push eax 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

arm64把1,2,3,4压入到栈中的代码如下:
建立了一个fn1的函数,因为总共要分配4个32位数字,4个4字节,总共16字节
在arm64中每次栈给函数开辟栈空间都是0x10的倍数,也就是16的倍数.比如要申请5x4个字节的空间,那么就要申请0x20的字节数.
所以16字节上来要先让栈顶指针sp减少16字节: sub sp,sp,0x10
下面每次先给数字mov进32位进村器w0,然后再用str 把w0写入到sp指针+偏移量指向的空间,最后在ret之前为了保证sp的值跟调用这个函数之前一样,还要把sp+0x10 add sp,sp,0x10,这样就达到一个栈平衡.如下代码.
下面代码是函数进来以后不会调用新函数,是一个叶子函数,所以栈里面只保存了4个数字,1,2,3.4

.text
.global _fn1
_fn1:
sub sp,sp,0x10
mov w0,0x1
str w0,[sp,#0xc]
mov w0,0x2
str w0,[sp,#0x8]
mov w0,0x3
str w0,[sp,#0x4]
mov w0,0x4
str w0,[sp]
add sp,sp,0x10
ret
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14

开辟的空间是16的倍数

下面是5个int类型,占用20字节

void test1(){
    int a = 3;
    int b = 4;
    int c = 5;
    int d = 6;
    int e = 7;
}

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

编译器生成的汇编代码会把sp-0x20,申请32个字节,而不是申请4x5=20字节

arm64Demo`test1:
->  0x100fea734 <+0>:  sub    sp, sp, #0x20             ; =0x20 
  • 1
  • 2

test1函数里有4个临时变量,4x4=16字节,刚好是16的倍数,所以编译器生成的汇编代码,在栈空间申请了0x10 16个字节

void test1(){
    int a = 3;
    int b = 4;
    int c = 5;
    int d = 6;
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
arm64Demo`test1:
->  0x102e46744 <+0>:  sub    sp, sp, #0x10             ; =0x10 
  • 1
  • 2

叶子函数的栈平衡

像下面这种一个函数里面没有调用任何其他函数的,就是叶子函数.

void test1(){
    int a = 3;
}
  • 1
  • 2
  • 3

下面是叶子函数编译器自动生成的汇编代码,因为用了4字节 a =3,所以让栈顶指针-16的倍数 sub sp,sp,0x10 ,最后 返回之前再把 栈指针加回来 add sp, sp, #0x10 ,这样达到调用test1()之前和之后sp的值都没变

	0x102052764 <+0>:  sub    sp, sp, #0x10             ; =0x10 
    0x102052768 <+4>:  mov    w8, #0x3
    0x10205276c <+8>:  str    w8, [sp, #0xc]
    0x102052770 <+12>: add    sp, sp, #0x10             ; =0x10 
    0x102052774 <+16>: ret    
  • 1
  • 2
  • 3
  • 4
  • 5

非叶子函数的汇编操作栈平衡

非叶子函数意思就是不是末端,而是函数里面还调用了其他函数

void test1(){
    int a = 3;
    test2();
}
void test2(){
    int c = 5;
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

因为test1里面有1个4字节的临时变量,需要4字节,按照申请申请栈空间必须是16的倍数,所以要让栈顶指针sp 减去 0x10的,但是下面汇编中sp-0x20是申请了32个字节
原因是有4字节用来保存1个变量,另外16字节用来保存fp和lr 这2个8位的寄存器,当前函数的lr寄存器(x30),lr作用是保存调用当前函数的地址,就是ret的返回地址 和fp寄存器(x29),fp作用是栈底寄存器,保存栈的最下面的位置,作用是方便栈的计算.因为有时候不光使用sp+偏移量读取内存,还用fp+偏移量读取内存
因为下面代码中调用了test2()函数, bl 0x104c7e778 ,bl指令是会改变lr的,所以要把lp给保存起来,保存fp

stp x29, x30, [sp, #0x10] //作用是把x29(fp) 和 x30(lr)这2个寄存器保存起来
在bl 的下一句: ldp x29, x30, [sp, #0x10] 是还原 fp和lr.这样就还原好了之前寄存器的值.
最后的ad sp,sp ,#0x20就是还原sp的值,让调用test1之前的sp跟ret返回之后一样

    0x104c7e754 <+0>:  sub    sp, sp, #0x20             ; =0x20 
    0x104c7e758 <+4>:  stp    x29, x30, [sp, #0x10]
    0x104c7e75c <+8>:  add    x29, sp, #0x10            ; =0x10 
    0x104c7e760 <+12>: mov    w8, #0x3stp    x29, x30, [sp, #0x10
    0x104c7e764 <+16>: stur   w8, [x29, #-0x4]
    0x104c7e768 <+20>: bl     0x104c7e778               ; test2 at ViewController.m:32
    0x104c7e76c <+24>: ldp    x29, x30, [sp, #0x10]
    0x104c7e770 <+28>: add    sp, sp, #0x20             ; =0x20 
    0x104c7e774 <+32>: ret ```
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/531587
推荐阅读
相关标签
  

闽ICP备14008679号