赞
踩
结构体是一些值的集合,结构的每个成员可以是不同的类型。
例如描述书是比较复杂的,包括书名、作者、出版社、定价、书号等。
我们可以创建一个书的类型,用来描述书,存储书的各项数据。将这若干项数据集合起来就是一个结构体
注:在声明结构体类型时,最后的分号不能漏掉
不完全声明
对匿名结构体类型进行探讨:
- struct//匿名结构体类型
- {
- char c;
- int i;
- char ch;
- double d;
- }n;
- struct
- {
- char c;
- int i;
- char ch;
- double d;
- }*p;
- int main()
- {
- p = &n; //error
- return 0;
- }
以上两个匿名结构体类型虽然里面的成员是完全相同的,但是编译器会把上面的两个声明当成完全不同的两个类型。所以是非法的。
注:匿名结构体只能使用一次,不能再用于创建结构体变量。
创建一个情景:我们创建一个存储图书馆各项数据的结构体类型,其中包括图书、内饰等等。而图书中又存储着有关图书的各项数据,这时就可以用到结构的自引用了。例如:
- struct book //图书
- {
- char type[10];
- char name[20];
- int price;
- char number[30];
- };
- struct upholstery //内饰
- {
- char WallColor[10];
- char CeilingMolding[30];
- int LampSwitch;
- };
- struct library
- {
- struct book b;
- struct upholstery u;
- double d;
- };
对结构自引用进行探讨
- struct Node
- {
- int n;
- struct Node n;
- };
当我们用struct Node来创建变量时,会发现这个变量的大小是无法计算的,进入了一个死递归的状态。
因此,这种写法是非法的。
正确的写法
- struct Node
- {
- int n;
- struct Node * next;
- };
不可以包含同类型的变量,可以包含同类型的指针变量。
与链表有关,在数据结构中会学到。链表的结点包罗两个部分:一个是存储数据元素的数据域,另一个是存储下一个结点地址的指针域。
另一种错误写法,将匿名结构体与自引用结合起来
- struct
- {
- int n;
- struct* next;
-
- };
很显然,这种写法是非法的。那么此时想尝试用typedef修改一下,可不可行呢?
- typedef struct
- {
- int n;
- Node* next;
-
- }Node;
来将这段代码捋一捋:将匿名结构体自定义为Node,那么先要让匿名结构体定义。而匿名结构体定义时要建立指针变量Node* next之后才算完成;但此时自定义还没有把struct定义为Node,故而以Node为类型的next变量不能成功建立。从而我们得知这段代码也是错误的,正确写法应该先自定义完成再定义结构体:
- typedef struct Node
- {
- int n;
- Node* next;
-
- }Node;
- struct A
- {
- int i;
- char c;
- }a;
- struct B
- {
- int n;
- char e;
- struct A a;
- }b;
- int main()
- {
- struct A a = { 32,'a' };//直接初始化
- printf("%d\n%c\n", a.i, a.c);
- b.n = 64;
- b.e = 'b';
- //利用操作符“.”初始化
- b.a.i = 128;
- b.a.c = 'c';
- //结构自引用(结构嵌套)的初始化
- printf("%d %c %d %c", b.n, b.e, b.a.i,b.a.c);
- return 0;
- }
利用操作符“->”进行初始化
- struct book
- {
- int price;
- char name[20];
- }b1,*p;
- int main()
- {
- p = &b1;
- p->price = 64;
- printf("%d\n", p->price);
- return 0;
- }
深入讨论一个问题:计算结构体的大小
- struct S1
- {
- char c; //1字节
- int i; //4字节
- char c2;//1字节
- };
- int main()
- {
- struct S1 s1 = { 0 };
- printf("%d\n", sizeof(s1));
- return 0;
- }
结果显示为12,这涉及到了结构体内存对齐的知识点。我们先了解结构体内存对齐的规则
1.第一个成员在与结构体变量偏移量为0的地址处。
2.其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
3.结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4.如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
要更好地理解这个对齐规则,我们要先简单了解一些概念。
对齐数= 编译器默认的一个对齐数与该成员大小的 较小值。
VS中默认的对齐数的值为8,;而Linux没有默认对齐数的概念。
这个时候我们拿起刚刚那道题,用对齐规则来解决。
- struct S2
- {
- char c;
- int i;
- double d;
- };
- struct S3
- {
- double d;
- char c;
- int i;
- };
- int main()
- {
- struct S2 s2 = {0};
- struct S3 s3 = {0};
- }
试着算算s2和s3的大小,答案在后文公布。
- struct S4
- {
- char c1;
- struct S3 s3;
- double d;
- };
- int main()
- {
- struct S4 s4 = { 0 };
- printf("s4 = %d\n", sizeof(s4));
- return 0;
- }
练习答案
嵌套结构体计算大小:
1.平台原因(移植原因)
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2.性能原因
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次访问;而对齐的内存访问仅需要一次访问。
对“访问未对齐的内存,处理器需要作两次访问;而对齐的内存访问仅需要一次访问。”做解释:
总的来说
结构体的内存对齐是拿空间来换取时间的做法。
在设计结构体的时候,我们既要满足对齐,又要节省空间。
即,让占用空间小的成员尽量集中在一起
例如:
- struct S1
- {
- char c1;
- int n;
- char c2;
- }s1;
- struct S2
- {
- char c1;
- char c2;
- int n;
- }s2;
- int main()
- {
- printf("s1 = %u\n", sizeof(s1));
- printf("s2 = %u\n", sizeof(s2));
- return 0;
- }
使用#pragma这个预处理指令,可以改变默认对齐数。
具体为:
- #include <stdio.h>
- #pragma pack(2) //修改默认对齐数为2
- struct S1
- {
- char c1;
- int n;
- char c2;
- }s1;
- #pragma pack() //取消设置的默认对齐数,还原为8
- struct S2
- {
- char c1;
- int n;
- char c2;
- }s2;
- int main()
- {
- printf("s1 = %u\n", sizeof(s1));//默认对齐数为2时的大小
- printf("s1 = %u\n", sizeof(s1));//默认对齐数为8时的大小
- return 0;
- }
变量 | 占用大小 | 默认对齐数 | 对齐数 |
c1 | 1 | 8 | 1 |
n | 4 | 8 | 4 |
c2 | 1 | 8 | 1 |
变量 | 占用大小 | 默认对齐数 | 对齐数 |
c1 | 1 | 2 | 1 |
n | 4 | 2 | 2 |
c2 | 1 | 2 | 1 |
结论
结构在对齐方式不合适的时候,我们可以自己更改默认对齐数。
试着对比下面两种传参方式
- #include <stdio.h>
- struct S
- {
- int data[1000];
- int num;
- };
- struct S s = { {1,2,3,4},1000 };
-
- //使用结构体传参
- void print1(struct S s)
- {
- printf("%d\n", s.num);
- }
-
- //使用结构体地址传参
- void print2(struct S* ps)
- {
- printf("%d\n", ps->num);
- }
- int main()
- {
- print1(s);//传结构体
- print2(&s);//传地址
- return 0;
- }
我们应该首选print2函数。
原因:
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能的下降。
而且,直接传结构体会有一些限制。例如,并不能改变结构体内部成员的值,而传地址既节省系统开销,提高性能,又不会有太多限制。
- #include <stdio.h>
- struct S
- {
- int data[1000];
- int num;
- };
- struct S s1 = { {1,2,3,4},1000 };
- struct S s2 = { {1,2,3,4},1000 };
-
- //结构体传参 修改成员变量的值
- void change1(struct S s1)
- {
- s1.num = 2000;
- }
-
- //结构体地址传参 修改成员变量的值
- void change2(struct S* ps)
- {
- ps->num = 2000;
- }
- int main()
- {
- change1(s1);
- change2(&s2);
- printf("s1.num = %d\n", s1.num);
- printf("s2.num = %d\n", s2.num);
- return 0;
- }
而当你使用结构体地址传参且不需要改变其成员变量的值时,可以加上const修饰。
学习自:比特鹏哥C语言课程
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。