前言
哈喽,大家好,我是
asong
,今天这篇文章的目的主要是解答一位读者的疑问,涉及知识点是反射
和结构体内存布局。我们先看一下读者的问题:
我们通过两个问题来解决他的疑惑:
- 结构体在内存中是如何存储的
- 反射获取结构体成员信息的过程
结构体是如何存储的
结构体是占用一块连续的内存,一个结构体变量的大小是由结构体中的字段决定的,结构体变量的地址等于结构体第一个字段的首地址。示例:
从运行结果我们可以验证了结构体变量u
的存放地址就是字段Name
的首地址。
结构体的内存布局其实就是分配一段连续的内存,具体是在栈上分配还是堆上分配取决于编译器的逃逸分析,结构体在内存分配时还要考虑到内存对齐。
对齐的作用和原因:
CPU
访问内存时,并不是逐个字节访问,而是以字长(word size
)单位访问。比如32
位的CPU
,字长为4
字节,那么CPU
访问内存的单位也是4
字节。这样设计可以减少CPU
访问内存的次数,加大CPU
访问内存的吞吐量。假设我们需要读取8个字节的数据,一次读取4
个字节那么就只需读取2
次就可以。内存对齐对实现变量的原子性操作也是有好处的,每次内存访问都是原子的,如果变量的大小不超过字长,那么内存对齐后,对该变量的访问就是原子的,这个特性在并发场景下至关重要。
C
语言的内存对齐规则与Go
语言一样,所以C
语言的对齐规则对Go
同样适用:
- 对于结构的各个成员,第一个成员位于偏移为0的位置,结构体第一个成员的偏移量(offset)为0,以后每个成员相对于结构体首地址的 offset 都是该成员大小与有效对齐值中较小那个的整数倍,如有需要编译器会在成员之间加上填充字节。
- 除了结构成员需要对齐,结构本身也需要对齐,结构的长度必须是编译器默认的对齐长度和成员中最长类型中最小的数据大小的倍数对齐。
根据这个规则我们来分析一下上面示例的结构体User
,这里我使用的mac
,所以是64
位CPU
,编译器默认对齐参数是8
,String
、uint64
、bool
的对齐值分别是8
、8
、1
,根据第一条规则分析:
- 第一个字段类型是
string
,对齐值是8
,大小为16
,所以放在内存布局中的第一位。 - 第二个字段类型是
uin64
,对齐值是8
,大小为8
,所以他的内存偏移值必须是8
的倍数,因为第一个字段Name
占有16位,所以直接从16
开始不要补位。 - 第三个字段类型是
bool
,对齐值是1
,大小为1
,所以他的内存偏移值必须是1
的倍数,因为User
的前两个字段已经排到了24
位,所以下一个偏移量正好是24
。
接下来我们在分析第二个规则:
- 根据第一条内存对齐规则分析后,内存长度已经为
25
字节了,我们开始使用第2
条规则进行对齐,默认对齐值是8
,字段中最大类型的长度是16
,所以可以得出该结构体的对齐值是8
,我们目前的内存长度是25
,不是8
的倍数,所以需要补全,所以最终的结果是32
,补了7
位,由编译器进行填充,一般为0
值,也称之为空洞。
注意:这里对内存对齐没有说的很细,想要更深了解内存对齐可以看我之前的一篇文章:Go看源码必会知识之unsafe包
Go语言反射获取结构体成员信息
Go语言提供了一种机制在运行时更新和检查变量的值、调用变量的方法和变量的内在操作,但是在编译时并不知道这些变量的具体类型,这种机制被称为反射。Go语言提供了 reflect 包来访问程序的反射信息。
我们可以通过调用reflect.TypeOf()
获得反射对象信息,如果他的类型是结构体,接着可以通过反射值对象reflect.Type
的NumField
和Field
方法获取结构体成员的详细信息,先看一个例子:
接下来我们就一起来看一看Go
语言是如何通过反射来获取结构体成员信息的。
首先我们来看一看reflect.TypeOf()
方法是如何获取到类型的:
我们知道在Go
语言中任何类型都可以转成interface{}
类型,当向接口变量赋于一个实体类型的时候,接口会存储实体的类型信息,反射就是通过接口的类型信息实现的。
一个空接口结构如下:
_type
字段,表示空接口所承载的具体的实体类型。data
描述了具体的值,Go 语言里所有的类型都 实现了
空接口。
所以在TypeOf
方法中,我们就是通过读取_type
字段获取到类型。
现在我们已经知道他是怎么获取到具体的类型了,接下来我们就来看一看NumField()
方法是怎么获取到字段的。
因为只有struct
类型才可以调用,所以在NumFiled()
方法中做了类型检查,如果不是struct
类型则直接发生panic
,然后会rtype
类型强制转换成structType
,最后返回结构体成员字段的数量。
调用Field()
方法会根据索引返回对应的结构体字段的信息,当值不是结构体或索引超界时发生panic
。
返回StructField
结构如下:
到这里整个反射获取结构体成员信息的过程应该很明朗了吧~。
**小结:**因为Go
语言里所有的类型都 实现了
空接口,所以可以根据这个特性获取到数据类型以及存放数据的地址,对于结构体类型,将其转换为structType
类型,最后转换成StructField
结构获取所有结构体信息。
总结
本文没想详细展开讲解Go
语言反射的原理和过程,只是简单介绍了一下反射获取到结构体成员信息的过程,更多关于反射知识的讲解会在后面持续更新,敬请期待~。