面试题：Rust原生类型性能优化之内存布局

1. 原生类型在内存中的布局

u32：
- 在Rust中，u32是无符号32位整数。它在内存中占用4个字节（32比特）。其内存布局是简单的32位连续存储，从低位到高位依次排列。例如，值5（二进制00000000 00000000 00000000 00000101）在内存中就是按照这个二进制形式连续存储在4个字节的空间内。
f64：
- f64是64位浮点数，遵循IEEE 754标准。它在内存中占用8个字节（64比特）。内存布局分为三部分：1位符号位（s），11位指数位（e）和52位尾数位（m）。例如，对于1.0，其符号位为0，指数位为1023（偏移二进制表示），尾数位为0，在内存中按照这种结构存储为0 01111111111 0000000000000000000000000000000000000000000000000000 。

2. 布局对性能的影响

数据对齐：
- Rust编译器通常会根据目标平台的硬件特性，对原生类型进行数据对齐。例如，在x86 - 64平台上，u32类型的数据会在4字节边界上对齐，f64会在8字节边界上对齐。如果数据没有正确对齐，硬件在读取或写入数据时可能需要进行额外的操作，例如多次内存访问，这会显著降低性能。
- 例如，假设一个未对齐的u32值跨越了两个4字节的内存块，处理器可能需要先读取两个内存块，然后在寄存器中进行移位和合并操作才能获取完整的u32值。
缓存命中率：
- 合理的内存布局可以提高缓存命中率。当数据以连续且对齐的方式存储时，硬件缓存更有可能一次性加载多个相关数据到缓存中。例如，如果一系列u32值连续存储且对齐良好，当访问其中一个u32值时，相邻的u32值也更有可能被加载到缓存中，后续访问这些值时就可以直接从缓存中获取，提高了访问速度。

3. 通过调整内存布局优化性能（结构体字段排列）

基本原则：
- 按大小排列：将较大的字段放在结构体的前面，较小的字段放在后面。例如，如果一个结构体包含f64和u8字段，应将f64字段放在前面。这是因为较大的类型通常需要更严格的对齐要求，将它们放在前面可以减少结构体整体的内存浪费，并且有助于提高缓存命中率。
```
struct MyStruct {
    large_field: f64,
    small_field: u8,
}
```
- 相同类型连续排列：如果结构体中有多个相同类型的字段，将它们放在一起。这样可以利用硬件的缓存预取机制，提高缓存命中率。例如：
```
struct AnotherStruct {
    field1: u32,
    field2: u32,
    field3: u8,
}
```
- 避免不必要的填充：了解不同类型的对齐要求，尽量减少结构体内部的填充字节。例如，u32需要4字节对齐，如果在u32之后紧接着放置一个u8，u8之后可能会有3字节的填充以保证下一个字段的正确对齐。通过合理安排字段顺序可以减少这种填充。
- 使用repr(C)属性：在某些情况下，可以使用repr(C)属性来指定结构体遵循C语言的内存布局规则。这在与C代码交互或者需要精确控制内存布局时很有用。例如：
```
#[repr(C)]
struct CStyleStruct {
    field1: u32,
    field2: u8,
}
```
这样的结构体布局与C语言中的结构体布局相同，有助于跨语言的交互，同时也可以利用C语言编译器对结构体布局的优化策略。

面试题：Rust原生类型性能优化之内存布局

知识考点

面试题答案

1. 原生类型在内存中的布局

2. 布局对性能的影响

3. 通过调整内存布局优化性能（结构体字段排列）