面试题：Rust原生类型的内存布局与优化

u32 是一个无符号32位整数，在内存中占用4个字节。它在内存中以连续的32位存储，具体存储顺序遵循目标机器的字节序（大端或小端）。在Rust中，像 u32 这样的基本类型通常在栈上分配，除非它们是较大数据结构（如结构体或数组）的一部分，此时它们遵循包含它们的数据结构的分配规则。

Vec<T> 是一个动态大小的数组，它在内存中有三部分：指针、长度和容量。指针指向堆上分配的存储 T 类型元素的内存块；长度表示当前数组中实际元素的数量；容量表示当前堆内存块能够容纳的最大元素数量。
当创建一个 Vec<T> 时，它先在栈上分配固定大小的头部（包含指针、长度和容量，通常共12字节，假设指针和 usize 都是64位），然后根据需要在堆上分配存储元素的内存。随着元素的添加，如果当前容量不足，会重新分配堆内存，将旧数据复制到新的内存块，并更新栈上头部的指针和容量。

对于 struct Complex { real: f64; imag: f64; }，它在内存中是 real 和 imag 两个 f64 类型字段的连续存储，总共占用16字节（每个 f64 占8字节）。默认情况下，Rust编译器会对结构体进行内存对齐优化，确保每个字段的地址是其大小的倍数，以提高内存访问效率。例如在64位系统上，f64 类型要求8字节对齐，所以 Complex 结构体实例的起始地址也会是8字节对齐的。如果该结构体在栈上创建，它的所有字段都在栈上；如果它是堆上分配的结构体的一部分，其字段也随着结构体在堆上。

栈分配：对于像 u32 这样的简单原生类型以及一些符合特定条件的结构体（例如没有动态大小字段且大小在编译期已知的小结构体），Rust编译器倾向于在栈上分配它们。栈分配速度快，因为栈空间的管理简单，函数调用和返回时栈帧的创建和销毁效率高。
堆分配：Vec<T> 以及任何包含动态大小类型（如 Box<T>、Rc<T> 等）的结构体通常会在堆上分配部分或全部数据。堆分配更灵活，适合动态大小的数据，但分配和释放内存的开销较大。编译器会优化堆内存的使用，例如在 Vec<T> 中，通过容量机制减少频繁的重新分配。

控制内存布局：通过在结构体定义前添加 #[repr(C)] 属性，可以强制结构体使用C语言的内存布局规则。这意味着结构体字段的布局遵循C语言的规则，即按照定义顺序连续存储，并且对齐方式与C语言一致。例如，在C语言中 f64 类型通常也是8字节对齐，所以 #[repr(C)] struct Complex { real: f64; imag: f64; } 的内存布局与普通Rust结构体在这个例子中相似，但在更复杂的结构体中可能有显著差异，尤其是涉及不同对齐要求的字段时。
与C语言交互的作用：在与C语言代码交互时，#[repr(C)] 非常重要。C语言有自己特定的内存布局和调用约定，Rust代码要与C代码进行函数调用或共享数据结构，结构体的内存布局必须一致。使用 #[repr(C)] 可以确保Rust结构体在内存中的表示与C语言结构体相同，从而实现安全有效的交互，例如在FFI（Foreign Function Interface）中传递结构体参数或返回结构体。

知识考点