面试题：Rust向量迭代性能深度剖析

闭包捕获变量方式对性能的影响

for_each：
- 闭包捕获方式：for_each接受一个闭包，该闭包通常会按值或按引用捕获外部变量。如果按值捕获，会将变量的所有权转移到闭包内。例如：
```
let data = vec![1, 2, 3];
let num = 5;
data.iter().for_each(|&x| {
    println!("{} + {} = {}", x, num, x + num);
});
```
这里num是按引用捕获的，因为闭包内只是读取它的值。如果闭包内需要修改num，则需要按可变引用捕获。
- 性能影响：按值捕获会导致变量所有权转移，如果变量较大，可能会产生性能开销，因为涉及内存复制。按引用捕获避免了所有权转移和内存复制，性能通常更好，但需要注意引用的生命周期问题，确保引用在闭包执行期间保持有效。
map：
- 闭包捕获方式：map接受的闭包同样可以按值或按引用捕获外部变量。例如：
```
let data = vec![1, 2, 3];
let num = 5;
let new_data: Vec<i32> = data.iter().map(|&x| x + num).collect();
```
这里num也是按引用捕获。
- 性能影响：map会生成一个新的迭代器，其闭包返回值会被收集到一个新的集合中。如果闭包按值捕获大变量，不仅会有所有权转移和可能的内存复制开销，还会影响新集合生成的性能，因为闭包每次执行都带着这个大变量。按引用捕获可以减少这种开销。
filter：
- 闭包捕获方式：filter接受的闭包用于决定元素是否保留，同样存在按值或按引用捕获外部变量的情况。例如：
```
let data = vec![1, 2, 3];
let num = 5;
let filtered_data: Vec<i32> = data.iter().filter(|&x| x < num).collect();
```
这里num按引用捕获。
- 性能影响：filter闭包按值捕获大变量会带来所有权转移和内存复制开销，影响过滤操作的性能。按引用捕获可以避免这些问题，提高过滤效率。

不同编译器优化设置下的影响

-O：
- 编译器优化原理：启用基本优化，包括死代码消除、公共子表达式消除等。
- 对闭包捕获影响：对于按值捕获大变量的情况，编译器可能会通过一些优化手段减少内存复制。例如，如果闭包只在局部使用且变量不再被外部使用，编译器可能会优化掉不必要的复制。对于按引用捕获，优化可能会确保引用的生命周期检查更高效，减少运行时的开销。
-O2：
- 编译器优化原理：在-O的基础上，增加更多的优化，如循环展开、指令调度等。
- 对闭包捕获影响：对于按值捕获大变量，循环展开可能会减少由于所有权转移和内存复制带来的性能损失，因为循环内的操作更加紧凑。按引用捕获时，指令调度可能会使引用的读取和使用更加高效，进一步提升性能。
-O3：
- 编译器优化原理：在-O2的基础上，进行更激进的优化，如函数内联、全程序优化等。
- 对闭包捕获影响：对于按值捕获大变量，如果闭包函数被内联，编译器可以对整个内联后的代码进行优化，可能会更好地处理所有权转移和内存复制问题。按引用捕获时，全程序优化可以确保引用在整个程序中的使用更加高效，减少潜在的性能瓶颈。

测试代码

use std::time::Instant;

fn main() {
    let large_vec: Vec<i32> = (0..1000000).collect();
    let large_num = 1000;

    // 测试 for_each
    let start = Instant::now();
    large_vec.iter().for_each(|&x| {
        let _ = x + large_num;
    });
    let for_each_time = start.elapsed();

    // 测试 map
    let start = Instant::now();
    let _ = large_vec.iter().map(|&x| x + large_num).collect::<Vec<_>>();
    let map_time = start.elapsed();

    // 测试 filter
    let start = Instant::now();
    let _ = large_vec.iter().filter(|&x| x < large_num).collect::<Vec<_>>();
    let filter_time = start.elapsed();

    println!("for_each time: {:?}", for_each_time);
    println!("map time: {:?}", map_time);
    println!("filter time: {:?}", filter_time);
}

实验结果说明

无优化（默认）：
- for_each：按引用捕获large_num，性能较好，但由于没有优化，循环中的简单加法操作可能存在一些基础开销。
- map：生成新的向量，按引用捕获large_num，除了循环开销，还存在新向量收集的开销。
- filter：按引用捕获large_num，过滤操作本身有一定开销，特别是在大量数据下。
-O：
- for_each：死代码消除等优化可能会减少一些不必要的操作，性能有所提升。
- map：公共子表达式消除等优化可能会减少向量生成过程中的重复计算，性能提升。
- filter：死代码消除可能会优化掉不必要的过滤判断，性能提升。
-O2：
- for_each：循环展开使循环执行更紧凑，性能进一步提升。
- map：循环展开和指令调度使向量生成更高效，性能提升明显。
- filter：循环展开优化过滤操作，性能显著提升。
-O3：
- for_each：函数内联和全程序优化可能会进一步优化循环内的操作，性能达到较好水平。
- map：函数内联和全程序优化使向量生成过程更加高效，性能最优。
- filter：函数内联和全程序优化使过滤操作更高效，性能最优。

总体来说，随着编译器优化级别提升，不同迭代器方法在闭包捕获变量时的性能都有不同程度的提升，按引用捕获变量在各种优化级别下通常性能更好，因为避免了所有权转移和内存复制带来的开销。

星途面试题库

面试题：Rust向量迭代性能深度剖析

知识考点

面试题答案

闭包捕获变量方式对性能的影响

不同编译器优化设置下的影响

测试代码

实验结果说明