面试题：C语言一维数组指针优化之底层探究

优化原理

CPU缓存：
- CPU缓存是位于CPU和主内存之间的高速存储区域。当CPU需要访问内存数据时，会先在缓存中查找。如果数据在缓存中（缓存命中），则可以快速获取数据；如果不在（缓存未命中），则需要从主内存中读取数据并将其加载到缓存中。
- 对于一维数组，由于其在内存中是连续存储的，利用缓存的空间局部性原理可以优化访问效率。空间局部性是指如果一个内存位置被访问，那么与它相邻的位置很可能在不久的将来也会被访问。所以，按顺序访问一维数组元素，能提高缓存命中率，从而提升访问效率。
内存对齐：
- 内存对齐是指数据在内存中的存储地址是其自身大小的整数倍。不同的CPU架构对内存对齐有不同的要求。如果数据未正确对齐，CPU可能需要进行多次内存访问来获取一个数据，从而降低访问效率。
- 在C语言中，结构体和数组中的元素如果能正确内存对齐，可以提高内存访问效率。对于一维数组，如果数组元素类型是基本数据类型（如int、float等），编译器通常会自动进行内存对齐。但如果数组元素是自定义结构体类型，需要注意结构体内部成员的排列顺序以保证正确的内存对齐。

示例代码

#include <stdio.h>
#include <stdlib.h>
#include <time.h>

// 定义一个简单的结构体
typedef struct {
    char a;
    int b;
    short c;
} UnalignedStruct;

// 重新排列结构体成员以实现更好的内存对齐
typedef struct {
    int b;
    short c;
    char a;
} AlignedStruct;

// 测试函数，用于测试未优化的数组访问
void testUnaligned() {
    UnalignedStruct *arr = (UnalignedStruct *)malloc(100000 * sizeof(UnalignedStruct));
    if (arr == NULL) {
        perror("malloc");
        return;
    }
    clock_t start = clock();
    for (int i = 0; i < 100000; i++) {
        arr[i].b = i;
    }
    clock_t end = clock();
    double time_spent = (double)(end - start) / CLOCKS_PER_SEC;
    printf("Unaligned access time: %f seconds\n", time_spent);
    free(arr);
}

// 测试函数，用于测试优化后的数组访问
void testAligned() {
    AlignedStruct *arr = (AlignedStruct *)malloc(100000 * sizeof(AlignedStruct));
    if (arr == NULL) {
        perror("malloc");
        return;
    }
    clock_t start = clock();
    for (int i = 0; i < 100000; i++) {
        arr[i].b = i;
    }
    clock_t end = clock();
    double time_spent = (double)(end - start) / CLOCKS_PER_SEC;
    printf("Aligned access time: %f seconds\n", time_spent);
    free(arr);
}

int main() {
    testUnaligned();
    testAligned();
    return 0;
}

在上述代码中：

UnalignedStruct结构体成员的排列顺序可能导致内存未对齐。
AlignedStruct结构体通过重新排列成员顺序，使内存对齐更优。
testUnaligned函数和testAligned函数分别测试未优化和优化后的数组访问性能，通过clock函数记录开始和结束时间，计算访问数组所花费的时间，从而对比性能差异。实际使用中，可以使用更专业的性能测试工具如perf等来获得更准确的性能数据。

性能对比分析

通常情况下，testAligned函数中的数组访问由于内存对齐更优，会比testUnaligned函数中的数组访问更快。这是因为优化后的内存对齐减少了CPU为获取数据所需的内存访问次数，同时按顺序访问数组元素也利用了CPU缓存的空间局部性原理，提高了缓存命中率，从而提升了整体的访问效率。在不同的CPU架构和编译器环境下，性能提升的幅度可能有所不同。

面试题：C语言一维数组指针优化之底层探究

知识考点

面试题答案

优化原理

示例代码

性能对比分析