面试题：深入分析Java Collections排序算法在不同场景下的性能表现

小规模数据
- 数据基本有序：Collections.sort(List) 底层采用的是 TimSort 算法，对于基本有序的数据，TimSort 能利用其有序性，时间复杂度接近 $O(n)$，空间复杂度为 $O(n)$（主要用于临时数组等）。因为它会识别并利用已有有序子序列，减少整体排序工作量。
- 数据完全无序：时间复杂度为 $O(n log n)$，这是 TimSort 算法的平均时间复杂度。空间复杂度同样为 $O(n)$，因为需要额外空间来进行排序操作。
大规模数据
- 数据基本有序：依然采用 TimSort，由于数据量大，识别和利用有序子序列能显著减少排序工作量，时间复杂度依然接近 $O(n)$，空间复杂度为 $O(n)$。
- 数据完全无序：时间复杂度稳定在 $O(n log n)$，空间复杂度为 $O(n)$。随着数据规模增大，TimSort 整体性能仍能保持较好，不过由于空间需求和实际运行环境等因素，性能可能会受到一定影响。

分治策略：可以将海量数据分成多个小的数据块，分别对每个数据块进行排序，使用 Collections.sort 对每个小块排序。然后利用归并算法将这些已排序的小块合并成一个完整的有序序列。这样能减少内存压力，并且在每个小块排序时 TimSort 能较好发挥作用。空间复杂度在分块排序时每个块为 $O(n_i)$（$n_i$ 为块大小），归并过程为 $O(n)$（$n$ 为总数据量），整体空间复杂度可优化到 $O(n)$ 左右，时间复杂度依然接近 $O(n log n)$。
并行排序：利用Java的并行流（如 List.parallelStream().sorted()），底层会将数据分成多个部分并行排序，然后合并结果。这可以充分利用多核CPU的性能，提升排序速度。空间复杂度和 Collections.sort 类似，时间复杂度理论上由于并行计算会有所降低，在理想情况下接近 $O(\frac{n log n}{k})$（$k$ 为CPU核心数），但实际会因任务划分、合并等开销而有所不同。

知识考点