【Python】计数排序

1.1 决策树模型:比较排序的Ω(n log n)宿命 (The Decision Tree Model: The Ω(n log n) Fate of Comparison Sorts)

为了理解计数排序的革命性,我们必须首先理解它所要颠覆的“旧秩序”的边界在哪里。这个边界,可以通过一种名为**决策树(Decision Tree)**的抽象模型来清晰地描绘。

一个针对特定输入规模n的比较排序算法,其整个执行过程可以被建模为一棵二叉树。

树的节点: 树的每一个内部节点,都代表一次元素之间的比较。例如,一个节点可能是 a[i] < a[j]
树的边: 从一个节点出发的两条边,代表了这次比较的两种可能结果:True(是)或 False(否)。算法根据比较结果,走向下一条路径。
树的叶子节点: 树的每一个叶子节点,都代表一种最终的、完全排序好的元素排列。

一个简单的例子:对3个元素 (a1, a2, a3) 进行排序

假设输入是 (a1, a2, a3)。为了得到一个排好序的序列,我们需要确定这三个元素之间的大小关系。

可能的排列: 对于3个不同的元素,总共有 3! = 6 种可能的排列。例如 (a1, a2, a3), (a1, a3, a2), (a2, a1, a3) 等等。
决策树的目标: 我们的排序算法,必须能够区分出这6种不同的初始排列,并最终将它们导向各自唯一正确的有序结果。因此,这棵决策树必须至少有 6 个叶子节点。

下面是对3个元素进行排序的一个可能的决策树:
(这是一个示意图,实际内容会用文字描述)

        a1 < a2 ?
       /         
 (True)/           (False)
      /             
  a2 < a3 ?         a1 < a3 ?
 /                /      
...   ...          ...    ...

第一次比较: a1 < a2
如果为True,我们知道 a1a2 前面。我们接下来需要确定a3的位置,可能需要比较a2a3
如果为False,我们知道 a2a1 前面。我们接下来需要确定a3的位置,可能需要比较a1a3
算法沿着这棵树一路向下,每经过一个内部节点就进行一次比较,直到抵达一个叶子节点。这个叶子节点就代表了输入序列的最终排序结果。

从决策树到时间复杂度下界

叶子节点的数量: 对于一个包含n个不同元素的输入数组,总共有 n! 种可能的初始排列。一个正确的排序算法必须能处理所有这些情况,因此,它的决策树必须至少有 n! 个叶子节点。
[ L ge n! ]
其中 L 是叶子节点的数量。

树的高度: 决策树的高度 h,代表了在最坏情况下,算法需要执行的比较次数。一个高度为h的二叉树,最多拥有 2^h 个叶子节点。
[ L le 2^h ]

推导: 将以上两个不等式结合起来,我们得到:
[ n! le L le 2^h ]
对两边取对数:
[ log_2(n!) le h ]
根据斯特林近似公式 (Stirling’s approximation),我们知道 log(n!) 的增长率是 Θ(n log n)
更精确地说,log(n!) = sum_{i=1}^{n} log(i)
我们可以得到一个下界:
[ log(n!) = sum_{i=1}^{n} log(i) ge sum_{i=n/2}^{n} log(i) ge sum_{i=n/2}^{n} log(n/2) = (n/2) log(n/2) ]
这个结果是 Ω(n log n)

因此,我们得出了一个惊人的结论:
[ h = Omega(n log n) ]
这意味着,任何一个只依赖于元素间比较的排序算法,其在最坏情况下的时间复杂度,不可能优于 O(n log n)。这道“音速屏障”是由算法的“比较”本质所决定的,与具体的实现语言、硬件速度都无关。它是一个数学上的宿命。

1.2 范式转移:以键为地址的革命

既然“比较”这条路走到了尽头,那么想要获得更快的速度,唯一的出路就是——另辟蹊径,彻底抛弃比较

计数排序,以及与之同源的基数排序、桶排序,正是这次范式转移的先驱。它们的核心思想,可以被精炼地概括为:“以键为地址(Key-as-Address)”“数字的天然序(Natural Order of Numbers)”

想象一个极其简单的场景:你需要对100个学生的期末考试成绩进行排名,成绩范围是0到100分,且都是整数。

比较排序的思维: 随机抽取两个学生的试卷,比较分数,分数高的放一边,分数低的放另一边… 重复这个过程,直到所有试卷都排好。
计数排序的思维:

准备101个箱子,并给它们贴上标签:0号箱1号箱2号箱,…,100号箱
拿起第一份试卷,看上面的分数,比如是95分。好,把这份试卷直接扔进95号箱
拿起第二份试卷,88分,扔进88号箱
…遍历完所有100份试卷。
现在,从0号箱开始,依次到101号箱,把每个箱子里的试卷拿出来。得到的序列,自然就是排好序的。

在这个过程中,我们一次都没有去比较“95分”和“88分”哪个大。我们利用了分数(键)本身作为一个“地址”或者“索引”,直接将数据(试卷)“定位”到了它该去的地方。我们利用的是数字 0, 1, 2, ..., 100 本身固有的、不证自明的顺序。

这就是计数排序思想的精髓。它绕过了决策树模型的限制,因为它根本没有构建一棵决策树。它的操作是直接寻址,而不是路径探索

革命的代价:新的约束
当然,这场革命不是没有代价的。这种“以键为地址”的强大能力,建立在两个严格的先决条件之上:

数据必须是或可映射为整数: 我们需要用数据的值来做数组的索引。这意味着,待排序的数据必须是整数,或者可以被无歧义地、稳定地映射成整数(例如字符可以映射为ASCII码)。浮点数、复杂的字符串、自定义对象等都不能直接使用。
数据范围必须是可控的: 我们需要为从最小值到最大值之间的每一个可能的值都准备一个“箱子”(即数组的槽位)。如果我们要排序的数据是手机号码(11位),即便只有100个号码,我们也需要准备一个大小接近10^11的数组,这在内存上是完全不可行的。因此,计数排序只适用于**最大值与最小值之差(即k)**不比待排序元素数量n大太多的情况。

当这些条件被满足时,计数排序就能爆发出惊人的能量,将排序的时间复杂度从O(n log n)的“超音速”级别,一举提升到O(n + k)的“光速”级别。

**1.3 计数排序的宏观蓝图 **

在深入每一行代码的细节之前,我们先从宏观上勾勒出稳定版计数排序的三个核心步骤。这个三步走的策略,是整个算法的骨架。

假设我们要对数组 A 进行排序。

第一阶段:计数 (Counting)

目标: 统计出数组A中,每个不同元素出现的次数。
实现: 创建一个辅助数组,我们称之为count数组。其大小为 k = max(A) - min(A) + 1
流程: 遍历输入数组A。对于A中的每一个元素x,我们将count[x - min(A)]的值加一。遍历结束后,count[i]就存储了值为 i + min(A) 的元素在A中出现的总次数。

第二阶段:计算累积计数 (Cumulative Counting)

目标: 将count数组从一个“频率统计”数组,转变成一个“最终位置”的指针数组。
实现: 对count数组自身进行一次转换。
流程: 从count数组的第二个元素开始遍历。对于每个位置i,执行 count[i] = count[i] + count[i-1]。遍历结束后,count[i]的含义变成了:小于或等于值为 i + min(A) 的元素在A中的总数量。这个值,恰好就是值为i + min(A)的元素在最终排好序的数组中,应该放置的最后一个位置的索引(从1开始计数)。

第三阶段:放置排序 (Placement)

目标: 根据累积计数数组提供的位置信息,将A中的元素准确地放置到最终的输出数组B中。
实现: 创建一个与A等大的输出数组B
流程: 从后向前遍历输入数组A。对于A中的每一个元素x
a. 在count数组中查找x的位置信息,即 pos = count[x - min(A)]
b. 将元素x放置到输出数组Bpos - 1 索引处(因为数组索引从0开始)。所以 B[pos - 1] = x
c. 更新count数组中x的位置信息,count[x - min(A)] -= 1。这样做是为了给下一个与x值相同的元素,安排在它前面的位置,从而保证稳定性
完成: 当A遍历完毕,B就是一个完全排好序的、稳定的数组。

第二章:算法的解剖——从蓝图到代码的精密实现

2.1 第一阶段:计数 (The Counting Phase) – 铸造频率之镜

这是整个算法的基石。我们的目标是创建一个“频率之镜”——一个名为count_array的数组,它能精确地反映出输入数组中每个元素出现的次数。为了处理任意范围的整数(不仅仅是从0开始),我们必须首先确定数据的边界,即最小值min_value和最大值max_value。这个范围决定了我们计数数组的大小,而最小值则作为计算索引的“偏移量”。

代码实现:phase_one_counting

def phase_one_counting(input_array):
    """
    执行计数排序的第一阶段:计数。
    该函数统计输入数组中每个元素的出现频率。

    参数:
        input_array (list): 一个包含整数的输入列表。

    返回:
        一个元组,包含三个元素:
        1. count_array (list): 记录了每个元素频率的计数数组。
        2. min_value (int): 输入数组中的最小值。
        3. max_value (int): 输入数组中的最大值。
    """
    if not input_array: # 检查输入数组是否为空,处理边界情况
        return [], 0, 0 # 如果为空,则返回空的计数数组和0

    min_value = min(input_array) # 找到输入数组的最小值,作为偏移基准
    max_value = max(input_array) # 找到输入数组的最大值,以确定计数数组的大小

    # 计算计数数组所需的大小。例如,如果数据是[1, 2, 8],则范围是8-1=7,需要8个槽位(1,2,3,4,5,6,7,8)
    count_array_size = max_value - min_value + 1
    # 初始化一个全为0的计数数组
    count_array = [0] * count_array_size

    # --- 核心计数循环 ---
    # 遍历输入数组中的每一个元素
    for value in input_array:
        # 计算该元素在计数数组中对应的索引
        # 这是整个算法的关键:将元素值通过偏移量映射到数组索引
        index = value - min_value
        # 在对应索引的位置上,将计数值加一
        count_array[index] += 1
    
    return count_array, min_value, max_value

# --- 示例与追踪 ---
# 假设我们的输入数组是 A = [4, 2, 2, 8, 3, 3, 1]
A = [4, 2, 2, 8, 3, 3, 1]
print(f"原始输入数组 A: {
              A}
")

# 执行第一阶段
counts, min_val, max_val = phase_one_counting(A)

print("--- 第一阶段:计数 完成 ---")
print(f"检测到数组最小值: {
              min_val}") # 预期输出: 1
print(f"检测到数组最大值: {
              max_val}") # 预期输出: 8
print(f"计数数组大小 (max - min + 1): {
              len(counts)}") # 预期输出: 8 - 1 + 1 = 8

# 为了更清晰地展示,我们将计数数组的索引与它代表的原始值对应起来
print("
计数数组 (count_array) 的状态:")
print("=" * 40)
print(f"{
              '索引 (index)':<15} | {
              '代表的值 (value)':<18} | {
              '频率 (count)'}")
print("-" * 40)
for i, count in enumerate(counts):
    # 索引 i 对应的原始值是 i + min_val
    represented_value = i + min_val
    print(f"{
              i:<15} | {
              represented_value:<18} | {
              count}")
print("=" * 40)

执行追踪分析:
对于输入 A = [4, 2, 2, 8, 3, 3, 1]

确定边界: min(A)1max(A)8
创建计数数组: count_array 的大小为 8 - 1 + 1 = 8。其索引从07
遍历与计数:

遇到 4index = 4 - 1 = 3count_array[3] 变为 1
遇到 2index = 2 - 1 = 1count_array[1] 变为 1
遇到 2index = 2 - 1 = 1count_array[1] 变为 2
遇到 8index = 8 - 1 = 7count_array[7] 变为 1
遇到 3index = 3 - 1 = 2count_array[2] 变为 1
遇到 3index = 3 - 1 = 2count_array[2] 变为 2
遇到 1index = 1 - 1 = 0count_array[0] 变为 1

最终状态:

count_array[0] (代表值1) = 1
count_array[1] (代表值2) = 2
count_array[2] (代表值3) = 2
count_array[3] (代表值4) = 1
count_array[4] (代表值5) = 0
count_array[5] (代表值6) = 0
count_array[6] (代表值7) = 0
count_array[7] (代表值8) = 1

至此,我们已经成功地将原始数组的数值信息,转换为了频率信息,存储在了一个新的维度(count_array)上。这面“频率之镜”已经铸造完成。

2.2 第二阶段:计算累积计数 (The Cumulative Counting Phase) – 绘制定位地图

现在,我们需要对这面“频率之镜”进行一次“魔法”般的转换。单纯的频率信息还不足以指导我们排序,我们需要知道每个元素在最终排好序的数组中,应该处于哪个位置。这就是第二阶段的目标:将频率数组 count_array 改造为“累积计数数组”。

转换后的 count_array[i] 将拥有一个全新的、强大的含义:它代表小于或等于其对应值(i + min_value)的元素在原始数组中一共有多少个。这个数字,恰好就是该值在排序后数组中的右边界索引(从1开始计数)。

代码实现:phase_two_cumulative_sum

def phase_two_cumulative_sum(count_array):
    """
    执行计数排序的第二阶段:计算累积和。
    这个函数会原地修改输入的计数数组。

    参数:
        count_array (list): 由第一阶段生成的频率计数数组。

    返回:
        None (函数直接在传入的列表上进行修改)。
    """
    # 从计数数组的第二个元素开始 (索引为1)
    for i in range(1, len(count_array)):
        # 当前位置的累积计数值 = 当前位置的原始计数值 + 前一个位置的累积计数值
        count_array[i] += count_array[i-1]

# --- 延续上面的示例 ---
# 我们使用第一阶段生成的 counts 数组
print("
--- 第二阶段:计算累积计数 开始 ---")
print(f"转换前的 count_array: {
              counts}")

# 执行第二阶段,原地修改 counts 数组
phase_two_cumulative_sum(counts)

print(f"转换后的 count_array: {
              counts}")

print("
累积计数数组 (count_array) 的新状态和含义:")
print("=" * 70)
print(f"{
              '索引 (index)':<15} | {
              '代表的值 (value)':<18} | {
              '累积计数 (含义)'}")
print("-" * 70)
for i, count in enumerate(counts):
    represented_value = i + min_val
    meaning = f"<= {
              represented_value} 的元素共有 {
              count} 个"
    print(f"{
              i:<15} | {
              represented_value:<18} | {
              meaning}")
print("=" * 70)

执行追踪分析:
我们以上一阶段的结果 counts = [1, 2, 2, 1, 0, 0, 0, 1] 为输入:

i = 1: counts[1] = counts[1] + counts[0] = 2 + 1 = 3。含义:小于等于2的元素共有3个。
i = 2: counts[2] = counts[2] + counts[1] = 2 + 3 = 5。含义:小于等于3的元素共有5个。
i = 3: counts[3] = counts[3] + counts[2] = 1 + 5 = 6。含义:小于等于4的元素共有6个。
i = 4: counts[4] = counts[4] + counts[3] = 0 + 6 = 6。含义:小于等于5的元素共有6个。
i = 5: counts[5] = counts[5] + counts[4] = 0 + 6 = 6。含义:小于等于6的元素共有6个。
i = 6: counts[6] = counts[6] + counts[5] = 0 + 6 = 6。含义:小于等于7的元素共有6个。
i = 7: counts[7] = counts[7] + counts[6] = 1 + 6 = 7。含义:小于等于8的元素共有7个。

最终的累积计数数组: [1, 3, 5, 6, 6, 6, 6, 7]
这已经不再是简单的频率统计,而是一张精确的“定位地图”。例如,counts[2](代表值3)的值是5,这告诉我们,在最终排好序的数组里,最后一个3应该被放在索引为5-1=4的位置上。

2.3 第三阶段:放置排序 (The Placement Phase) – 依图寻位与稳定性的奥秘

这是最后,也是最精妙的一步。我们将利用刚刚绘制好的“定位地图”,将原始数组 A 中的每一个元素,精准地安放到最终的输出数组 B 中。

这里有一个至关重要的细节,也是计数排序能够成为稳定排序算法的关键:我们必须从后向前遍历原始输入数组 A。为什么?让我们在代码实现后来深入探讨这个“稳定性的奥秘”。

代码实现:phase_three_placement

def phase_three_placement(input_array, cumulative_counts, min_value):
    """
    执行计数排序的第三阶段:放置排序。
    根据累积计数数组,将元素放置到新的输出数组中。

    参数:
        input_array (list): 原始的、未排序的输入列表。
        cumulative_counts (list): 经过第二阶段处理后的累积计数数组。
        min_value (int): 输入数组中的最小值(用于计算偏移)。

    返回:
        output_array (list): 一个新的、已排序的列表。
    """
    # 创建一个和输入数组同样大小的输出数组,初始值可以任意,这里用None填充
    output_array = [None] * len(input_array)
    
    # --- 核心放置循环:从后向前遍历输入数组 ---
    # range(len(input_array) - 1, -1, -1) 生成一个从 len-1 到 0 的逆序序列
    for i in range(len(input_array) - 1, -1, -1):
        # 获取当前遍历到的元素值
        value = input_array[i]
        
        # 1. 在累积计数数组中查找该元素的位置信息
        #    首先计算它在计数数组中的索引
        count_index = value - min_value
        #    然后获取该元素在排序后数组中的目标位置(基于1的索引)
        position_in_output = cumulative_counts[count_index]
        
        # 2. 将元素放置到输出数组的正确位置
        #    因为 position_in_output 是基于1的索引,所以数组下标是 position - 1
        output_array[position_in_output - 1] = value
        
        # 3. 更新累积计数数组中的值,将其减一
        #    为下一个相同值的元素“预留”出它前面的位置
        cumulative_counts[count_index] -= 1
        
        # --- 单步追踪 (用于教学) ---
        print(f"处理 A[{
              i}] = {
              value}:")
        print(f"  -> 查地图: cumulative_counts[{
              count_index}] = {
              position_in_output}")
        print(f"  -> 放置到 output_array[{
              position_in_output - 1}]")
        print(f"  -> 更新地图: cumulative_counts[{
              count_index}] 变为 {
              cumulative_counts[count_index]}")
        print(f"  当前 output_array 状态: {
              output_array}
")

    return output_array

# --- 延续上面的示例 ---
# A = [4, 2, 2, 8, 3, 3, 1]
# min_val = 1
# cumulative_counts 在此阶段开始前是 [1, 3, 5, 6, 6, 6, 6, 7]
print("
--- 第三阶段:放置排序 开始 ---")
# 为了不影响后续完整函数的调用,我们复制一份
cumulative_counts_for_phase3 = counts[:] 
sorted_A = phase_three_placement(A, cumulative_counts_for_phase3, min_val)

print("
--- 第三阶段:放置排序 完成 ---")
print(f"最终排序后的数组: {
              sorted_A}") # 预期输出: [1, 2, 2, 3, 3, 4, 8]

稳定性的奥秘:为何必须从后向前遍历?

让我们用一个带有重复项的、更需要体现稳定性的例子来说明:A = [(3, 'a'), (2, 'b'), (3, 'c')]。我们只按数字排序。

min=2, max=3count_array大小为2。
阶段一后: counts = [1, 2] (1个2,2个3)
阶段二后: counts = [1, 3] (<=2的有1个,<=3的有3个)

场景一:从后向前遍历 (正确方式)

处理 A[2] = (3, ‘c’):

value=3, count_index=1.
pos = counts[1] = 3.
output[2] = (3, 'c').
counts[1] 变为 2.
output = [None, None, (3, 'c')]

处理 A[1] = (2, ‘b’):

value=2, count_index=0.
pos = counts[0] = 1.
output[0] = (2, 'b').
counts[0] 变为 0.
output = [(2, 'b'), None, (3, 'c')]

处理 A[0] = (3, ‘a’):

value=3, count_index=1.
pos = counts[1] = 2.
output[1] = (3, 'a').
counts[1] 变为 1.
output = [(2, 'b'), (3, 'a'), (3, 'c')]

最终结果 [(2, 'b'), (3, 'a'), (3, 'c')]。观察两个3(3, 'a') 在原始数组中先出现,在排序后数组中也先出现。稳定性得到保持。这是因为我们是从后向前处理的,原始数组中靠后的相同元素,会先被放置到最终位置的靠后的槽位里。

场景二:从前向后遍历 (错误方式)

处理 A[0] = (3, ‘a’):

value=3, count_index=1.
pos = counts[1] = 3.
output[2] = (3, 'a').
counts[1] 变为 2.
output = [None, None, (3, 'a')]

处理 A[1] = (2, ‘b’):

value=2, count_index=0.
pos = counts[0] = 1.
output[0] = (2, 'b').
counts[0] 变为 0.
output = [(2, 'b'), None, (3, 'a')]

处理 A[2] = (3, ‘c’):

value=3, count_index=1.
pos = counts[1] = 2.
output[1] = (3, 'c').
counts[1] 变为 1.
output = [(2, 'b'), (3, 'c'), (3, 'a')]

最终结果 [(2, 'b'), (3, 'c'), (3, 'a')]。观察两个3(3, 'a') 在原始数组中先出现,但在排序后数组中,(3, 'c') 跑到了它前面。稳定性被破坏

这个简单的对比,深刻地揭示了“从后向前遍历”在保证计数排序稳定性中不可替代的核心作用。

2.4 宏伟的统一:完整的 counting_sort 函数

现在,我们已经分别剖析并实现了三个阶段。是时候将它们组装起来,形成一个完整、健壮、可用的 counting_sort 函数了。

def counting_sort(input_array):
    """
    一个完整、稳定且能处理负数的计数排序实现。

    参数:
        input_array (list): 包含整数(可正可负)的待排序列表。

    返回:
        一个与输入列表具有相同元素,但已稳定排序的新列表。
    """
    # 处理空列表或只有一个元素的列表的边界情况,直接返回其拷贝
    if len(input_array) <= 1:
        return input_array[:]

    # --- 阶段一: 计数 ---
    min_value = min(input_array) # 找到最小值,用于处理偏移
    max_value = max(input_array) # 找到最大值,确定计数数组范围

    count_array_size = max_value - min_value + 1 # 计算计数数组大小
    count_array = [0] * count_array_size # 初始化计数数组

    for value in input_array: # 遍历输入数组
        count_array[value - min_value] += 1 # 在对应位置上增加频率计数

    # --- 阶段二: 计算累积计数 ---
    for i in range(1, count_array_size): # 遍历计数数组
        count_array[i] += count_array[i-1] # 将其转换为累积计数数组

    # --- 阶段三: 放置排序 ---
    output_array = [None] * len(input_array) # 创建输出数组

    # 从后向前遍历原始输入数组以保证稳定性
    for i in range(len(input_array) - 1, -1, -1):
        value = input_array[i] # 获取当前元素
        
        # 从累积计数数组中找到它的目标位置(基于1的索引)
        position = count_array[value - min_value] 
        # 将其放入输出数组的正确槽位(基于0的索引)
        output_array[position - 1] = value
        
        # 将该位置的计数值减一,为下一个相同元素准备
        count_array[value - min_value] -= 1
        
    return output_array

# --- 最终测试 ---
test_data_1 = [4, 2, 2, 8, 3, 3, 1]
print(f"
--- 完整函数测试 1 ---")
print(f"输入: {
              test_data_1}")
sorted_data_1 = counting_sort(test_data_1)
print(f"输出: {
              sorted_data_1}")
# 验证结果
assert sorted_data_1 == sorted(test_data_1)
print("验证通过!")

test_data_2 = [10, -5, 3, 3, -1, 0, 10, -5, 8]
print(f"
--- 完整函数测试 2 (包含负数) ---")
print(f"输入: {
              test_data_2}")
sorted_data_2 = counting_sort(test_data_2)
print(f"输出: {
              sorted_data_2}")
# 验证结果
assert sorted_data_2 == sorted(test_data_2)
print("验证通过!")

test_data_3 = []
print(f"
--- 完整函数测试 3 (空列表) ---")
print(f"输入: {
              test_data_3}")
sorted_data_3 = counting_sort(test_data_3)
print(f"输出: {
              sorted_data_3}")
assert sorted_data_3 == sorted(test_data_3)
print("验证通过!")

通过这三个阶段的精密协作,我们构建了一个功能完备的计数排序算法。它不仅正确,而且通过巧妙的设计,具备了处理任意整数范围和保证稳定性的高级特性。我们已经将算法的蓝图,成功地浇筑成了坚固的代码实现。

第三章:性能法证与算法特性——复杂度、稳定性与局限的深度审视

3.1 时间复杂度:线性时间之梦的现实条件 (Time Complexity: The Realistic Conditions for a Linear-Time Dream)

计数排序最引以为傲的特性,便是其在线性时间O(n+k)内完成排序的能力。这个性能表现,让它在特定场景下,足以让所有基于比较的O(n log n)算法望尘莫及。现在,让我们来精确地推导这个时间复杂度是如何产生的。

我们将逐一分析counting_sort函数中每一个步骤的计算成本。

def counting_sort(input_array):
    # 步骤 0: 边界检查
    if len(input_array) <= 1: # len()是O(1),比较是O(1)。总成本: O(1)
        return input_array[:] # 列表切片是O(n),在此处n<=1,所以是O(1)。

    # --- 阶段一: 计数 ---
    # 步骤 1: 寻找最大值和最小值
    min_value = min(input_array) # 遍历整个数组一次,成本: O(n)
    max_value = max(input_array) # 再次遍历整个数组一次,成本: O(n)

    # 步骤 2: 初始化计数数组
    range_of_elements = max_value - min_value # 数学计算,成本: O(1)
    count_array_size = range_of_elements + 1 # 数学计算,成本: O(1)
    # 我们定义 k = count_array_size
    count_array = [0] * count_array_size # 创建一个大小为k的列表,成本: O(k)

    # 步骤 3: 频率统计
    for value in input_array: # 这个循环的迭代次数等于输入数组的长度 n
        # value - min_value 是 O(1)
        # count_array[...] += 1 访问和修改是 O(1)
        # 循环总成本: n * O(1) = O(n)
        count_array[value - min_value] += 1

    # --- 阶段二: 计算累积计数 ---
    # 步骤 4: 累积求和
    # 这个循环的迭代次数是 count_array_size - 1,即 k-1 次
    for i in range(1, count_array_size):
        # 访问和修改是 O(1)
        # 循环总成本: (k-1) * O(1) = O(k)
        count_array[i] += count_array[i-1]

    # --- 阶段三: 放置排序 ---
    # 步骤 5: 初始化输出数组
    output_array = [None] * len(input_array) # 创建一个大小为n的列表,成本: O(n)

    # 步骤 6: 放置元素
    # 这个循环的迭代次数等于输入数组的长度 n
    for i in range(len(input_array) - 1, -1, -1):
        value = input_array[i] # O(1)
        position = count_array[value - min_value] # O(1)
        output_array[position - 1] = value # O(1)
        count_array[value - min_value] -= 1 # O(1)
        # 循环总成本: n * O(1) = O(n)
        
    return output_array # O(1)

成本汇总:
将所有步骤的成本相加,我们得到总的时间复杂度 T(n, k)
T(n, k) = O(1) + O(n) + O(n) + O(k) + O(n) + O(k) + O(n) + O(n)
T(n, k) = O(5n + 2k + 1)

根据大O表示法的规则,我们忽略常数系数和低阶项,最终得到:
T(n, k) = O(n + k)

其中,n 是待排序元素的数量,k 是元素的范围(即 max_value - min_value + 1)。

nk 的权力游戏

O(n+k)这个公式的美妙与险恶之处,在于它揭示了算法的性能是两个变量共同作用的结果。理解nk之间的关系,是掌握计数排序应用场景的钥匙。

场景一:理想情况 (kn 处于同一量级,即 k = O(n))
这是计数排序的“主场”。想象一下我们要对某城市所有居民的年龄进行排序。

n 可能非常大,比如1000万。
k 却很小,年龄范围基本在0到120岁之间,所以k约等于121。
在这种情况下,k相对于n是一个可以忽略不计的常数。
时间复杂度 O(n + k) = O(n + 121) = O(n)
这是真正的线性时间排序,其速度之快,是任何O(n log n)算法都无法企及的。

import time
import random

# 创建一个符合理想情况的数据集:n很大,k很小
n_ideal = 10_000_000 # 一千万个元素
k_ideal_range = (0, 150) # 年龄范围
ideal_data = [random.randint(k_ideal_range[0], k_ideal_range[1]) for _ in range(n_ideal)]

# 使用我们自己的计数排序
start_time = time.perf_counter()
sorted_by_counting = counting_sort(ideal_data)
end_time = time.perf_counter()
print(f"--- 理想情况 (n={
              n_ideal}, k≈{
              k_ideal_range[1]}) ---")
print(f"计数排序耗时: {
              end_time - start_time:.4f} 秒")

# 使用Python内置的Timsort进行对比
# 为了公平,我们复制一份数据,避免缓存效应
timsort_data = ideal_data[:]
start_time = time.perf_counter()
timsort_data.sort()
end_time = time.perf_counter()
print(f"Python内置Timsort耗时: {
              end_time - start_time:.4f} 秒")
# 你会发现在这种场景下,计数排序通常会比高度优化的Timsort还要快。

场景二:棘手情况 (k 远大于 n,例如 k = O(n^2))
现在,k成为了性能的瓶颈。假设我们要对一个班级50名学生的学号进行排序,学号范围是 2023000020239999

n = 50
k = 20239999 - 20230000 + 1 = 10000
k的值远大于n
时间复杂度 O(n + k) = O(50 + 10000) ≈ O(k)
性能的瓶颈在于创建和遍历那个巨大的count_array。此时,O(n log n)的算法可能会更快。
50 * log(50) ≈ 50 * 5.6 = 28010000 远大于 280

import time
import random

# 创建一个 k >> n 的数据集
n_tricky = 100 # 只有100个元素
k_tricky_range = (0, 800000) # 但范围非常大
tricky_data = [random.randint(k_tricky_range[0], k_tricky_range[1]) for _ in range(n_tricky)]

# 使用计数排序
start_time = time.perf_counter()
sorted_by_counting_tricky = counting_sort(tricky_data)
end_time = time.perf_counter()
print(f"
--- 棘手情况 (n={
              n_tricky}, k≈{
              k_tricky_range[1]}) ---")
print(f"计数排序耗时: {
              end_time - start_time:.4f} 秒") # 耗时主要在创建和遍历O(k)的数组

# 使用Python内置的Timsort进行对比
timsort_data_tricky = tricky_data[:]
start_time = time.perf_counter()
timsort_data_tricky.sort()
end_time = time.perf_counter()
print(f"Python内置Timsort耗时: {
              end_time - start_time:.4f} 秒")
# 在这种场景下,Timsort几乎瞬间完成,而计数排序会明显变慢。

场景三:灾难情况 (k 达到天文数字)
如果我们要对1000个18位的身份证号码进行排序。

n = 1000
k 接近 10^18
时间复杂度 O(n + k) ≈ O(10^18)。这在宇宙的生命周期内都无法完成。更不用说,在下一节我们将看到,根本不可能创建出这么大的count_array

这个时间复杂度的分析告诉我们,计数排序是一位“特长生”,而非“全能选手”。它的线性时间之梦,是有着严格的现实条件的。作为开发者,我们的任务就是识别出那些能让它一展所长的“理想情况”。

3.2 空间复杂度:速度的代价 (Space Complexity: The Price of Speed)

天下没有免费的午餐。计数排序用非凡的速度,交换来的是对内存空间的额外需求。这是一种典型的“以空间换时间”的策略。让我们来精确计算它的内存开销。

counting_sort函数执行期间,主要的内存占用来自于以下几个部分:

input_array: 这是输入数据,它的大小是 n。空间成本:O(n)
output_array: 为了实现稳定排序,我们创建了一个与输入等大的输出数组。空间成本:O(n)
count_array: 这是计数排序的核心辅助数据结构,其大小由数据的范围k决定。空间成本:O(k)
其他变量如 min_value, max_value, i 等,都是常数级别的空间占用,可以忽略不计。

总空间复杂度:
将所有主要的内存占用相加:
S(n, k) = O(n) (输入) + O(n) (输出) + O(k) (计数数组)
S(n, k) = O(n + k)

内存占用分析:

非原地排序 (Not In-Place): 从O(n+k)的空间复杂度可以看出,计数排序不是一个原地排序算法。一个原地排序算法的空间复杂度应该是O(1)(如堆排序)或O(log n)(如快速排序的递归栈)。计数排序需要额外的O(n+k)空间来完成工作。
k的决定性影响: 与时间复杂度类似,空间复杂度也深受k值的影响。

在理想情况(k=O(n))下,空间复杂度为O(n)。这是完全可以接受的。
在棘手情况(k >> n)下,O(k)的空间成本会成为致命的制约。在上面学号排序的例子中(k=10000),count_array需要 10000 * 4 bytes (假设是32位整数) ≈ 40 KB 的内存。这还不算大。但如果k=800000,就需要 800000 * 4 bytes ≈ 3.2 MB 的内存,只是为了排序100个数字。
在灾难情况(k=10^18)下,试图创建一个大小为10^18的数组,会直接耗尽任何计算机的内存,并导致MemoryError

可视化内存布局:
让我们再次回到示例 A = [4, 2, 2, 8, 3, 3, 1]

n = 7, k = 8
input_array: [4, 2, 2, 8, 3, 3, 1] -> 7 * sizeof(int) 字节
count_array: [0, 0, 0, 0, 0, 0, 0, 0] -> 8 * sizeof(int) 字节
output_array: [None, None, None, None, None, None, None] -> 7 * sizeof(int) 字节

总空间占用与n+k成正比。这个空间代价,是我们在享受线性时间效率时,必须支付的“过路费”。

**3.3 稳定性的美德:为何它至关重要 **

真实场景:多级排序的用户列表

假设你正在为一个电商网站开发一个用户管理后台。产品经理提出了一个需求:需要对用户列表进行排序展示,排序规则有两条,优先级从高到低:

主排序键: 按用户的会员等级(Level)降序排列(例如,VIP3 > VIP2 > VIP1)。
次排序键: 如果会员等级相同,则按用户的注册时间(RegistrationDate)升序排列(注册越早,排名越靠前)。

这是一个典型的多级排序(或称为复合键排序)问题。一个常见且优雅的解决方案是:利用稳定排序,先按次要的、优先级低的键排序,再按主要的、优先级高的键排序。

让我们用代码来模拟这个场景。

from datetime import date, timedelta

# 定义一个简单的用户类
class User:
    def __init__(self, name, level, reg_date_str):
        self.name = name # 用户名
        self.level = level # 会员等级 (假设 1, 2, 3)
        self.reg_date = date.fromisoformat(reg_date_str) # 注册日期
    
    def __repr__(self):
        # 定义一个方便打印的表示形式
        return f"User(name='{
              self.name}', level={
              self.level}, reg_date='{
              self.reg_date}')"

# 我们的用户数据
users = [
    User('Alice', 2, '2022-03-15'),
    User('Bob', 1, '2021-08-20'),
    User('Charlie', 2, '2022-01-10'), # Charlie的等级和Alice一样,但注册更早
    User('David', 3, '2023-05-01'),
    User('Eve', 1, '2022-09-05'),     # Eve的等级和Bob一样,但注册更晚
    User('Frank', 2, '2023-02-28')    # Frank的等级和Alice/Charlie一样,注册最晚
]

print("--- 原始用户数据 ---")
for user in users:
    print(user)

# 解决方案:利用稳定排序
# 步骤 1: 先按次要的、优先级低的键 (注册日期) 排序
# Python的 sort() 和 sorted() 都是稳定的。
users_sorted_by_date = sorted(users, key=lambda u: u.reg_date)
print("
--- 步骤1: 按注册日期 (次要键) 稳定排序后 ---")
for user in users_sorted_by_date:
    print(user)

# 步骤 2: 再按主要的、优先级高的键 (会员等级) 排序
# 关键:这次排序必须是稳定的!这样才能保持上一步按日期排好的相对顺序。
# 我们仍然使用稳定的 sorted(),并按 level 降序排列。
final_sorted_users = sorted(users_sorted_by_date, key=lambda u: u.level, reverse=True)

print("
--- 步骤2: 按会员等级 (主要键) 稳定排序后 (最终结果) ---")
for user in final_sorted_users:
    print(user)

# --- 验证结果 ---
# David (Level 3) 应该在最前面。
# 接下来是三个 Level 2 的用户。由于步骤1的稳定排序,他们的内部顺序应该是按注册日期升序的:
# Charlie (2022-01-10) -> Alice (2022-03-15) -> Frank (2023-02-28)
# 最后是两个 Level 1 的用户,内部顺序也应该是按注册日期升序的:
# Bob (2021-08-20) -> Eve (2022-09-05)

在这个例子中,如果第二步的排序算法是不稳定的,那么在按level排序时,Alice, Charlie, Frank这三个同为Level 2的用户的相对顺序可能会被打乱。第一步按注册日期排好的序就白费了。稳定排序确保了“在主要矛盾解决后,次要矛盾的处理结果得以保留”。

通往基数排序的桥梁

这个多级排序的思想,正是基数排序(Radix Sort)的核心。基数排序将数字的每一位(个位、十位、百位…)看作一个独立的排序键。它正是通过从最低位(次要键)到最高位(主要键),反复调用一个稳定的子排序算法(通常就是计数排序)来实现对整个数字的排序。

如果用于基数排序的子程序不是稳定的,那么当排完十位后,之前排好的个位的顺序就会被完全打乱,整个算法将彻底失败。因此,计数排序的稳定性,是其能够作为基数排序核心引擎的先决条件。我们将在后续章节中,从零开始构建一个基于我们counting_sort的基数排序实现,届时你将更深刻地体会到稳定性的力量。

3.4 算法的边界:计数排序的“不可为之事” (The Algorithm’s Boundary: What Counting Sort Cannot Do)

一个成熟的开发者,不仅要知道一个工具能做什么,更要知道它不能做什么。清晰地认识到计数排序的局限性,可以帮助我们避免在不合适的场景中误用它,从而写出更健壮、更高效的代码。

1. 整数约束 (The Integer Constraint)

问题: 计数排序的根基是“以键为地址”,即用元素的值来计算count_array的索引。这从根本上要求了待排序的键必须是整数。
反例: 你不能直接对一个包含字符串的列表 ['apple', 'orange', 'banana'] 使用计数排序,因为你无法用 'apple' 这个值去直接索引一个数组。虽然可以先将字符串转换为数字(如哈希值),但这引入了新的问题(哈希冲突),且不再是纯粹的计数排序。

2. 浮点数难题 (The Floating-Point Problem)

问题: 浮点数在理论上是连续的,任何两个不同的浮点数之间,都存在着无限个其他的浮点数。这使得为浮点数创建一个“一一对应”的count_array变得不可能。count_arrayk 会是无穷大。
演示:

float_data = [2.718, 3.141, 1.618, 2.719]
# min = 1.618, max = 3.141
# 我们无法创建一个大小为 3.141 - 1.618 + 1 的数组。
# 即使我们将它们乘以1000变成整数 [2718, 3141, 1618, 2719],
# 如果原始数据是 [2.7181, 2.7182],这种转换也会丢失精度或导致巨大的k。

try:
    counting_sort(float_data)
except TypeError as e:
    # 我们的实现可能会因为 min/max/range 计算而直接失败,
    # 或者在索引 count_array[value - min_value] 时失败,因为索引必须是整数。
    print(f"对浮点数使用计数排序失败: {
                e}")

变通方案(非排序): 对于浮点数,我们可以使用一种类似思想的技术——桶排序(Bucket Sort)。我们将浮点数的范围(如0.0到1.0)划分成若干个“桶”,将数字放入对应的桶中,再对每个桶内部进行排序。但这已经属于另一种算法的范畴了。

3. 范围约束 (The Range Constraint)

问题: 我们已经反复强调,当k(数据的范围)过大时,计数排序在时间上和空间上都是不可行的。这是它最核心的、也是最实际的限制。
经验法则: 一个好的经验法则是,只有当你知道 k 不会显著大于 n(理想情况是 k 远小于或约等于 n)时,才应该考虑使用计数排序。在进行系统设计或算法选择时,对数据范围的预估是至关重要的一步。

通过这次全面的性能法证与特性审视,我们对计数排序的理解,已经从一个单纯的“代码实现者”,提升到了一个能够权衡利弊、洞悉其内在规律的“算法分析师”。我们知道了它的光荣与梦想,也理解了它的束缚与边界。带着这份更深刻的认知,我们将在下一章中,探索如何将计数排序的应用,从简单的整数数组,扩展到更广阔的、由字符和复杂对象构成的世界。

**第四章:超越整数——计数排序在多维数据与复杂对象上的应用之道 **

4.1 字符的密语:利用ASCII/Unicode进行文本排序 (The Cipher of Characters: Sorting Text with ASCII/Unicode)

计数排序的第一个,也是最自然的扩展领域,便是字符排序。表面上看,字符 'a', 'b', 'c' 并非整数,但实际上,在计算机的内存中,它们的存在形式正是数字。每一个字符,都对应着一个独一无二的整数编码,这个编码系统就是我们熟知的ASCII码表或更广阔的Unicode码表。

这种内在的数字表示,为我们搭建了一座完美、无损的桥梁。我们可以通过这个桥梁,将字符排序问题,直接转化为计数排序最擅长的整数排序问题。

ord() 函数: 这是从字符通往整数的“编码器”。ord('a') 会返回字符'a'对应的整数编码 97
chr() 函数: 这是从整数回到字符的“解码器”。chr(97) 会返回整数97代表的字符'a'

实现策略:
我们的策略非常直接:

编码: 将输入的字符列表(或字符串)中的每一个字符,通过ord()函数转换成其对应的整数编码,形成一个纯整数列表。
排序: 将这个新生成的整数列表,直接传递给我们已经实现的counting_sort函数进行排序。
解码: 将排序好的整数列表,通过chr()函数,逐个转换回字符,形成最终的、有序的字符列表。

代码实现:counting_sort_chars

# 假设我们在一个文件中已经拥有了之前实现的 counting_sort 函数
# from chapter_2 import counting_sort

def counting_sort_chars(char_sequence):
    """
    使用计数排序对字符序列(字符串或字符列表)进行稳定排序。

    参数:
        char_sequence (str or list of str): 待排序的字符序列。

    返回:
        一个包含相同字符但已排好序的新列表。
    """
    # 边界情况处理
    if not char_sequence:
        return []

    # 1. 编码阶段:将字符转换为它们的Unicode/ASCII码点(整数)
    # 列表推导式高效地完成这一转换
    int_codes = [ord(char) for char in char_sequence]
    print(f"--- 字符到整数的编码 ---")
    print(f"原始字符序列: {
              ''.join(char_sequence)}")
    print(f"转换后的整数编码: {
              int_codes}")

    # 2. 排序阶段:直接调用我们已经实现的整数计数排序函数
    print(f"
--- 调用核心整数计数排序 ---")
    sorted_int_codes = counting_sort(int_codes)
    print(f"整数编码排序后的结果: {
              sorted_int_codes}")

    # 3. 解码阶段:将排序后的整数码点转换回字符
    sorted_chars = [chr(code) for code in sorted_int_codes]
    print(f"
--- 整数到字符的解码 ---")
    print(f"解码后的有序字符列表: {
              sorted_chars}")
    
    return sorted_chars

# --- 示例:对一个包含大小写字母和符号的字符串进行排序 ---
text_to_sort = "Counting-Sort is a non-comparison-based algorithm!"

print("--- 示例:对字符串进行字符排序 ---")
sorted_character_list = counting_sort_chars(text_to_sort)

print("
--- 最终结果 ---")
# 将列表合并成一个字符串以便清晰地查看
final_sorted_string = "".join(sorted_character_list)
print(f"原始字符串: "{
              text_to_sort}"")
print(f"排序后结果: "{
              final_sorted_string}"")

# 验证一下,ASCII码中 '!' < '-' < 'C' < 'S' < 'a' < 'b' < 'c' ...
# 预期输出应大致是符号在前,大写字母在中,小写字母在后

性能与范围k的分析

ASCII场景: 对于标准的英文文本,字符基本都落在ASCII码表的0-127范围内。这意味着k的最大值也就在127左右。这是一个极小的常数,在这种情况下,counting_sort_chars的时间复杂度为O(n + k) = O(n + 127) = O(n),效率极高。
Unicode场景: Python的字符串是基于Unicode的。Unicode码表非常庞大,最大的码点可以超过1,114,111 (sys.maxunicode)。如果我们处理一个包含多国语言(如中文、阿拉伯文、俄文)的字符串,max_valuemin_value的差距可能会变得非常大,从而导致k值爆炸,使得计数排序变得不可行。
优化策略: 即使在Unicode场景下,只要我们能确定待排序的文本只使用了Unicode的一个小子集(例如,只包含俄语西里尔字母),我们依然可以通过计算min_value = min(int_codes)max_value = max(int_codes)来动态确定一个可控的k值。这与我们处理整数时采用的策略完全一致。

4.2 对象排序的钥匙:使用key函数进行属性提取

这才是我们在真实世界中更常遇到的挑战:我们有一个对象列表,需要根据对象的某个特定属性(该属性是整数且范围可控)来进行排序。例如,一个Product对象列表,需要按category_id分类,或者按price_in_cents(以分为单位的价格)排序。

我们不能直接将Product对象列表扔给counting_sort,它会因为无法处理对象而崩溃。解决这个问题的核心思想是:将排序逻辑与数据结构解耦。我们需要一种方法,告诉我们的排序函数:“不要看这个对象本身,请看它的这个特定属性,并根据这个属性来排序。”

这个“告诉”的动作,在Python中,通常是通过传递一个key函数来实现的,就像内置的sorted()函数一样。现在,我们的任务是改造counting_sort,赋予它接受和使用key函数的能力。

策略:改造counting_sort以接受key

我们将创建一个新函数 counting_sort_by_key。它的工作流程如下:

接收输入: 接收一个对象列表object_list和一个key函数。
提取键: 使用key函数,从object_list中提取出所有用于排序的键,形成一个纯整数的keys列表。
计算边界与计数: 在keys列表上执行计数排序的第一阶段和第二阶段,即找出键的最大最小值,创建并填充count_array,然后将其转换为累积计数数组。
放置对象(关键步骤): 这是与原版最大的不同。在第三阶段,我们遍历原始的object_list。对于每个对象,我们提取其键,根据键在累积计数数组中找到它的目标位置,然后,我们将整个对象放置到输出数组的这个位置上。

代码实现:counting_sort_by_key

# 定义一个用于演示的复杂对象
class Product:
    def __init__(self, product_id, category_id, stock_count):
        self.product_id = product_id       # 产品ID,可能是字符串
        self.category_id = category_id     # 类别ID,整数,范围可控
        self.stock_count = stock_count     # 库存数量,整数,范围可控

    def __repr__(self):
        # 定义一个方便查看的打印格式
        return f"Product(id='{
              self.product_id}', category={
              self.category_id}, stock={
              self.stock_count})"

def counting_sort_by_key(object_list, key):
    """
    一个通用的、稳定的计数排序实现,可以根据对象的特定整数属性进行排序。

    参数:
        object_list (list): 待排序的对象列表。
        key (function): 一个函数,当应用于列表中的一个对象时,返回一个用于排序的整数键。
                        通常是一个lambda函数,例如 `key=lambda p: p.category_id`

    返回:
        一个根据指定键稳定排序后的新对象列表。
    """
    if len(object_list) <= 1: # 处理边界情况
        return object_list[:]

    # 步骤 1: 提取所有用于排序的键
    keys = [key(obj) for obj in object_list]

    # --- 阶段一和二(在键上操作) ---
    min_key = min(keys) # 找到键的最小值
    max_key = max(keys) # 找到键的最大值

    count_array_size = max_key - min_key + 1 # 计算计数数组大小
    count_array = [0] * count_array_size # 初始化计数数组

    for k in keys: # 遍历键列表,统计频率
        count_array[k - min_key] += 1

    for i in range(1, count_array_size): # 计算累积和
        count_array[i] += count_array[i-1]

    # --- 阶段三: 放置对象 ---
    output_array = [None] * len(object_list) # 创建用于存放对象的输出数组

    # 从后向前遍历原始对象列表以保证稳定性
    for i in range(len(object_list) - 1, -1, -1):
        # 获取当前要放置的对象
        current_obj = object_list[i]
        # 提取该对象的键
        current_key = key(current_obj)
        
        # 从累积计数数组中找到该键的目标位置
        position = count_array[current_key - min_key]
        # 将整个对象放入输出数组的正确槽位
        output_array[position - 1] = current_obj
        
        # 更新该位置的计数值
        count_array[current_key - min_key] -= 1
        
    return output_array

# --- 示例:对产品列表按类别ID排序 ---
inventory = [
    Product('prod-003', 2, 88),
    Product('prod-101', 1, 120),
    Product('prod-007', 3, 50),
    Product('prod-005', 1, 200), # 与 prod-101 类别相同
    Product('prod-200', 2, 35), # 与 prod-003 类别相同
    Product('prod-042', 1, 75)  # 与 prod-101, prod-005 类别相同
]
print("--- 示例1:按 category_id 排序 ---")
print(f"原始库存列表:
{
              inventory}
")

# 使用lambda函数指定按 category_id 排序
sorted_by_category = counting_sort_by_key(inventory, key=lambda p: p.category_id)

print(f"按 category_id 稳定排序后的列表:")
for product in sorted_by_category:
    print(product)
# 由于排序是稳定的,相同category_id的产品,其原始相对顺序(prod-101, prod-005, prod-042)应被保留。

# --- 示例2:对同一列表按库存数量排序 ---
print("
--- 示例2:按 stock_count 排序 ---")
print(f"原始库存列表:
{
              inventory}
")

# 假设库存数量的范围也是可控的
sorted_by_stock = counting_sort_by_key(inventory, key=lambda p: p.stock_count)

print(f"按 stock_count 稳定排序后的列表:")
for product in sorted_by_stock:
    print(product)

这个counting_sort_by_key函数是计数排序思想的一次巨大飞跃。它将算法的核心逻辑(对整数的计数和定位)与具体的应用场景(按何种属性排序)完美地分离开来。通过传递一个简单的key函数,我们就能“指挥”计数排序去已关注我们感兴趣的任何整数维度,这极大地扩展了它的应用范围和灵活性。

4.3 另一种思路:数据转换与分组策略

counting_sort_by_key通过修改算法自身来适应复杂对象,这是一种“主动适应”的策略。是否存在另一种“被动适应”的策略呢?即,我们保持原始的counting_sort函数不变,通过对数据进行预处理和转换来让它适用于我们的函数。

一种常见的通用排序模式是**“装饰-排序-反装饰”(Decorate-Sort-Undecorate),也称作“Schwartzian Transform”**。其思想是:

装饰: 将每个对象转换成一个 (排序列, 原始对象) 的元组。
排序: 对这个元组列表进行排序。
反装饰: 从排好序的元组列表中,提取出原始对象。

然而,这个模式与我们那个只接受整数列表的counting_sort函数无法直接兼容。但这个“分组”和“关联”的思想给了我们启发,我们可以设计一种新的、基于数据转换的策略。

分组策略 (Grouping Strategy)

分组: 创建一个字典。遍历原始对象列表,以排序键为字典的key,将具有相同键的对象收集到一个列表中,作为字典的value
排序键: 提取字典中所有的key,形成一个纯整数列表。
调用排序: 使用我们原始的counting_sort函数,对这个key列表进行排序。
重建: 遍历排好序的key列表,根据每个key从字典中取出对应的对象列表,然后依次拼接起来,形成最终的排序结果。

代码实现:counting_sort_grouped

from collections import defaultdict

def counting_sort_grouped(object_list, key):
    """
    使用分组策略和原始的整数计数排序函数来对对象列表排序。
    (此方法为了教学目的,用以对比,它存在稳定性问题)

    参数:
        object_list (list): 待排序的对象列表。
        key (function): 一个提取整数键的函数。

    返回:
        一个根据键排序后的新对象列表。
    """
    if len(object_list) <= 1: # 处理边界情况
        return object_list[:]
    
    # 步骤 1: 按键对对象进行分组
    # defaultdict(list) 可以在key不存在时自动创建一个空列表
    grouped_objects = defaultdict(list)
    for obj in object_list:
        # 提取对象的键
        k = key(obj)
        # 将对象追加到对应键的列表中
        grouped_objects[k].append(obj)
    
    print("--- 步骤1:对象分组完成 ---")
    for k, v in grouped_objects.items():
        print(f"Key {
              k}: {
              v}")

    # 步骤 2: 提取所有唯一的键
    keys_to_sort = list(grouped_objects.keys())
    print(f"
--- 步骤2:提取待排序的键 ---")
    print(f"Keys: {
              keys_to_sort}")

    # 步骤 3: 调用原始的整数计数排序函数对键进行排序
    sorted_keys = counting_sort(keys_to_sort)
    print(f"
--- 步骤3:对键进行排序 ---")
    print(f"Sorted Keys: {
              sorted_keys}")

    # 步骤 4: 重建最终的排序列表
    final_sorted_list = []
    for sorted_k in sorted_keys:
        # 从字典中取出对应键的对象列表,并将其所有元素追加到最终结果中
        final_sorted_list.extend(grouped_objects[sorted_k])

    print(f"
--- 步骤4:重建列表完成 ---")
    return final_sorted_list

# --- 再次使用 inventory 数据进行测试 ---
print("

--- 使用分组策略进行排序测试 ---")
print(f"原始库存列表:
{
              inventory}
")

sorted_by_grouping = counting_sort_grouped(inventory, key=lambda p: p.category_id)

print(f"
使用分组策略排序后的列表:")
for product in sorted_by_grouping:
    print(product)

策略对比与“稳定性”的再审视

我们现在有了两种方法来为对象排序:counting_sort_by_key(改造算法)和 counting_sort_grouped(转换数据)。哪一种更好?

让我们仔细观察counting_sort_grouped的输出。对于category_id=1的三个产品'prod-101', 'prod-005', 'prod-042',它们在最终输出中的顺序,取决于它们被添加到grouped_objects[1]这个列表的顺序,以及extend方法的行为。这种顺序与它们在原始inventory列表中的相对顺序没有必然的联系defaultdict不保证值的顺序,即使它保留了键的插入顺序(在Python 3.7+)。因此,这个counting_sort_grouped方法是不稳定的。

counting_sort_by_key (主动适应):

优点: 稳定。通过从后向前遍历原始数组并直接放置对象,完美地保留了相同键元素的原始相对顺序。逻辑更直接,一次遍历即可完成放置。
缺点: 需要编写一个专门的、更复杂的排序函数版本。

counting_sort_grouped (被动适应):

优点: 可以复用最简单、最核心的counting_sort整数排序函数,逻辑上是“模块化”的。
缺点: 不稳定。对于需要多级排序或依赖稳定性的场景,这个方法是错误的。它还额外使用了O(n)的空间来创建字典,并涉及多次数据结构的转换。

结论: 对于需要根据对象属性进行稳定排序的场景,counting_sort_by_key是压倒性的胜利者。它深刻地体现了一个算法设计原则:当面对复杂数据结构时,与其进行复杂且可能丢失信息(如稳定性)的数据转换,不如直接改造算法的核心逻辑,使其能够理解和处理这种复杂性。这个选择,保证了算法行为的正确性和可预测性。

第五章:谱系与进化——基数排序,计数排序的终极形态

5.1 范围之墙的爆破手:基数排序的核心思想 (The Demolitionist of the Range Wall: The Core Idea of Radix Sort)

想象一下,我们要对一百万个8位数的电话号码进行排序。

n = 1,000,000
k 的范围大约是 10^8
如果直接使用计数排序,我们需要一个大小为一亿的count_array,这在空间和时间上都是一场灾难。

基数排序的洞察力在于:我们真的需要一次性地已关注这整个8位数吗?一个号码13812345678的大小,是由其每一位上的数字共同决定的。高位上的数字,比低位上的数字具有更高的“权重”。基数排序正是利用了这一点。

LSD(Least Significant Digit first)基数排序的思想

LSD基数排序,是“最低位优先”的意思。它的工作流程,就像图书馆管理员整理卡片一样,极具章法和耐心:

准备工作: 确定所有数字中的最大值,从而知道我们总共需要处理多少“位”。例如,如果最大值是987,我们就需要处理3位(个、十、百)。
第一轮:按最低位(个位)排序:

完全忽略十位和百位,只看每个数字的个位 (d=0)。
使用一个稳定的排序算法(通常是计数排序),对整个列表按照个位进行排序。
排序后,列表的顺序将是 [..., 1, ..., 2, ..., 3, ...] 这样按个位升序排列。

第二轮:按次低位(十位)排序:

在上一轮排好序的列表基础上,现在我们只看每个数字的十位 (d=1)。
再次使用那个稳定的排序算法,对列表按照十位进行排序。
由于排序是稳定的,对于十位相同的数字(例如 1585),它们在上一轮中由个位决定的相对顺序(1585之前)将被保留下来。

第三轮:按最高位(百位)排序:

在第二轮排序结果的基础上,我们看每个数字的百位 (d=2)。
再次使用稳定的排序算法,按百位对列表进行排序。

完成: 当处理完所有数位后,整个列表就奇迹般地完全有序了。

为什么LSD可行?稳定性的魔力

LSD基数排序的正确性,完全依赖于其子排序算法的稳定性。让我们通过一个简单的例子来理解:[170, 45, 75, 90, 802, 24, 2, 66]

原始列表: [170, 45, 75, 90, 802, 24, 2, 66]

第一轮 (按个位排序):

个位分别是 0, 5, 5, 0, 2, 4, 2, 6
使用稳定的计数排序后,我们得到:
[170, 90, 802, 2, 24, 45, 75, 66]
(注意:17090之前,8022之前,4575之前,因为它们在原始列表中的顺序就是如此,稳定性得以保持。)

第二轮 (按十位排序):

在上一结果基础上,看十位:7, 9, 0, 0, 2, 4, 7, 6
再次稳定排序后:
[802, 2, 24, 45, 66, 170, 75, 90]
(关键点:看17075。它们的十位都是7。在上一轮中,17075之前,所以这一轮稳定排序后,170依然在75之前!8022的十位都是08022之前,所以它依然在前面。)

第三轮 (按百位排序):

在上一结果基础上,看百位:8, 0, 0, 0, 0, 1, 0, 0
再次稳定排序后:
[2, 24, 45, 66, 75, 90, 170, 802]
(所有百位为0的数字,它们之间的相对顺序是由第二轮排好的十位顺序决定的,所以它们是 2, 24, 45, 66, 75, 90。然后是百位为1的170,最后是百位为8的802。)

最终结果: [2, 24, 45, 66, 75, 90, 170, 802],完全有序!

基数排序将一个“大范围k”的排序问题,分解成了d个(d是数字的位数)“小范围k”的排序问题。对于十进制数,每一位的范围都是0-9,所以k=10。对于二进制数,每一位的范围是0-1k=2。这使得作为其子程序的计数排序,总是在其最擅长的、k值极小的理想条件下运行。

5.2 基石的复用:用counting_sort_by_key实现基数排序

现在,我们拥有了实现基数排序所需的一切:清晰的LSD思想,以及一个强大、稳定、可接受key函数的counting_sort_by_key。我们要做的事情,就是将它们组装起来。

我们的LSD基数排序函数需要做以下几件事:

找出列表中的最大值,以确定我们需要迭代多少轮(即最大数字有多少“位”)。
进入一个循环,从最低位开始,一轮一轮地向最高位处理。
在每一轮循环中,定义一个key函数,这个key函数的功能是提取出当前正在处理的那一位数字
调用counting_sort_by_key,并把当前的列表和这个动态生成的key函数传给它。
用排序后的结果,覆盖掉旧的列表,作为下一轮循环的输入。

核心挑战:提取特定数位的key函数
如何写一个函数,能从数字 num 中,提取出第 d 位(d=0是个位,d=1是十位…)的数字?
我们可以利用整数除法和取模运算:
digit = (num // (10**d)) % 10

10**d: 计算出当前位对应的权重(1, 10, 100, …)。
num // (10**d): 通过整除,将我们不关心的、更低位的数字全部“砍掉”。例如,对于170d=1(十位),170 // 10 = 17
% 10: 对结果取10的模,即可得到我们想要的那个数位的数字。17 % 10 = 7

代码实现:radix_sort_lsd

# 假设我们在一个文件中已经拥有了之前实现的 counting_sort_by_key 函数
# from chapter_4 import counting_sort_by_key

def radix_sort_lsd(number_list):
    """
    使用LSD(最低位优先)基数排序对非负整数列表进行排序。
    本实现以我们之前构建的 counting_sort_by_key 为核心子程序。

    参数:
        number_list (list): 一个只包含非负整数的列表。

    返回:
        一个包含相同数字但已排好序的新列表。
    """
    # 处理边界情况
    if len(number_list) <= 1:
        return number_list[:]

    # 步骤 1: 找出列表中的最大值,以确定最大位数
    max_value = max(number_list)

    # --- 迭代处理每一位 ---
    digit_place = 1 # 代表当前处理的数位权重 (1 for a, 10 for tens, etc.)
    # 只要最大值除以当前的数位权重还大于0,就说明还有更高位需要处理
    
    # 我们需要一个可变的列表来进行迭代排序
    sorted_list = number_list[:]

    while max_value // digit_place > 0:
        print(f"
--- 开始处理数位 (权重: {
              digit_place}) ---")
        
        # 步骤 3: 动态定义用于提取当前数位的 key 函数
        # 使用 lambda 表达式来简洁地定义这个函数
        get_digit_key = lambda num: (num // digit_place) % 10
        
        print(f"当前列表状态: {
              sorted_list}")
        
        # 步骤 4: 调用稳定的计数排序,按当前数位进行排序
        # a, a, a, a, a, a, a.
        sorted_list = counting_sort_by_key(sorted_list, key=get_digit_key)
        
        print(f"按该数位排序后: {
              sorted_list}")
        
        # 准备处理下一位(更高一位)
        digit_place *= 10
        
    return sorted_list

# --- 示例测试 ---
test_data = [170, 45, 75, 90, 802, 24, 2, 66]
print("--- 基数排序测试 ---")
print(f"原始数据: {
              test_data}")
final_sorted = radix_sort_lsd(test_data)
print(f"
最终排序结果: {
              final_sorted}")
assert final_sorted == sorted(test_data)
print("验证通过!")

# --- 更大数据量的测试 ---
import random
large_test_data = [random.randint(0, 999999) for _ in range(20)]
print("

--- 大整数基数排序测试 ---")
print(f"原始数据 (部分): {
              large_test_data[:10]}...")
final_large_sorted = radix_sort_lsd(large_test_data)
print(f"
最终排序结果 (部分): {
              final_large_sorted[:10]}...")
assert final_large_sorted == sorted(large_test_data)
print("验证通过!")

这段代码优雅地展示了算法的“组合”之美。我们没有重新发明轮子,而是将一个已经打磨好的、稳定的组件(counting_sort_by_key),通过一个巧妙的迭代框架(radix_sort_lsd),组合成了一个功能更强大的新算法。这个新算法,成功地规避了原组件的致命弱点(对k的敏感),将其应用范围扩展到了任意大的非负整数。

5.3 性能分析与“基数”的选择 (Performance Analysis and the Choice of “Radix”)

时间复杂度分析

让我们来分析radix_sort_lsd的时间复杂度。

d 为列表中最大数字的位数。
b 为我们选择的基数(在上面的例子中,我们隐式地选择了 b=10)。
d 的值约等于 log_b(max_value)
我们的主循环会执行 d 次。
在每一次循环中,我们都会调用一次counting_sort_by_key。这个子程序的key函数返回的值范围是 0b-1。因此,对于这个子程序来说,它的 k 值就是我们选择的基数 b
所以,每一次循环的时间成本是 O(n + b)

总时间复杂度: d * O(n + b) = O(d * (n + b))

这个公式揭示了一个非常有趣的权衡。

“基数”的选择:一个微妙的权衡

在上面的实现中,我们选择了基数10,即每次处理一位十进制数。但我们完全可以选择其他的基数。例如,我们可以选择基数256

选择基数256的含义: 这意味着我们将一个整数看作一个字节(byte)序列。一个32位的整数,可以被看作4个字节。我们每次处理一个字节(8个比特位)。
优点:

d 的值会减小。对于一个32位整数,d = 4。而如果按十进制处理,d最大可以到10。循环次数变少了。
提取字节的操作通常比十进制的除法和取模更快,可以通过位运算(右移和与操作)高效完成。

缺点:

b 的值增大了。b=256
子程序计数排序的成本从 O(n+10) 变成了 O(n+256)count_array变大了。

时间复杂度公式的再审视: O(d * (n + b))

如果b选得太小(例如b=2,按二进制位处理),d就会变得很大(对于32位整数,d=32),总成本是 32 * O(n+2)
如果b选得太大(例如b=n),那么d会很小,但总成本是 O(d * (n+n)) = O(d*n),并且count_array可能会非常大。

在实践中,通常会选择一个使得 bd 之间达到某种平衡的值。选择 b2^8=256(处理字节)或2^{16}=65536(处理两个字节)是常见的做法,因为它们与计算机的底层数据表示方式(字节)能够很好地对齐,并且可以通过高效的位运算来提取“数位”。

代码实现:基于字节的基数排序
让我们来实现一个更高效的、基于字节处理的基数排序版本。

def radix_sort_bytes(integer_list):
    """
    使用LSD基数排序,但每次处理一个字节(8位)作为“数位”。
    这通常比处理十进制位更高效。

    参数:
        integer_list (list): 一个只包含非负整数的列表。

    返回:
        一个排好序的新列表。
    """
    # 32位无符号整数最多需要4个字节,64位需要8个字节。
    # 我们假设处理64位整数,所以最多迭代8轮。
    BYTES_IN_INT = 8 
    
    sorted_list = integer_list[:]

    # 迭代处理每一个字节,从最低位的字节到最高位的字节
    for byte_offset in range(BYTES_IN_INT):
        # bit_shift_amount: 当前字节需要向右移动多少位才能到达最低位
        bit_shift_amount = byte_offset * 8
        
        print(f"
--- 处理字节 #{
              byte_offset} (位移: {
              bit_shift_amount}) ---")
        
        # 定义key函数,用于提取特定字节的值
        # 1. (num >> bit_shift_amount): 将目标字节移动到数字的最低位部分
        # 2. & 0xFF: (0xFF 是二进制的 11111111) 通过位与操作,屏蔽掉所有其他更高位的比特,只保留最低的8位(即我们的目标字节)
        get_byte_key = lambda num: (num >> bit_shitf_amount) & 0xFF
        
        # 调用我们的稳定计数排序核心。这里的 k 固定为 256。
        sorted_list = counting_sort_by_key(sorted_list, key=get_byte_key)
        
        # 打印部分结果用于追踪
        # print(f"按该字节排序后: {sorted_list}")
        
    return sorted_list

# --- 测试基于字节的基数排序 ---
large_test_data_2 = [random.randint(0, 2**32 - 1) for _ in range(20)] # 生成32位整数
print("

--- 基于字节的基数排序测试 ---")
print(f"原始数据 (部分): {
              large_test_data_2[:10]}...")

start_time = time.perf_counter()
final_byte_sorted = radix_sort_bytes(large_test_data_2)
end_time = time.perf_counter()
print(f"基于字节的基数排序耗时: {
              end_time - start_time:.6f} 秒")

# 对比十进制版本
start_time = time.perf_counter()
final_decimal_sorted = radix_sort_lsd(large_test_data_2)
end_time = time.perf_counter()
print(f"基于十进制的基数排序耗时: {
              end_time - start_time:.6f} 秒")

assert final_byte_sorted == sorted(large_test_data_2)
assert final_decimal_sorted == sorted(large_test_data_2)
print("两个版本的排序结果均验证通过!")

通过对比两个版本的耗时,你通常会发现基于字节的版本性能更优,因为它更贴近计算机处理数据的方式,并且迭代次数更少。

基数排序是计数排序思想的伟大胜利。它通过分治和迭代,完美地绕开了计数排序最致命的缺陷,将其应用范围从“小范围整数”一举扩展到了“任意大整数”,是“以空间换时间”和“稳定性”这两个特性的集大成者。

第六章:算法的炼金术——计数排序在图像直方图均衡化中的妙用

6.1 从排序到统计:直方图,计数排序的第一天性 (From Sorting to Statistics: Histogram, the First Nature of Counting Sort)

让我们重新审视计数排序的第一阶段。我们做了什么?我们创建了一个count_array,然后遍历输入数据,将每个值对应的计数器加一。这个过程的最终产物count_array,其本质是什么?

它就是一个直方图(Histogram)

直方图是一种对数据分布情况的图形化表示。它将数据的整个范围划分为一系列的“桶(bins)”,然后统计每个“桶”中落入了多少数据点。在计数排序的语境下:

每一个可能出现的整数值,就是一个“桶”。
count_array每一个索引,就代表一个“桶”。
count_array在每个索引上存储的值,就是该“桶”中的数据点数量(即频率)。

因此,计数排序的第一阶段,本身就是一个高度优化的、专门用于计算整数数据直方图的算法。

代码实现:通用的直方图计算器
我们可以将第一阶段的逻辑,抽象成一个独立的、更有通用性的函数。

from collections.abc import Iterable

def compute_integer_histogram(data_stream, value_range=None):
    """
    基于计数排序第一阶段的原理,高效计算整数数据流的直方图。

    参数:
        data_stream (Iterable): 一个包含整数的可迭代对象。
        value_range (tuple, optional): 一个 (min_val, max_val) 元组,预先指定了我们关心的值的范围。
                                       如果为None,则会自动从数据中计算范围。

    返回:
        一个元组 (histogram, min_val),其中:
        - histogram (list): 频率列表,histogram[i] 代表值为 (i + min_val) 的元素出现的次数。
        - min_val (int): 直方图表示的最小值。
    """
    if not isinstance(data_stream, Iterable): # 检查输入是否可迭代
        raise TypeError("输入数据必须是可迭代的。")

    data_list = list(data_stream) # 将迭代器物化为列表以便多次使用
    if not data_list:
        return [], 0
    
    # 确定值的范围
    if value_range: # 如果用户指定了范围
        min_val, max_val = value_range
    else: # 否则自动从数据中寻找
        min_val = min(data_list)
        max_val = max(data_list)

    # 创建并初始化直方图数组(即我们的 count_array)
    histogram_size = max_val - min_val + 1
    histogram = [0] * histogram_size

    # 核心计数逻辑
    for value in data_list:
        # 只关心在指定范围内的数据
        if min_val <= value <= max_val:
            # 计算索引并增加计数值
            index = value - min_val
            histogram[index] += 1
            
    return histogram, min_val

# --- 示例:分析文本中字母出现的频率 ---
text_data = "Hello World! This is a test for histogram computation."
# 我们只关心小写字母 'a' 到 'z'
# ord('a') = 97, ord('z') = 122
char_codes = [ord(c) for c in text_data.lower()]

# 计算小写字母的直方图
letter_histogram, min_letter_code = compute_integer_histogram(
    char_codes, 
    value_range=(ord('a'), ord('z'))
)

print("--- 文本中各字母出现频率的直方图 ---")
# 打印结果
for i, count in enumerate(letter_histogram):
    if count > 0: # 只打印出现过的字母
        character = chr(i + min_letter_code)
        print(f"字符 '{
              character}': {
              '*' * count} ({
              count})")

这个compute_integer_histogram函数,就是计数排序思想的第一次“炼金”尝试。我们提炼出了它的“频率统计”能力,并将其应用到了一个通用的数据分析任务上。接下来,我们将更进一步,利用其“累积分布计算”的能力,去施展真正的“魔法”。

6.2 图像增强的魔法:直方图均衡化 (The Magic of Image Enhancement: Histogram Equalization)

理论深潜

问题: 什么是“低对比度”图像?想象一张在阴天拍摄的照片,整个画面看起来灰蒙蒙的,缺乏细节。从数据的角度看,这意味着图像中所有像素的亮度值,都挤在一个非常狭窄的范围内(例如,大部分像素的亮度都在80到150之间,而亮度范围本可以是0到255)。

直方图视角: 如果我们绘制这张低对比度图像的亮度直方图,我们会看到一个“驼峰”挤在中间,而两端(纯黑和纯白区域)几乎没有像素。

目标: 直方图均衡化的目标,就是对这个直方图进行一次“拉伸”和“重分布”,使得新的直方图在整个亮度范围(0-255)内尽可能地平坦和均匀。一个更均匀的直方图,意味着图像的亮度层次更丰富,动态范围更广,从而在视觉上获得更高的对比度。

数学核心:累积分布函数 (Cumulative Distribution Function, CDF)
均衡化的变换函数T(r),即将原始像素亮度r映射到新的像素亮度s的公式,其基础正是该图像的累积分布函数(CDF)。
对于一个亮度范围为[0, L-1](对于8位灰度图,L=256)的图像,其归一化的CDF定义为:
CDF(r) = Σ (从i=0到r) p(i)
其中 p(i) 是亮度值i出现的概率(即 频率 / 总像素数)。

CDF(r)的含义是:图像中亮度值小于或等于r的像素所占的比例。

“啊哈!”时刻:
请仔细看CDF的定义!Σ (从i=0到r) p(i)。这不就是我们计数排序第二阶段所做的事情吗?

p(i)的分子(频率),就是我们用compute_integer_histogram计算出来的直方图!
对这个直方图进行累积求和,得到的就是CDF的分子部分!

因此,计数排序的第二阶段,天然地就是在计算CDF。这就是我们将计数排序思想应用于直方图均衡化的理论基石。

代码实现:从零构建直方图均衡化流水线

我们将使用Pillow库来处理图像,使用numpy来高效地操作像素数组。如果尚未安装,请运行 pip install Pillow numpy

import numpy as np
from PIL import Image

def histogram_equalization(image):
    """
    对输入的灰度图像执行直方图均衡化。

    参数:
        image (PIL.Image.Image): 一个Pillow图像对象,必须是灰度图 ('L' mode)。

    返回:
        一个经过均衡化处理的新的Pillow图像对象。
    """
    if image.mode != 'L': # 检查图像是否为灰度图
        raise ValueError("此函数只接受灰度图像 ('L' mode)。")

    # 将Pillow图像对象转换为一个Numpy数组,以便进行数学计算
    img_array = np.array(image)

    # --- 步骤 1: 计算图像的直方图 (计数排序第一阶段) ---
    # img_array.flatten() 将二维图像数组展平为一维像素值列表
    # 灰度图的像素值范围是固定的 [0, 255]
    hist, _ = compute_integer_histogram(img_array.flatten(), value_range=(0, 255))
    
    # --- 步骤 2: 计算累积分布函数 (CDF) (计数排序第二阶段) ---
    # a. 计算累积和
    cdf = np.array(hist).cumsum()
    # b. 归一化CDF:将CDF的值缩放到 [0, 255] 范围内
    #   - cdf.min() 是第一个非零计数的累积值
    #   - len(img_array.flatten()) 是总像素数
    #   - (cdf - cdf.min()) * 255 / (total_pixels - cdf.min()) 是归一化公式
    total_pixels = img_array.size
    cdf_normalized = (cdf - cdf.min()) * 255 / (total_pixels - cdf.min())
    # 将结果转换为整数,这就是我们的“查找表”(Look-Up Table, LUT)
    lookup_table = cdf_normalized.astype('uint8')

    print("--- 查找表 (LUT) 已生成 ---")
    print(f"LUT (部分): {
              lookup_table[:20]}...")

    # --- 步骤 3: 映射新像素值 ---
    # np.interp 是一个强大的函数,但这里我们可以用更快的LUT索引
    # new_img_array[i, j] = lookup_table[img_array[i, j]]
    # Numpy的这种索引方式极其高效,它会为img_array中的每个元素,
    # 去lookup_table中查找其对应的新值,并构建一个新数组。
    new_img_array = lookup_table[img_array]

    # 将处理后的Numpy数组转换回Pillow图像对象
    equalized_image = Image.fromarray(new_img_array)

    return equalized_image, hist, lookup_table

# --- 创建一个低对比度的示例图像用于测试 ---
def create_low_contrast_image(width, height):
    """编程方式创建一个灰蒙蒙的低对比度图像"""
    # 创建一个在中间亮度范围 (80-160) 的随机噪声数组
    array = np.random.randint(80, 160, size=(height, width), dtype=np.uint8)
    return Image.fromarray(array)

# --- 主执行流程 ---
# 1. 创建或加载图像
try:
    # 尝试加载一个真实存在的图片,请替换为你的图片路径
    original_image = Image.open('your_image.jpg').convert('L')
    print("成功加载外部图像。")
except FileNotFoundError:
    print("未找到'your_image.jpg',将创建一个程序化的低对比度图像。")
    original_image = create_low_contrast_image(400, 300)

# 2. 执行直方图均衡化
equalized_image, original_hist, lut = histogram_equalization(original_image)

# 3. 保存和显示结果 (在一个支持GUI的环境中)
original_image.save("original_image.png")
equalized_image.save("equalized_image.png")
print("
原始图像和均衡化后的图像已保存为 original_image.png 和 equalized_image.png")

# 可选:绘制直方图以便对比
try:
    import matplotlib.pyplot as plt
    
    # 绘制原始直方图
    plt.figure(figsize=(12, 6))
    plt.subplot(1, 2, 1)
    plt.title("Original Histogram")
    plt.bar(range(256), original_hist, color='gray')
    plt.xlabel("Pixel Intensity")
    plt.ylabel("Frequency")

    # 绘制均衡化后的图像的直方图
    equalized_hist, _ = compute_integer_histogram(np.array(equalized_image).flatten(), value_range=(0, 255))
    plt.subplot(1, 2, 2)
    plt.title("Equalized Histogram")
    plt.bar(range(256), equalized_hist, color='gray')
    plt.xlabel("Pixel Intensity")

    plt.tight_layout()
    plt.savefig("histograms.png")
    print("直方图对比图已保存为 histograms.png")
    # plt.show() # 如果在Jupyter Notebook或类似环境中,可以取消此行注释以直接显示
except ImportError:
    print("
Matplotlib未安装,无法绘制直方图。请运行 'pip install matplotlib'。")

这个完整的流水线,将计数排序的思想发挥得淋漓尽致。我们没有“排序”任何东西,但我们使用了计数排序的全部核心机制:

第一阶段(计数) 被用来计算直方图。
第二阶段(累积计数) 被用来计算CDF。
这个例子雄辩地证明,计数排序远不止是一个排序算法,它是一种强大的、可用于解决实际科学计算问题的数据分布分析模式

6.3 超越灰度:彩色图像的均衡化之道 (Beyond Grayscale: The Path to Color Image Equalization)

直接对彩色图像的R、G、B三个通道分别进行直方图均衡化,是一个常见但通常效果不佳的错误做法。因为R、G、B三个通道是高度相关的,独立地改变它们的分布,会严重破坏图像原始的色彩平衡,导致奇怪的颜色偏移。

正确的、更专业的方法是,将图像从RGB色彩空间转换到一个能够将**亮度(Luminance/Intensity)色度(Chrominance/Color)**分离开来的色彩空间,例如HSV(色相、饱和度、明度)或YCbCr

HSV色彩空间:

H (Hue): 色相,即我们通常所说的颜色(红色、绿色、蓝色等)。
S (Saturation): 饱和度,即颜色的纯度或鲜艳程度。
V (Value): 明度,即颜色的明亮程度,等同于灰度图中的亮度。

高级策略:

转换: 将原始的RGB彩色图像,转换为HSV色彩空间。
提取: 将HSV图像分离成H, S, V三个独立的通道。
均衡化: 只对V(明度)通道执行我们之前实现的直方图均衡化。
合并: 将被增强过的新的V通道,与原始的H和S通道重新合并,形成一个新的HSV图像。
逆转换: 将这个新的HSV图像,转换回RGB色彩空间,以便显示和存储。

通过这种方式,我们只改变了图像的明暗对比,而完全没有触动其原始的色彩信息(色相和饱和度),从而在增强细节的同时,保持了颜色的真实性。

代码实现:彩色图像的HSV均衡化

def color_histogram_equalization(rgb_image):
    """
    对彩色图像进行直方图均衡化,以保持色彩保真度。
    该方法通过在HSV色彩空间的V(明度)通道上进行均衡化来实现。

    参数:
        rgb_image (PIL.Image.Image): 一个Pillow图像对象,必须是RGB模式。

    返回:
        一个经过均衡化处理的新的RGB Pillow图像对象。
    """
    if rgb_image.mode != 'RGB':
        raise ValueError("此函数只接受RGB彩色图像。")

    # 步骤 1 & 2: 将RGB图像转换为HSV并分离通道
    # .convert('HSV') 将图像转换到HSV色彩空间
    hsv_image = rgb_image.convert('HSV')
    # .split() 将多通道图像分离成单个通道的图像元组 (H, S, V)
    h_channel, s_channel, v_channel = hsv_image.split()

    # 步骤 3: 只对V(明度)通道进行均衡化
    # v_channel 本身就是一个 'L' 模式的灰度图,可以直接使用我们的函数
    equalized_v_channel, _, _ = histogram_equalization(v_channel)

    # 步骤 4: 将增强后的V通道与原始的H, S通道合并
    # Image.merge(mode, channels_tuple)
    new_hsv_image = Image.merge('HSV', (h_channel, s_channel, equalized_v_channel))

    # 步骤 5: 将新的HSV图像逆转换回RGB模式
    final_rgb_image = new_hsv_image.convert('RGB')
    
    return final_rgb_image

# --- 主执行流程 (彩色版本) ---
try:
    color_original = Image.open('your_color_image.jpg').convert('RGB')
    print("
--- 开始处理彩色图像 ---")
    
    # 执行彩色图像均衡化
    color_equalized = color_histogram_equalization(color_original)
    
    # 保存结果
    color_original.save("color_original.png")
    color_equalized.save("color_equalized.png")
    print("原始彩色图像和均衡化后的图像已保存。")
    
except FileNotFoundError:
    print("
未找到'your_color_image.jpg',跳过彩色图像处理部分。")

这个彩色图像均衡化的例子,将计数排序的应用深度推向了一个新的层次。它不仅仅是一个算法的应用,更是一种系统性解决问题的思维体现:面对一个复杂问题(保持色彩的对比度增强),我们首先通过“领域知识”(色彩空间理论)将其分解,识别出可以应用我们核心工具(计数排序思想)的关键部分(V通道),在解决关键部分后,再将其整合回原始的复杂系统中。这种“分解-处理-整合”的模式,是高级软件工程和算法应用的精髓所在。

第七章:战地工程学——健壮性、向量化优化与生产级实践

7.1 现实的考验:优雅地处理缺失与异常数据 (The Gauntlet of Reality: Gracefully Handling Missing and Malformed Data)

我们之前的所有实现都基于一个美好的假设:输入的数据是干净、类型统一的整数。然而,从数据库、API或用户文件中获取的真实数据,往往是“肮脏”的。

缺失值: 列表可能包含None
错误类型: 列表中可能混入了字符串、浮点数或其他对象。

我们当前的counting_sort_by_key在遇到这些情况时,会毫不留情地抛出TypeErrorAttributeError并崩溃。一个生产级的函数,必须能预见并处理这些情况。

策略设计
对于异常数据,我们有几种处理策略:

严格模式 (Strict Mode): 遇到任何不符合预期的类型,立即抛出明确的异常。这是默认行为,但在很多场景下不够灵活。
忽略策略 (Ignore Strategy): 自动过滤掉所有None值或无法应用key函数的元素。
排序策略 (Placement Strategy): 将None值视为一种特殊的、可排序的元素,并将它们统一放置在结果的最前面或最后面。

我们将实现一个更健壮的版本,它允许调用者通过参数来选择处理策略。

代码实现:counting_sort_robust

import functools

# 定义一个自定义异常,以便更清晰地报告问题
class DataRangeError(ValueError):
    """当数据范围k过大时抛出此异常。"""
    pass

def counting_sort_robust(
    object_list,
    key,
    none_handling='ignore',  # 'ignore', 'first', 'last'
    error_handling='ignore'  # 'ignore', 'raise'
):
    """
    一个生产级的、健壮的计数排序实现,增加了对None值和错误类型的处理能力。

    参数:
        object_list (list): 待排序的对象列表,可能包含None或错误类型。
        key (function): 提取整数键的函数。
        none_handling (str): 'ignore' - 忽略None值;'first' - 将None放在最前面;'last' - 将None放在最后面。
        error_handling (str): 'ignore' - 忽略无法处理的元素;'raise' - 遇到错误时抛出TypeError。

    返回:
        一个稳定排序后的新列表。
    """
    if not object_list:
        return []

    # --- 步骤 1: 数据预处理与清理 ---
    valid_objects = [] # 存放有效、可处理的对象
    keys = []          # 存放从有效对象中提取的键
    none_items = []    # 存放遇到的None值
    
    for obj in object_list:
        if obj is None: # 如果对象是None
            if none_handling != 'ignore': # 如果策略不是忽略
                none_items.append(None) # 就收集起来
            continue # 跳过后续处理

        try:
            # 尝试应用key函数获取键
            k = key(obj)
            # 检查键是否为整数
            if not isinstance(k, int):
                raise TypeError(f"键 '{
              k}' 不是整数。")
            
            # 如果一切正常,将对象和键分别存入有效列表
            valid_objects.append(obj)
            keys.append(k)
        except (TypeError, AttributeError) as e: # 捕获应用key时可能发生的错误
            if error_handling == 'raise': # 如果策略是抛出异常
                raise TypeError(f"无法处理对象 '{
              obj}': {
              e}")
            # 否则,默认的 'ignore' 策略会直接跳过这个错误对象

    # 如果清理后没有有效数据,则根据none_handling策略返回结果
    if not valid_objects:
        return none_items

    # --- 步骤 2: 在有效数据上执行核心计数排序逻辑 ---
    min_key = min(keys)
    max_key = max(keys)
    
    count_array_size = max_key - min_key + 1
    # (在7.3节,我们会在这里加入范围检查)
    count_array = [0] * count_array_size
    
    for k in keys:
        count_array[k - min_key] += 1
        
    for i in range(1, count_array_size):
        count_array[i] += count_array[i-1]
        
    # --- 步骤 3: 放置有效对象 ---
    sorted_valid_objects = [None] * len(valid_objects)
    for i in range(len(valid_objects) - 1, -1, -1):
        obj = valid_objects[i]
        k = keys[i]
        pos = count_array[k - min_key]
        sorted_valid_objects[pos - 1] = obj
        count_array[k - min_key] -= 1
        
    # --- 步骤 4: 合并None值与排序结果 ---
    if none_handling == 'first': # 如果None应该在最前面
        return none_items + sorted_valid_objects
    elif none_handling == 'last': # 如果None应该在最后面
        return sorted_valid_objects + none_items
    else: # 默认的 'ignore' 策略
        return sorted_valid_objects


# --- 健壮性测试 ---
messy_data = [
    User('Alice', 2, '2022-03-15'),
    None,                           # 缺失值
    User('Bob', 1, '2021-08-20'),
    User('Charlie', 2, '2022-01-10'),
    "a wild string appears",        # 错误类型
    User('David', 3, '2023-05-01'),
]

print("--- 测试健壮的计数排序 ---")
print(f"原始脏数据:
{
              messy_data}
")

# 测试1: 忽略所有错误和None
print("--- 策略: none_handling='ignore', error_handling='ignore' ---")
result_ignore = counting_sort_robust(messy_data, key=lambda u: u.level)
for item in result_ignore: print(item)

# 测试2: 将None放在最前面
print("
--- 策略: none_handling='first', error_handling='ignore' ---")
result_first = counting_sort_robust(messy_data, key=lambda u: u.level, none_handling='first')
for item in result_first: print(item)

# 测试3: 将None放在最后面
print("
--- 策略: none_handling='last', error_handling='ignore' ---")
result_last = counting_sort_robust(messy_data, key=lambda u: u.level, none_handling='last')
for item in result_last: print(item)

# 测试4: 遇到错误时抛出异常
print("
--- 策略: error_handling='raise' ---")
try:
    counting_sort_robust(messy_data, key=lambda u: u.level, error_handling='raise')
except TypeError as e:
    print(f"成功捕获到预期的异常: {
              e}")

这个counting_sort_robust版本,通过一个清晰的数据清理阶段和灵活的策略参数,将一个脆弱的“实验室算法”改造成了一个能够抵御现实世界数据冲击的“工程级工具”。

7.2 NumPy的加持:向量化带来的性能飞跃 (The NumPy Advantage: The Performance Leap from Vectorization)

纯Python的循环,对于解释器来说,每一步都需要进行类型检查和指令分派,其执行效率与底层编译语言(如C)相差甚远。当我们处理百万甚至千万级别的数据时(n很大),即使算法是线性的,Python循环本身的开销也会成为显著的性能瓶颈。

NumPy库的核心优势在于向量化(Vectorization)。它允许我们将整个循环操作,表示为一个单一的、在数组上执行的语句。这个语句的底层实现,是高度优化的、在连续内存块上运行的C或Fortran代码,它绕过了Python解释器的慢速循环,从而带来数量级的性能提升。

用NumPy重构计数排序

我们将利用NumPy的几个核心函数来重塑我们的算法:

np.bincount: 这是NumPy版的“直方图计算器”。np.bincount(arr)会返回一个数组,其i位置的值是arri出现的次数。它就是为计数排序的第一阶段量身定做的!
np.cumsum: 计算数组的累积和。完美对应我们的第二阶段。
高级索引: NumPy强大的索引能力,可以让我们在不使用显式Python循环的情况下,完成第三阶段的放置操作。

代码实现:counting_sort_numpy

import numpy as np
import time

def counting_sort_numpy(input_array):
    """
    一个使用NumPy进行向量化操作的、超高速的计数排序版本。
    注意:为了性能,此版本只处理非负整数数组。

    参数:
        input_array (list or np.ndarray): 包含非负整数的待排序序列。

    返回:
        一个排好序的新的NumPy数组。
    """
    if not isinstance(input_array, np.ndarray): # 如果输入不是Numpy数组
        input_array = np.array(input_array, dtype=int) # 将其转换为Numpy整数数组

    # --- 阶段一: 计数 (向量化) ---
    # np.bincount 直接完成了频率统计,返回的数组长度是 input_array.max() + 1
    # 它的效率远高于Python的for循环计数
    counts = np.bincount(input_array)

    # --- 阶段二: 计算累积计数 (向量化) ---
    # np.cumsum 直接计算累积和
    cumulative_counts = counts.cumsum()
    
    # --- 阶段三: 放置排序 (向量化) ---
    # 这是一个非常巧妙的NumPy技巧
    # 1. np.repeat(np.arange(len(counts)), counts):
    #    - np.arange(len(counts)) 生成 [0, 1, 2, ..., max_val]
    #    - counts 是每个数字的频率
    #    - np.repeat 会根据counts中的频率,重复对应的数字。
    #      例如,如果arange是[0,1,2], counts是[2,0,3],结果就是[0,0,2,2,2]
    #    这一个操作,就等价于我们第三阶段的整个循环,直接生成了排序后的数组!
    sorted_array = np.repeat(np.arange(len(counts)), counts)
    
    return sorted_array

# --- 性能对比测试 ---
print("

--- NumPy向量化性能测试 ---")
# 创建一个符合计数排序优势场景的大数据集
n_large = 20_000_000 # 两千万个元素
k_range_large = (0, 1000) # 范围可控
large_data = [random.randint(k_range_large[0], k_range_large[1]) for _ in range(n_large)]

# 测试我们之前实现的纯Python版本 (需要非负数,所以用一个简化版)
def counting_sort_simple_python(arr):
    if not arr: return []
    max_val = max(arr)
    counts = [0] * (max_val + 1)
    for x in arr:
        counts[x] += 1
    sorted_arr = []
    for val, count in enumerate(counts):
        sorted_arr.extend([val] * count)
    return sorted_arr

print(f"测试数据规模: n={
              n_large}, k≈{
              k_range_large[1]}")

start = time.perf_counter()
# sorted_py = counting_sort_simple_python(large_data) # 这个版本非常慢,可以跳过
# 我们用我们第二章的完整版,它更快一些
# 为了公平,假设数据都是非负的
# sorted_py = counting_sort(large_data)
# 为了避免运行时间过长,这里注释掉,但你可以自己运行来感受差异
# end = time.perf_counter()
# print(f"纯Python版本耗时: {end - start:.4f} 秒") 

# 测试NumPy版本
# 先将Python列表转换为NumPy数组,这本身也需要时间,但通常是值得的
numpy_data = np.array(large_data)
start = time.perf_counter()
sorted_np = counting_sort_numpy(numpy_data)
end = time.perf_counter()
print(f"NumPy向量化版本耗时: {
              end - start:.4f} 秒")

# 测试Python内置的Timsort
start = time.perf_counter()
large_data.sort()
end = time.perf_counter()
print(f"Python内置Timsort耗时: {
              end - start:.4f} 秒")

# 在多数情况下,你会看到 NumPy 版本比 Timsort 还要快几个数量级,
# 完美地展示了在正确场景下,专用算法 + 向量化优化的巨大威力。

分析与权衡
counting_sort_numpy的性能是惊人的,但它也带来了新的权衡:

依赖性: 代码现在依赖于NumPy库。在一个没有安装NumPy的轻量级环境中,它将无法运行。
可读性: 对于不熟悉NumPy的开发者来说,np.repeat(np.arange(len(counts)), counts) 这样的代码可能不如一个显式的for循环来得直观。
功能局限: 这个高度优化的版本,其简洁性是以功能性为代价的。例如,它直接处理非负整数,要让它支持key函数或处理负数,需要更复杂的NumPy索引和偏移操作,可能会牺牲一部分简洁性。

结论是,当性能是压倒一切的首要目标,且数据类型和范围符合要求时,NumPy向量化版本是无可匹敌的。

7.3 工程师的保险丝:范围检查与故障回退 (The Engineer’s Fuse: Range Checking and Fault Fallback)

在自动化数据处理管道中,最可怕的事情之一就是一个组件因为意料之外的输入而使整个流程崩溃。我们的计数排序,其最大的“炸弹”就是过大的数据范围k,它会导致MemoryError。一个负责任的工程师,必须为这个“炸弹”安装一个“保险丝”。

策略:主动防御与优雅降级

设置阈值: 允许用户为可接受的最大范围k设置一个阈值 max_k
主动检查: 在分配count_array的内存之前,先计算出实际需要的范围 k = max_val - min_val + 1
决策与行动:

如果 k <= max_k,一切正常,继续执行高效的计数排序。
如果 k > max_k,则触发“保险丝”。此时,我们不能崩溃,而是应该优雅地降级(Graceful Degradation),即切换到一个虽然慢一些,但保证能处理任何范围数据的“安全”算法,例如Python内置的Timsort

日志记录: 无论选择哪条路径,都应该通过日志清晰地记录下来,以便后续的审计和分析。

代码实现:counting_sort_production
这个版本将在我们robust版本的基础上,增加“保险丝”功能。

import logging

# 配置一个简单的日志记录器
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

def counting_sort_production(
    object_list,
    key,
    max_k_allowed=1_000_000, # 设置一个默认的、相对安全的k值上限:一百万
    fallback_sort=sorted, # 允许传入一个备用的排序函数
    **kwargs # 接收 robust 版本的其他参数
):
    """
    一个生产级的计数排序函数,增加了范围检查和故障回退机制。

    参数:
        object_list (list): 待排序列表。
        key (function): 提取键的函数。
        max_k_allowed (int): 允许的最大数据范围k。超过此范围将使用备用排序。
        fallback_sort (function): 当范围超限时,使用的备用排序函数。默认为Python内置的sorted。
        **kwargs: 传递给 robust 版本的其他参数, 如 none_handling, error_handling。
    
    返回:
        排好序的新列表。
    """
    # 首先,像 robust 版本一样,清理数据并提取键
    valid_objects = []
    keys = []
    # ... (这里省略与 robust 版本相同的清理代码) ...
    for obj in object_list:
        if obj is None: continue
        try:
            k_val = key(obj)
            if isinstance(k_val, int):
                valid_objects.append(obj)
                keys.append(k_val)
        except (TypeError, AttributeError):
            continue

    if not valid_objects:
        # ... (处理没有有效数据的情况) ...
        return []

    # --- 主动防御:范围检查 ---
    min_key = min(keys)
    max_key = max(keys)
    actual_k = max_key - min_key + 1
    
    logging.info(f"检测到数据键范围 k = {
              actual_k}")

    if actual_k > max_k_allowed:
        # --- 触发保险丝:优雅降级 ---
        logging.warning(
            f"数据范围 {
              actual_k} 超出阈值 {
              max_k_allowed}。"
            f"将回退到备用排序算法: {
              fallback_sort.__name__}"
        )
        # 使用备用排序函数进行排序。注意要传递key参数。
        # 这里不能直接用 Timsort 的 `list.sort()` 因为它修改原地列表。
        # `sorted()` 更适合,因为它返回新列表,与我们的函数签名一致。
        return fallback_sort(valid_objects, key=key)
    
    # --- 如果在安全范围内,则执行高效的计数排序 ---
    logging.info("数据范围在安全阈值内,执行计数排序。")
    # ... (这里是 counting_sort_robust 中核心的计数和放置代码) ...
    count_array = [0] * actual_k
    for k in keys: count_array[k - min_key] += 1
    for i in range(1, actual_k): count_array[i] += count_array[i-1]
    sorted_valid_objects = [None] * len(valid_objects)
    for i in range(len(valid_objects) - 1, -1, -1):
        obj = valid_objects[i]
        k = keys[i]
        pos = count_array[k - min_key]
        sorted_valid_objects[pos - 1] = obj
        count_array[k - min_key] -= 1
        
    return sorted_valid_objects

# --- 测试生产级函数 ---
# 场景1:范围可控,使用计数排序
safe_data = [User(f'user_{
              i}', random.randint(1,100), '2023-01-01') for i in range(1000)]
print("
--- 生产级测试:安全场景 ---")
result_safe = counting_sort_production(safe_data, key=lambda u: u.level, max_k_allowed=200)

# 场景2:范围超限,自动回退到Timsort
unsafe_data = [
    User('low_id_user', 1, '2023-01-01'),
    User('high_id_user', 5_000_000, '2023-01-01') # 制造一个巨大的k
]
print("
--- 生产级测试:范围超限场景 ---")
result_unsafe = counting_sort_production(unsafe_data, key=lambda u: u.level, max_k_allowed=1_000_000)

这个counting_sort_production版本,体现了防御性编程的思想。它不再盲目地相信输入,而是主动地验证执行条件,并为最坏的情况准备了B计划。这种“保险丝”机制,是确保一个算法组件在复杂系统中能够长期、稳定、可靠运行的关键。

7.4 家族对决:计数排序 vs. 桶排序 (Family Feud: Counting Sort vs. Bucket Sort)

在所有非比较排序算法中,桶排序(Bucket Sort)是与计数排序思想最接近、也最常被拿来比较的“表亲”。理解它们之间的异同,是彻底掌握线性时间排序精髓的最后一块拼图。

桶排序的核心思想

设置桶: 建立一个固定数量的“桶”(通常是n个,n是待排序元素的数量)。每个桶本身是一个可以动态增长的列表。
分发: 遍历输入数组,根据一个映射函数,将每个元素放入其对应的桶中。对于一个范围在[min, max)的数据,元素x通常会被放入第 floor(n * (x - min) / (max - min)) 个桶。
桶内排序: 对每一个非空的桶,单独进行排序。由于桶内元素通常很少,这里经常使用简单高效的排序算法,如插入排序(Insertion Sort)
拼接: 按顺序将所有桶中的元素拼接起来,得到最终的排序结果。

代码实现:bucket_sort

def insertion_sort(bucket):
    """一个简单的插入排序,用于对桶内部进行排序。"""
    for i in range(1, len(bucket)):
        key = bucket[i]
        j = i - 1
        while j >= 0 and key < bucket[j]:
            bucket[j + 1] = bucket[j]
            j -= 1
        bucket[j + 1] = key
    return bucket

def bucket_sort(float_array, num_buckets=10):
    """
    桶排序的实现,特别适用于均匀分布的浮点数。

    参数:
        float_array (list): 待排序的浮点数列表。
        num_buckets (int): 使用的桶的数量。

    返回:
        排好序的新列表。
    """
    if not float_array:
        return []

    min_val, max_val = min(float_array), max(float_array)
    # 桶的范围,如果所有元素相同,则+1避免除零错误
    bucket_range = max_val - min_val or 1.0

    # 步骤 1: 创建空桶
    buckets = [[] for _ in range(num_buckets)]

    # 步骤 2: 将元素分发到桶中
    for x in float_array:
        # 计算元素x应该被放入哪个桶
        index = int((x - min_val) / bucket_range * (num_buckets - 1))
        buckets[index].append(x)
    
    # 步骤 3 & 4: 对每个桶排序并拼接
    sorted_array = []
    for bucket in buckets:
        if bucket: # 如果桶不为空
            # 对桶内进行排序
            sorted_bucket = insertion_sort(bucket)
            # 拼接结果
            sorted_array.extend(sorted_bucket)
            
    return sorted_array

终极对决:多维度比较

特性 计数排序 (Counting Sort) 桶排序 (Bucket Sort)
核心思想 键为地址,统计频率。 范围分区,分而治之。
适用数据 整数,或可无损映射为整数的数据。 理论上可用于浮点数和整数。
性能关键 数据范围 k 必须小。 数据必须均匀分布
时间复杂度 O(n + k)。稳定,不受数据分布影响。 最好/平均: O(n)。最坏: O(n^2) (当所有数据落入同一个桶,且桶内用插入排序时)。
空间复杂度 O(k) (用于计数数组)。 O(n) (用于存储桶和桶内元素)。
稳定性 (通过从后向前放置实现)。 取决于桶内排序算法。如果桶内用稳定的插入排序或计数排序,则整体稳定。
“炸弹” k值过大 数据分布极度不均

场景模拟:何时用谁?

场景A:给100万个员工按年龄(18-65岁)排序。

分析: 整数,k = 65-18+1 = 48,极小。数据分布无所谓。
最佳选择: 计数排序O(n+48),性能无敌。

场景B:给100万个随机生成的、在 [0.0, 1.0) 范围内均匀分布的GPS坐标(浮点数)排序。

分析: 浮点数,均匀分布。
最佳选择: 桶排序。平均情况下O(n),完美契合。计数排序无法直接处理浮点数。

场景C:给某个视频网站的100万个视频,按“点赞数”排序。

分析: 整数(点赞数)。但数据分布极度不均,大部分视频点赞很少,极少数是百万、千万级别的“爆款”。k可能非常大。
选择困境:

计数排序:因为“爆款”的存在,k会过大,不可行。
桶排序:数据分布不均,会导致大部分桶为空,少数桶(低点赞数区)挤满了数据,性能退化。

更好的选择: 快速排序堆排序 (O(n log n))。它们不受数据范围和分布的影响,是更通用的“安全”选择。或者,使用我们带有故障回退机制counting_sort_production,它会自动识别出k过大并切换到Timsort

这次深度的家族对决,为我们选择正确的线性时间排序算法提供了清晰的决策框架。它告诉我们,没有“最好”的算法,只有“最适合”的算法。一个顶级的工程师,其价值就在于能深刻理解每种工具的脾性与边界,并为当前的任务,匹配最精准的解决方案。

© 版权声明
THE END
如果内容对您有所帮助,就支持一下吧!
点赞0 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容