编程

发布日期: 2023-08-02

作者: Bevis23

文章字数: 4.5k

阅读时长: 16 分

阅读次数:

引言

背景介绍：

排序算法是计算机科学中一个非常重要的领域，它涉及将一组数据元素按照特定顺序重新排列的方法。排序是许多计算机科学和软件开发任务的基础，它在数据分析、数据库查询、搜索算法、图形渲染等众多应用中发挥着关键作用。不同的排序算法有不同的优势和适用场景，因此了解它们的原理和性能是非常重要的。

目的说明：

本文的目的是深入剖析一些经典的排序算法，以帮助读者更好地理解它们的原理和应用。我们将关注一些最常见的排序算法，如冒泡排序、插入排序、选择排序、快速排序、归并排序等，并提供每种算法的详细描述、时间复杂度分析、示例代码以及适用场景的讨论。通过本文，读者将能够更好地理解排序算法的工作方式，选择合适的算法来满足特定需求，并优化其在实际应用中的性能。

接下来，我们将深入研究这些排序算法的原理和应用，从而更好地理解它们的优势和限制。

本文算法均以python实现

冒泡排序

基本思想：

冒泡排序是一种简单的排序算法，它的基本思想是通过不断比较相邻的元素并交换它们的位置，将最大（或最小）的元素逐步”冒泡”到数组的一端。在每一轮排序中，比较相邻的两个元素，如果它们的顺序不正确（例如，前一个元素大于后一个元素），则交换它们的位置。这个过程一直重复，直到整个数组变得有序。

算法过程：

冒泡排序的算法过程如下：

从数组的第一个元素开始，比较它与下一个元素。
如果当前元素大于下一个元素，交换它们的位置。
移动到下一个相邻元素，重复步骤1和2，直到到达数组的末尾。此时，数组中的最大元素已经”冒泡”到了最后一个位置。
重复步骤1-3，但这次不考虑已经排序好的最后一个元素，将次大的元素”冒泡”到倒数第二个位置。
重复这个过程，直到整个数组有序。

时间复杂度分析：

最好情况：如果输入数组已经是有序的，冒泡排序只需要进行一趟比较，不需要交换元素，时间复杂度为O(n)。
最坏情况：如果输入数组是逆序的，每一趟排序都需要比较和交换元素，需要进行n-1趟排序，时间复杂度为O(n^2)。
平均情况：在平均情况下，冒泡排序的时间复杂度也是O(n^2)。因此，冒泡排序并不是一个高效的排序算法。

示例和应用场景：

示例：
假设有一个整数数组：[5, 2, 9, 3, 4, 6]。使用冒泡排序进行排序：

第一轮排序：[2, 5, 3, 4, 6, 9]
第二轮排序：[2, 3, 4, 5, 6, 9]

最终数组有序，冒泡排序完成。

应用场景：
冒泡排序是一个简单的排序算法，通常不用于处理大规模数据集，因为它的时间复杂度较高。它可以用于以下情况：

教学和学习：冒泡排序通常用于教育和学习排序算法的基本原理。
当数据集较小，性能要求不高时，可以使用冒泡排序。
冒泡排序在实际应用中不常见，因为更高效的排序算法（如快速排序和归并排序）通常被优先选用，特别是对于大型数据集。

冒泡排序虽然简单，但效率低下，不适合处理大规模数据，更适合用于教育和理解排序算法的基本原理

python示例代码

def bubbleSort(arr):
    """
    冒泡排序函数
    :param arr: 待排序的列表
    :return: 排序后的列表
    """
    n = len(arr)
    # 遍历所有元素
    for i in range(n):
        # 最后i个元素已经排好序，不需要再比较
        for j in range(0, n-i-1):
            # 如果当前元素比下一个元素大，则交换它们
            if arr[j] > arr[j+1]:
                arr[j], arr[j+1] = arr[j+1], arr[j]
    return arr

# 测试用例
arr = [64, 34, 25, 12, 22, 11, 90]
print("排序前：", arr)
print("排序后：", bubbleSort(arr))

选择排序

基本思想：

选择排序是一种简单的排序算法，其基本思想是每次从待排序序列中选择最大（或最小）的元素，然后将它放置到已排序部分的末尾。这个过程不断重复，直到整个序列变得有序。

算法过程：

选择排序的算法过程如下：

初始时，整个序列被分为两部分：已排序部分和待排序部分。初始时，已排序部分为空，而待排序部分包含所有元素。
在待排序部分中找到最小（或最大）的元素。
将找到的最小（或最大）元素与待排序部分的第一个元素交换位置，将其放置到已排序部分的末尾。
已排序部分增加一个元素，待排序部分减少一个元素。
重复步骤2-4，直到待排序部分为空。此时，整个序列已排序完成。

时间复杂度分析：

最好情况：无论什么情况，选择排序的外层循环都需要执行n-1次。内层循环需要执行n次比较，但交换次数较少（最多n-1次）。因此，最好情况、最坏情况和平均情况下的时间复杂度都是O(n^2)。

示例和应用场景：

示例：
假设有一个整数数组：[5, 2, 9, 3, 4, 6]。使用选择排序进行排序：

第一轮排序：找到最小的元素2，并与第一个元素5交换位置，序列变为：[2, 5, 9, 3, 4, 6]
第二轮排序：在剩下的序列中找到最小的元素3，并与第二个元素5交换位置，序列变为：[2, 3, 9, 5, 4, 6]
以此类推，继续进行选择排序，直到整个数组有序。

应用场景：

选择排序是一种直观易懂的排序算法，适合用于教学和学习排序算法的基本原理。
当数据集较小，性能要求不高时，可以使用选择排序。
选择排序在实际应用中相对较少，因为它的时间复杂度较高，尤其在大型数据集的情况下，更高效的排序算法（如快速排序或归并排序）更为常见。

选择排序是一种简单的排序算法，但在性能方面较差。它主要用于教学和小型数据集，而在实际应用中，通常会选择更高效的排序算法。

python示例代码

def selection_sort(arr):
    n = len(arr)

    # 遍历数组
    for i in range(n):
        # 找到未排序部分中的最小元素的索引
        min_index = i
        for j in range(i+1, n):
            if arr[j] < arr[min_index]:
                min_index = j

        # 将最小元素与当前位置交换
        arr[i], arr[min_index] = arr[min_index], arr[i]

    return arr

# 测试
arr = [64, 25, 12, 22, 11]
sorted_arr = selection_sort(arr)
print("排序后的数组:", sorted_arr)

插入排序

基本思想：

插入排序是一种简单的排序算法，其基本思想是通过构建有序子序列，将未排序的元素逐个插入到合适的位置。在整个排序过程中，已排序部分总是位于数组的前部，而未排序部分位于后部。

算法过程：

插入排序的算法过程如下：

初始时，整个序列被分为两部分：已排序部分和待排序部分。初始时，已排序部分只包含第一个元素，而待排序部分包含其余元素。
从待排序部分取出第一个元素，称为当前元素。
将当前元素与已排序部分的元素依次比较，找到当前元素在已排序部分中的合适位置。这通常涉及到多次比较和移动元素的过程。
插入当前元素到已排序部分的合适位置。
已排序部分增加一个元素，待排序部分减少一个元素。
重复步骤2-5，直到待排序部分为空。此时，整个序列已排序完成。

时间复杂度分析：

最好情况：在最好情况下，如果输入序列已经有序，插入排序只需要进行n-1次比较，没有交换操作，时间复杂度为O(n)。
最坏情况：在最坏情况下，如果输入序列是逆序的，插入排序需要进行n-1次比较和n-1次交换操作，时间复杂度为O(n^2)。
平均情况：平均情况下，插入排序的时间复杂度也是O(n^2)。

示例和应用场景：

示例：
假设有一个整数数组：[5, 2, 9, 3, 4, 6]。使用插入排序进行排序：

第一轮排序：已排序部分：[5]，待排序部分：[2, 9, 3, 4, 6]。取出2，插入到已排序部分中，结果为：[2, 5]，[9, 3, 4, 6]。
第二轮排序：已排序部分：[2, 5]，待排序部分：[9, 3, 4, 6]。取出9，插入到已排序部分中，结果为：[2, 5, 9]，[3, 4, 6]。
以此类推，继续进行插入排序，直到整个数组有序。

应用场景：

插入排序是一种稳定的排序算法，适用于小型数据集，尤其在数据基本有序的情况下表现良好。
它在实际应用中常用于对小型数组或部分已排序的数据进行排序，如在线扑克牌游戏中对手中的牌进行排序。
插入排序还可以用作其他排序算法的一部分，例如希尔排序中的子过程。

插入排序是一种简单但有效的排序算法，适用于小规模数据集和特定情况下。它的时间复杂度较低，但在大规模数据集上性能不如快速排序或归并排序等高效排序算法。

python示例代码

def insertion_sort(arr):
    n = len(arr)

    # 从第2个元素开始遍历数组，将其插入已排序的部分
    for i in range(1, n):
        key = arr[i]    # 当前待插入的元素
        j = i - 1       # 已排序部分的最后一个元素的索引

        # 将大于待插入元素的元素向右移动
        while j >= 0 and arr[j] > key:
            arr[j+1] = arr[j]
            j -= 1

        # 将待插入元素放入正确的位置
        arr[j+1] = key

    return arr

# 测试
arr = [64, 25, 12, 22, 11]
sorted_arr = insertion_sort(arr)
print("排序后的数组:", sorted_arr)

快速排序

基本思想：

快速排序是一种分治排序算法，其基本思想是通过一趟排序将待排序序列分割为两个独立的子序列，再递归地对这两个子序列进行排序。这个分割过程依赖于选择一个枢纽元素，将小于枢纽元素的元素放在它的左边，大于枢纽元素的元素放在它的右边。

算法过程：

快速排序的算法过程如下：

选择一个枢纽元素（通常选择待排序序列的第一个元素）。
划分（Partitioning）：将序列中小于枢纽元素的元素放在枢纽元素的左边，大于枢纽元素的元素放在右边，枢纽元素自身已经在正确的位置。
递归地对枢纽元素左边和右边的子序列进行快速排序。
重复步骤1-3，直到所有子序列有序。

时间复杂度分析：

最好情况：当每次划分都能均匀地将序列分成大致相等的两部分时，快速排序的性能最好。在这种情况下，时间复杂度为O(n*log(n))。
最坏情况：当每次划分都将序列分为一个较小的子序列和一个较大的子序列时，快速排序的性能最差。最坏情况下的时间复杂度为O(n^2)。但通过选择合适的枢纽元素，可以避免最坏情况的发生。
平均情况：在平均情况下，快速排序的时间复杂度为O(n*log(n))。

示例和应用场景：

示例：
假设有一个整数数组：[5, 2, 9, 3, 4, 6]。使用快速排序进行排序：

选择枢纽元素，通常选择第一个元素，如5。
划分序列，将小于5的元素放在左边，大于5的元素放在右边：[2, 3, 4], [5], [9, 6]。
递归对左右两个子序列进行快速排序：[2, 3, 4] 和 [9, 6]。
重复上述过程，直到整个数组有序。

应用场景：

快速排序是一种高效的排序算法，通常用于大规模数据集的排序，因为它的平均时间复杂度较低。
它在各种编程语言的标准库中常用于排序操作，如C++中的std::sort和Python中的sorted。
快速排序还用于各种应用场景，包括数据库查询优化、图像处理、文件系统等需要高性能排序的领域。

快速排序是一种常用且高效的排序算法，特别适合处理大型数据集。通过选择合适的枢纽元素，可以提高其性能，避免最坏情况的发生。

python示例代码

def partition(arr, low, high):
    i = low - 1   # 小于等于pivot的元素的最右索引
    pivot = arr[high]   # 选择最后一个元素作为pivot

    for j in range(low, high):
        if arr[j] <= pivot:
            i += 1
            arr[i], arr[j] = arr[j], arr[i]

    arr[i+1], arr[high] = arr[high], arr[i+1]
    return i+1

def quick_sort(arr, low, high):
    if low < high:
        pi = partition(arr, low, high)

        quick_sort(arr, low, pi-1)
        quick_sort(arr, pi+1, high)

# 测试
arr = [64, 25, 12, 22, 11]
n = len(arr)
quick_sort(arr, 0, n-1)
print("排序后的数组:", arr)

归并排序

基本思想：

归并排序是一种分治排序算法，其基本思想是将待排序序列递归地分割为单个元素，然后合并相邻的有序子序列，直到整个序列有序。

算法过程：

归并排序的算法过程如下：

分割（Divide）：将待排序序列递归地分割为单个元素或长度为1的子序列。
合并（Conquer）：将相邻的有序子序列合并为较大的有序子序列。这一过程重复进行，直到整个序列有序。
归并（Merge）：在合并过程中，将两个有序子序列合并为一个更大的有序序列。这个合并过程通常需要借助额外的空间来存储中间结果。

时间复杂度分析：

最好情况、最坏情况和平均情况下的时间复杂度都是O(n*log(n))。归并排序的性能稳定，不受输入数据的顺序影响，因此在各种情况下都表现良好。

示例和应用场景：

示例：
假设有一个整数数组：[5, 2, 9, 3, 4, 6]。使用归并排序进行排序：

分割过程：将序列分割为单个元素的子序列：[5], [2], [9], [3], [4], [6]。
合并过程：依次将相邻的子序列合并，生成较大的有序子序列。最终，整个数组有序。

应用场景：

归并排序是一种高效的排序算法，适用于各种规模的数据集。它通常用于外部排序，例如对磁盘上的大型数据文件进行排序。
归并排序常用于处理链表数据结构，因为它天然适合链表的特点，不需要额外的存储空间。
在许多编程语言的标准库中，归并排序也用于排序操作，例如Python中的sorted函数。

归并排序是一种高效且稳定的排序算法，适用于各种数据规模和数据类型。它具有良好的性能和可读性，适用于多种应用场景，尤其是需要稳定性和预测性能的情况。

python示例代码

def merge_sort(arr):
    if len(arr) > 1:
        mid = len(arr) // 2   # 将数组分为两半

        L = arr[:mid]         # 左半部分
        R = arr[mid:]         # 右半部分

        merge_sort(L)         # 递归地将左半部分排序
        merge_sort(R)         # 递归地将右半部分排序

        i = j = k = 0

        # 合并两个已排序的数组
        while i < len(L) and j < len(R):
            if L[i] < R[j]:
                arr[k] = L[i]
                i += 1
            else:
                arr[k] = R[j]
                j += 1
            k += 1

        # 处理剩余的元素
        while i < len(L):
            arr[k] = L[i]
            i += 1
            k += 1

        while j < len(R):
            arr[k] = R[j]
            j += 1
            k += 1

    return arr

# 测试
arr = [64, 25, 12, 22, 11]
sorted_arr = merge_sort(arr)
print("排序后的数组:", sorted_arr)

排序算法对比

排序算法	平均情况时间复杂度	最好情况时间复杂度	最坏情况时间复杂度	辅助空间复杂度	稳定性
冒泡排序	O(n^2)	O(n)	O(n^2)	O(1)	稳定
选择排序	O(n^2)	O(n^2)	O(n^2)	O(1)	不稳定
插入排序	O(n^2)	O(n)	O(n^2)	O(1)	稳定
快速排序	O(nlogn)	O(nlogn)	O(n^2)	O(logn)	不稳定
归并排序	O(nlogn)	O(nlogn)	O(nlogn)	O(n)	稳定

参考

《算法图解》：这本书以图解的方式阐述了各种算法，使复杂的概念更容易理解。它适合那些希望更深入了解算法的人，无论是初学者还是有经验的开发人员。

转载规则

《排序算法探究》由 Bevis23 采用知识共享署名 4.0 国际许可协议进行许可。

引言

背景介绍：

目的说明：

冒泡排序

基本思想：

算法过程：

时间复杂度分析：

示例和应用场景：

python示例代码

选择排序

基本思想：

算法过程：

时间复杂度分析：

示例和应用场景：

python示例代码

插入排序

基本思想：

算法过程：

时间复杂度分析：

示例和应用场景：

python示例代码

快速排序

基本思想：

算法过程：

时间复杂度分析：

示例和应用场景：

python示例代码

归并排序

基本思想：

算法过程：

时间复杂度分析：

示例和应用场景：

python示例代码

排序算法对比

参考

您小小的支持，是我不断前进的动力❤