数据结构基础

Mr.xupengboo2025年2月14日大约 22 分钟

1. 数组 (Array)

定义

一组连续内存空间存储的相同类型元素的集合。
特点：通过下标（索引）快速访问元素，但大小固定（静态数组）或可扩展（动态数组）。

核心操作

操作	时间复杂度	说明
访问元素	O(1)	通过索引直接访问（如`arr[3]`）
插入元素	O(n)	需要移动后续元素
删除元素	O(n)	同上
查找元素	O(n)	遍历查找（无序数组）

代码示例

# 创建数组
arr = [1, 2, 3, 4]

# 访问元素
print(arr[0])  # 输出 1

# 插入元素（在末尾添加）
arr.append(5)   # O(1)（动态数组均摊时间）
arr.insert(2, 10)  # O(n)（插入到中间）

# 删除元素
arr.pop()      # 删除末尾元素 O(1)
arr.pop(0)     # 删除第一个元素 O(n)

应用场景

需要快速随机访问（如矩阵运算）
数据量已知或变化较小的场景

2. 链表 (Linked List)

定义

由节点组成的数据结构，每个节点包含数据和指向下一个节点的指针。
特点：内存非连续，插入/删除高效，但访问元素需要遍历。

类型

单链表：每个节点指向下一个节点。
双链表：节点同时指向前驱和后继。
循环链表：尾节点指向头节点。

核心操作

操作	时间复杂度	说明
访问元素	O(n)	从头节点开始遍历
插入/删除	O(1)	已知前驱节点时（如双链表）
查找元素	O(n)	必须遍历

代码示例（单链表）

class ListNode:
    def __init__(self, val=0, next=None):
        self.val = val
        self.next = next

# 创建链表：1 -> 2 -> 3
head = ListNode(1)
head.next = ListNode(2)
head.next.next = ListNode(3)

# 插入节点（在节点2后插入4）
node = head.next
new_node = ListNode(4)
new_node.next = node.next
node.next = new_node  # 链表变为1 -> 2 -> 4 -> 3

# 删除节点（删除节点4）
node.next = node.next.next  # 链表恢复为1 -> 2 -> 3

应用场景

频繁插入/删除的场景（如LRU缓存）
实现栈、队列等数据结构

3. 栈 (Stack)

定义

后进先出(LIFO)的线性结构。
核心操作：push（入栈）、pop（出栈）、peek（查看栈顶）。

代码示例

# 用列表模拟栈
stack = []
stack.append(1)   # push 1
stack.append(2)   # push 2
top = stack[-1]   # peek -> 2
stack.pop()       # pop -> 2

应用场景

函数调用栈
括号匹配、表达式求值（如逆波兰表达式）

4. 队列 (Queue)

定义

先进先出（FIFO）的线性结构。
核心操作：enqueue（入队）、dequeue（出队）。

代码示例

使用 deque ：

from collections import deque
queue = deque()
queue.append(1)    # 入队
queue.append(2)
front = queue[0]   # 查看队首
queue.popleft()    # 出队 -> 1

简单形式（通过列表实现）：

# 简单的通过列表实现
class Queue:

    def __init__(self):
        self.queue = []
    
    def dequeue(self):
        if len(self.queue) == 0:
            return None
        temp = self.queue[len(self.queue) - 1] # 应该改为：self.queue[-1] 最简单
        self.queue.remove(temp)
        return  temp
    
    # 时间复杂度：O(n) 不适用
    def enqueue(self, value):
        self.queue.insert(0, value)

    def view(self):
        for _ in self.queue:
            print(_)

q = Queue()
# 1. 入队操作
q.enqueue(10)
q.enqueue(20)
q.enqueue(30)
q.view()
q.dequeue()
q.view()

由于上面入队列的时间复杂度是O(n) ，可以再简单优化一下，通过 popleft 和 append：（这里改为了deque）

# 通过将列表中的insert替换成 popleft 和 append 降低时间复杂度。
from collections import deque

class Queue:
    
    def __init__(self):
        self.queue = deque()
    
    def consumer(self):
        if len(self.queue) == 0:
            return None
        return self.queue.popleft()  # 从队头移除元素
    
    def producer(self, value):
        self.queue.append(value)  # 向队尾添加元素

还可以基于链表实现：（效果最好）

# 还可以基于链表实现
class Node:
    """链表节点类"""
    def __init__(self, value):
        self.value = value
        self.next = None

class Queue:
    """队列实现（基于链表）"""
    def __init__(self):
        self.head = None  # 队首节点
        self.tail = None  # 队尾节点
        self._size = 0    # 队列长度

    def enqueue(self, value):
        """入队操作：将元素添加到队尾"""
        new_node = Node(value)
        if self.tail is None:
            # 队列为空时，头尾均指向新节点
            self.head = self.tail = new_node
        else:
            # 非空队列：将新节点链接到队尾，并更新队尾指针
            self.tail.next = new_node
            self.tail = new_node
        self._size += 1

    def dequeue(self):
        """出队操作：移除并返回队首元素"""
        if self.is_empty():
            raise IndexError("Dequeue from empty queue")
        
        # 保存队首节点的值，并更新头指针
        value = self.head.value
        self.head = self.head.next
        self._size -= 1
        
        # 如果出队后队列为空，更新尾指针
        if self.head is None:
            self.tail = None
        return value

    def peek(self):
        """查看队首元素（不删除）"""
        if self.is_empty():
            raise IndexError("Peek from empty queue")
        return self.head.value

    def is_empty(self):
        """判断队列是否为空"""
        return self._size == 0

    def __len__(self):
        """返回队列长度"""
        return self._size

    def __str__(self):
        """可视化队列内容（调试用）"""
        values = []
        current = self.head
        while current:
            values.append(str(current.value))
            current = current.next
        return " -> ".join(values) if values else "Empty Queue"

实现方式	入队时间复杂度	出队时间复杂度	优点	缺点
链表实现	O(1)	O(1)	高效动态操作	需要额外内存存指针
列表实现（改进）	O(1)	O(n)	代码简单	出队性能差
`collections.deque`	O(1)	O(1)	内置高效数据结构	依赖标准库

变种队列

双端队列 (Deque)：两端均可插入/删除。
优先队列 (Priority Queue)：按优先级出队（通常用堆实现）。

应用场景

任务调度、消息队列
BFS（广度优先搜索）

5. 哈希表 (Hash Table)

5.1 哈希表概念

定义

通过键（Key）直接访问值（Value）的数据结构。
核心思想：哈希函数将键映射到存储位置。

哈希冲突，如何解决：

开放寻址法：冲突时寻找下一个空槽。
链地址法：每个槽存储链表（如Python的字典）。

代码示例

# Python字典 即哈希表实现
hash_map = {}
hash_map["apple"] = 1  # 插入
hash_map["banana"] = 2
print(hash_map.get("apple"))  # 获取 -> 1
del hash_map["banana"]        # 删除

应用场景

快速查找（如数据库索引）
统计频率（如字母异位词分组）

5.2 链地址法（Chaining）

核心思想

每个数组的索引位置（称为“桶”）不再直接存储单个键值对，而是存储一个链表（或红黑树等其他数据结构）。
当多个键的哈希值冲突时，它们会被添加到同一个桶的链表中。

具体操作

插入键值对：
- 计算键的哈希值，找到对应桶。
- 如果桶为空，直接存入链表头节点。
- 如果桶不为空，遍历链表：
  - 如果发现键已存在，更新值。
  - 如果不存在，将新键值对添加到链表末尾（或头部）。
查找键值对：
- 计算键的哈希值，找到对应桶。
- 遍历链表，逐个比较键是否匹配。

代码示例（Python简化版）

class HashTable:
    def __init__(self, size=10):
        self.size = size
        self.table = [[] for _ in range(size)]  # 每个桶是一个列表（模拟链表）

    def _hash(self, key):
        return hash(key) % self.size  # 哈希函数

    def put(self, key, value):
        bucket_idx = self._hash(key)
        bucket = self.table[bucket_idx]
        # 遍历链表，检查是否已存在该键
        for i, (k, v) in enumerate(bucket):
            if k == key:
                bucket[i] = (key, value)  # 更新键值对
                return
        bucket.append((key, value))  # 添加新键值对

    def get(self, key):
        bucket_idx = self._hash(key)
        bucket = self.table[bucket_idx]
        for k, v in bucket:
            if k == key:
                return v
        return None  # 未找到

为什么链地址法不会导致效率低下？

虽然链表需要遍历，但哈希表的设计目标是通过以下两点保证高效性：

(1) 哈希函数的均匀性

好的哈希函数会将键均匀分布到各个桶中，避免大量冲突。
例如，Python的哈希函数对字符串、整数等类型有优化，冲突概率极低。

(2) 负载因子（Load Factor）控制

负载因子 = 哈希表中元素数量 / 桶的数量。
当负载因子超过阈值（如0.75），哈希表会触发扩容（Rehashing）：
- 创建一个更大的桶数组（例如翻倍）。
- 将所有键值对重新哈希到新桶中。
扩容后，冲突概率显著降低，链表长度保持较短（通常为0-2个节点）。

现代哈希表（如Java的HashMap）会进一步优化链地址法：

链表转红黑树（Java）：当链表长度超过阈值（如8），将链表转换为红黑树，将查找时间从O(n)优化为O(log n)。
动态扩容策略：根据负载因子智能调整桶的数量，平衡时间和空间。

5.3 开放地址法（Open Addressing）

核心思想

开放地址法的思想是，当发生冲突时，寻找另一个空的数组位置来存储冲突的元素。常见的解决方法有线性探测法、二次探测法和双重哈希法等。

具体实现

插入：当插入新元素时，计算哈希值，如果该位置已经被占用，就按照预定的探测策略（如线性探测）尝试查找下一个空的位置。
查找：查找时，先计算哈希值，如果当前位置的元素就是我们要查找的键，就直接返回值。如果当前位置不匹配，就根据探测策略继续查找其他位置，直到找到目标或确认该键不存在。

代码示例（Python简化版）

class HashTable:
    def __init__(self, size=10):
        self.size = size
        self.table = [None] * self.size  

    def _hash(self, key):
        return hash(key) % self.size

    def _probe(self, start_idx):
        """线性探测下一个可用位置"""
        idx = start_idx
        while True:
            if self.table[idx] is None or self.table[idx] == "DELETED":
                return idx
            idx = (idx + 1) % self.size  # 回绕到数组开头
            if idx == start_idx:  # 整个表已满
                raise Exception("Hash table is full")

    def put(self, key, value):
        start_idx = self._hash(key)
        idx = start_idx

        # 查找可插入的位置或更新现有键
        while True:
            if self.table[idx] is None or self.table[idx] == "DELETED":
                # 插入新键值对
                self.table[idx] = (key, value)
                return
            elif self.table[idx][0] == key:
                # 键已存在，更新值
                self.table[idx] = (key, value)
                return
            idx = (idx + 1) % self.size # 通过取余方式能够遍历整个数组
            if idx == start_idx:
                raise Exception("Hash table is full")

    def get(self, key):
        start_idx = self._hash(key)
        idx = start_idx

        while True:
            entry = self.table[idx]
            if entry is None:
                return None  # 未找到
            elif entry != "DELETED" and entry[0] == key:
                return entry[1]  # 返回找到的值
            idx = (idx + 1) % self.size
            if idx == start_idx:
                return None  # 遍历完整个表未找到

6. 二叉树 (Binary Tree)

定义

每个节点最多有两个子节点（左子节点、右子节点）。
特殊类型：
- 二叉搜索树 (BST)：左子树所有节点 < 根节点 < 右子树所有节点。
- 平衡二叉树（如AVL树、红黑树）：通过旋转保持高度平衡。

遍历方式

遍历方式	顺序
前序遍历	根 -> 左 -> 右
中序遍历	左 -> 根 -> 右
后序遍历	左 -> 右 -> 根
层序遍历	按层级从上到下、从左到右

代码示例（二叉树节点）

class TreeNode:
    def __init__(self, val=0, left=None, right=None):
        self.val = val
        self.left = left
        self.right = right

# 创建二叉树
root = TreeNode(1)
root.left = TreeNode(2)
root.right = TreeNode(3)

应用场景

文件系统结构
表达式树（用于计算）
B树 / B+树，用作索引。

7. 堆 (Heap)

定义

堆是一种完全二叉树（Complete Binary Tree），满足以下性质：

最大堆（Max Heap）：每个父节点的值 ≥ 其子节点的值。
最小堆（Min Heap）：每个父节点的值 ≤ 其子节点的值。

提示

完全二叉树是指除了最后一层外，其他层的节点都是满的，并且最后一层的节点 尽可能靠左排列。（除最后一层外，其他层节点全满，最后一层从左到右填充）

关键特点

结构性：是完全二叉树（除最后一层外，其他层节点全满，最后一层从左到右填充）。
有序性：父节点与子节点满足大小关系（最大堆或最小堆）。

提示

正常的堆结构（无论是最大堆还是最小堆）中，只有根节点（堆顶元素）会被移除，通常是为了获取堆中最大值或最小值。

核心操作

操作	时间复杂度	说明
插入元素	O(log n)	上浮调整（sift up）
删除堆顶	O(log n)	下沉调整（sift down）
构建堆	O(n)	Floyd算法（将无序数组调整为堆）

代码示例（Python的 `heapq` 模块）

import heapq

tasks = [
    ("任务1", 30),  # 优先级 30
    ("任务2", 20),  # 优先级 20
    ("任务3", 10),  # 优先级 10
    ("任务4", 15),  # 优先级 15
    ("任务5", 5)    # 优先级 5
]

# Python 提供了内建的最小堆 heapq，最大堆可以通过插入负值来模拟
heap = []

# 将任务按优先级插入堆（使用负值来模拟最大堆）
for task in tasks:
    heapq.heappush(heap, (-task[1], task[0]))  # 插入负值作为优先级

# 处理任务，按优先级顺序
while heap:
    priority, task_name = heapq.heappop(heap)  # 提取最大优先级任务
    print(f"处理任务：{task_name}，优先级：{-priority}")

应用场景

优先队列
Top K问题（如最大的K个元素）

提示

这个堆和 JVM中的堆是一个内容吗？【不是】

JVM 堆：内存区域，用来存储 Java 对象和数组，依赖于操作系统的内存管理机制。JVM 会动态分配和释放内存，利用垃圾回收机制来管理这些内存。它本身并不是一个树形结构，也不是二叉树。
数据结构中的堆：是一种树形数据结构，通常是完全二叉树，用来优化某些算法操作，如快速找到最大值或最小值，常见于实现优先队列。

计算堆的高度

首先，先理解树的层数和高度的定义：

层数：树的层数从 0 开始编号，根节点的层数为 0，它的子节点是第 1 层，以此类推。层数表示节点所在的层级。
- 第 0 层：树的根节点。
- 第 1 层：根节点的子节点。
- 第 2 层：第 1 层节点的子节点，以此类推。
高度：树的高度是指从根节点到最远叶子节点的路径上的边数。有时也可以理解为树的最大层数，即树的最高层编号。
- 高度 = 最大层数。如果树有高度为 h，那么它的层数总共有 h+1 层。

假设有一个二叉树（完全二叉树）：

        1  <- 层 0（根节点）
       / \
      2   3  <- 层 1
     / \ 
    4   5  <- 层 2

这个树有 3 层，分别是层 0、层 1 和层 2。最远的叶子节点（4 和 5）位于层 2。
树的高度是 2，因为从根节点（层 0）到最远叶子节点的路径上有 2 条边。

计算堆的高度：

由于堆是完全二叉树，堆的高度可以通过树的节点数 n 来计算。

对于一个完全二叉树，假设树的节点总数是 n，那么树的高度 h 满足：
h = ⌊log⁡2n⌋
其中，⌊x⌋ 表示取整，即向下取整 。

堆数组

下面这个最大堆（Max-Heap），对应的数组的，效果是：[30, 20, 10, 15, 5]

heap[0] = 30 是堆的根节点，也就是最大值。
heap[1] = 20 和 heap[2] = 10 是根节点 30 的两个子节点。`
heap[3] = 15 和 heap[4] = 5 是节点 20 的两个子节点。

对于堆数组中的任意一个节点（数组下标为 i），我们可以通过以下规则来找到它的父节点和子节点：

父节点的下标：parent(i) = (i - 1) // 2
左子节点的下标：left(i) = 2 * i + 1
右子节点的下标：right(i) = 2 * i + 2

堆的下沉操作

下沉操作 的核心就是判断当前节点与其子节点之间的大小关系，然后将当前节点与更大的子节点交换，直到堆的性质得到恢复。

一般移出根节点数据会进行堆下沉操作。

初始堆：[30, 20, 10, 15, 5]

步骤 1：移除堆顶元素（`30`）

当我们移除堆顶元素 30 后，我们需要将堆的最后一个元素（5）移到堆顶，形成一个不再满足堆性质的树。

步骤 2：堆化（下沉操作）

为了恢复堆的性质，我们从堆顶开始，执行 下沉操作。下沉操作是将堆顶元素（5）与它的子节点比较，并将其交换位置，直到满足堆的性质。

比较 5 和它的两个子节点 20 和 10，选择最大的子节点 20，将 5 和 20 交换。

继续下沉 5，比较它与子节点 15，选择最大的子节点 15，将 5 和 15 交换。

此时，5 已经没有子节点了，堆的性质恢复。

步骤 3：继续调整直到堆性质恢复完成

此时堆的结构已经恢复为：

简要总结整个过程：

移除堆顶元素（30），将堆的最后一个元素（5）放到堆顶。
堆化：通过下沉操作恢复堆的性质，使堆保持最大堆（或最小堆）结构。
完成堆的调整：此时堆已恢复为 [20, 15, 10, 5]。

堆的上浮操作（heapify_up）

上浮操作：当我们插入一个新的元素时，首先将其放到堆的 最后一个位置（即堆的末尾），然后通过上浮操作将该元素移到合适的位置，直到满足堆的性质（对于最大堆：父节点的值必须大于或等于其子节点的值）

假设我们有一个最大堆，堆的当前结构为：

现在，我们插入一个新的元素 25，并且通过上浮操作来恢复堆的性质。

步骤 1：插入 `25`

我们将 25 插入到堆的末尾（作为 5 的右子节点）：

步骤 2：上浮操作

比较 25 和父节点 5：由于 25 大于 5，我们交换它们：

继续上浮：现在 25 处于 5 的位置，它的父节点是 15。我们比较 25 和 15，由于 25 大于 15，我们交换它们：

继续上浮：现在 25 处于 15 的位置，它的父节点是 20。我们比较 25 和 20，由于 25 大于 20，我们交换它们：

步骤 3：停止上浮

现在 25 成为堆顶元素，堆的性质已经恢复，因为它比它的父节点（20）还大，没有需要再进行交换的情况。

最终堆结构：

Floyd 算法（Floyd 建堆算法）

Floyd 算法通常用于 构建堆，特别是在 最大堆 或 最小堆 的构建过程中。

Floyd 算法的主要思想是：从最后一个非叶子节点 开始，逐个执行堆化操作（下沉操作），直到根节点。
具体来说，Floyd 算法的步骤如下：
1. 从数组的 最后一个非叶子节点 开始堆化，倒序进行。
2. 对每个节点，执行堆化操作，确保每个子树都符合堆的性质。
3. 直到根节点，整个堆的性质得到满足。

"""
Floyd算法：
从最后一个非叶子节点开始下沉调整
最后一个非叶子节点：(len(self.heap) - 1) // 2
-1, -1：倒序开始
"""
for i in range((len(self.heap) - 1) // 2, -1, -1):  # range(起始值, 结束值, 步长)
    self._shif_down(i)

Python 实现最大堆

class heapq:

    def __init__(self):
        self.heap = []

    # 堆插入： 将新元素插入到树的最底层最左边（数组末尾）
    def insert(self, value):
        self.heap.append(value)
        self._shif_up(len(self.heap) - 1)

    # 堆上浮操作
    def _shif_up(self, idx):
        while idx > 0:
            """
                父节点的下标：`parent(i) = (i - 1) // 2`
            """
            parent = (idx - 1) // 2 # 计算父节点索引
            if self.heap[idx] > self.heap[parent]: # 最大堆：子节点大于父节点
                self.heap[idx], self.heap[parent] = self.heap[parent], self.heap[idx] # 交换值
                idx = parent
            else:
                # 已满足堆的性质
                break

    # 删除堆：移除根节点，并且将最后一个节点放到第一个节点上
    def pop(self):
        if not self.heap:
            return None
        max_val = self.heap[0] # 保留栈顶元素（最大值）
        self.heap[0] = self.heap[-1] # 将末尾元素移到堆顶
        self.heap.pop()
        self._shif_down(0)
        return max_val
        
    # 堆下沉操作
    def _shif_down(self, idx):
        n = len(self.heap)
        while True:
            """
                左子节点的下标：`left(i) = 2 * i + 1`
                右子节点的下标：`right(i) = 2 * i + 2`
            """
            left = 2 * idx + 1      # 左子节点索引
            right = 2 * idx + 2     # 右子节点索引
            largest = idx           # 当前节点、左子、右子中的最大值索引
            
            # 比较左子节点
            if left < n and self.heap[left] > self.heap[largest]:
                largest = left
            
            # 比较右子节点
            if right < n and self.heap[right] > self.heap[largest]:
                largest = right
            
            # 如果最大值不是当前节点，交换并继续下沉
            if largest != idx:
                self.heap[idx], self.heap[largest] = self.heap[largest], self.heap[idx]
                idx = largest
            else:
                # 当前节点已满足堆性质
                break

    def build_heap(self, arr):
        """通过Floyd算法将无序数据构建为堆（时间复杂度O(n)）"""
        self.heap = arr.copy()
        # Floyd算法：从最后一个非叶子节点开始下沉调整
        for i in range((len(self.heap) - 1) // 2, -1, -1):  # range(起始值, 结束值, 步长)
            self._shif_down(i)

    def __str__(self):
        return str(self.heap)

# 测试插入和删除
heap = heapq()
heap.insert(3)
heap.insert(1)
heap.insert(5)
heap.insert(2)
print(heap)          # 输出: [5, 2, 3, 1]
print(heap.pop())  # 输出: 5
print(heap)          # 输出: [3, 2, 1]

# 测试构建堆
arr = [4, 1, 7, 3, 9, 2]
heap.build_heap(arr)
print(heap)          # 输出: [9, 4, 7, 3, 1, 2]

8. 图 (Graph)

图（Graph）的定义

图是一种由顶点（Vertex）和边（Edge）**组成的非线性数据结构，用于表示实体（顶点）及其关系（边）。

顶点：表示实体（如用户、城市、网页）。
边：表示顶点间的关系（如好友关系、道路、超链接）。
分类：
- 有向图：边有方向（如A→B表示单向关系）。
- 无向图：边无方向（如A-B表示双向关系）。
- 带权图：边有权重（如道路长度、社交亲密度）。

图的典型案例

1. 社交网络（无向图）

顶点：用户。
边：好友关系（无向边）。
应用：推荐共同好友、分析社群结构。

示例：

用户A ↔ 用户B ↔ 用户C  
用户A ↔ 用户D

2. 交通网络（带权图）

顶点：城市。
边：城市间的道路（带权，表示距离或时间）。
应用：最短路径规划（如导航）。

示例：

北京 --500km-- 上海  
上海 --300km-- 杭州

3. 网页链接（有向图）

顶点：网页。
边：超链接（有向边，如A→B表示A页面链接到B）。
应用：搜索引擎排名（如PageRank算法）。

示例：

网页A → 网页B → 网页C  
网页A → 网页C

4. 推荐系统（二分图）

顶点：用户和商品。
边：用户购买或点击行为（如用户→商品）。
应用：个性化推荐（如“购买此商品的用户也买了…”）。

示例：

用户1 → 商品A  
用户2 → 商品B  
用户1 → 商品B

图的存储方式

1. 邻接矩阵（Adjacency Matrix）

定义：用二维数组表示顶点间的连接关系。
- 矩阵的行和列对应顶点。
- 矩阵元素matrix[i][j]表示顶点i到顶点j的边（或权重）。

示例（无向图）：

顶点：A, B, C, D  
边：A-B, B-C, A-D  
邻接矩阵：
    A  B  C  D  
  A 0  1  0  1  
  B 1  0  1  0  
  C 0  1  0  0  
  D 1  0  0  0

特点：
- 优点：快速判断两顶点是否相邻（O(1)）。
- 缺点：空间复杂度高（O(V²)），适合稠密图。

2. 邻接表（Adjacency List）

定义：为每个顶点维护一个链表，存储其所有邻接顶点。

示例（同上图）：

A → B → D  
B → A → C  
C → B  
D → A

特点：
- 优点：空间复杂度低（O(V + E)），适合稀疏图。
- 缺点：查询两顶点是否相邻需遍历链表（O(V)）。

提示

图的存储方式不仅仅局限于邻接矩阵和邻接表，虽然这两种是最常见的表示方式，但根据具体应用场景和需求，还可以有其他多种存储方式。

邻接矩阵的典型应用

1. 最短路径算法（Floyd-Warshall）

目标：计算所有顶点对之间的最短路径。
邻接矩阵优势：直接遍历矩阵更新路径权重。

2. 图的连通性判断

方法：邻接矩阵的幂次（matrix^k）可表示顶点间经过k步的路径数。

3. 网络分析（如社交网络中心性）

度中心性：顶点的度可直接通过邻接矩阵行/列求和计算。

邻接矩阵 vs 邻接表

特性	邻接矩阵	邻接表
空间复杂度	O(V²)	O(V + E)
查询相邻	O(1)	O(V)（需遍历链表）
添加边	O(1)	O(1)（链表头部插入）
适用场景	稠密图、频繁查询相邻顶点	稀疏图、频繁遍历邻接顶点

代码案例

实现一个简单的邻接矩阵：

class Graph:
    def __init__(self, vertices):
        self.vertices = vertices
        self.matrix = [[0] * vertices for _ in range(vertices)]  # 初始化邻接矩阵 
        # [0] * 3 = [0, 0, 0]，vertices就可以得到对应的矩阵
    
    def add_edge(self, u, v, weight=1):
        """添加边（默认无向图）"""
        self.matrix[u][v] = weight
        self.matrix[v][u] = weight  # 若为有向图，注释此行
    
    def has_edge(self, u, v):
        """判断是否存在边"""
        return self.matrix[u][v] != 0
    
    def print_matrix(self):
        """打印邻接矩阵"""
        for row in self.matrix:
            print(row)

# 示例：构建无向图
g = Graph(4)      # 4个顶点（0=A, 1=B, 2=C, 3=D）
g.add_edge(0, 1)  # A-B
g.add_edge(1, 2)  # B-C
g.add_edge(0, 3)  # A-D
g.print_matrix()
# 输出：
# [0, 1, 0, 1]
# [1, 0, 1, 0]
# [0, 1, 0, 0]
# [1, 0, 0, 0]

最短路径算法，Dijkstra 算法：Dijkstra 算法是一种贪心算法，适用于没有负权边的图，能够高效地找到从源节点到所有其他节点的最短路径。

import heapq

def dijkstra(graph, start):
    # 初始化
    distances = {node: float('inf') for node in graph}
    distances[start] = 0
    pq = [(0, start)]  # 优先队列，存储 (距离, 节点)
    
    while pq:
        current_distance, current_node = heapq.heappop(pq)  # 获取当前最小距离节点
        
        # 如果当前距离已经大于已知最短距离，跳过
        if current_distance > distances[current_node]:
            continue
        
        # 遍历当前节点的邻居
        for neighbor, weight in graph[current_node].items():
            distance = current_distance + weight
            # 如果通过当前节点到邻居的路径更短，更新距离
            if distance < distances[neighbor]:
                distances[neighbor] = distance
                heapq.heappush(pq, (distance, neighbor))
    
    return distances

# 图的表示（邻接表）
graph = {
    'A': {'B': 1, 'C': 4},
    'B': {'A': 1, 'C': 2, 'D': 5},
    'C': {'A': 4, 'B': 2, 'D': 1},
    'D': {'B': 5, 'C': 1}
}

# 计算从 'A' 出发的最短路径
start_node = 'A'
shortest_paths = dijkstra(graph, start_node)
print("从节点", start_node, "到其他节点的最短路径:")
for node, distance in shortest_paths.items():
    print(f"到 {node}: {distance}")

总结

图是表示实体关系的核心数据结构，广泛应用于社交网络、交通规划等领域。
邻接矩阵通过二维数组高效表示顶点连接，适合稠密图和快速查询，但空间开销大。
实际应用中需根据图的稀疏性和操作类型选择存储方式。

数据结构 基础

数据结构基础