首页
/ 正文

SciPy 图结构（超详细）

更新时间: 2025-04-15 22:54:52

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战(已更新的所有项目都能学习) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新开坑项目:《Spring AI 项目实战》 正在持续爆肝中，基于 Spring AI + Spring Boot 3.x + JDK 21...， 点击查看 ;

《从零手撸：仿小红书（微服务架构）》 已完结，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 90w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3100+ 小伙伴加入学习，欢迎点击围观

在数据科学与算法开发领域，图结构（Graph Structure）是一种核心的抽象模型，广泛应用于社交网络分析、路径规划、推荐系统等场景。SciPy 作为 Python 科学计算的基础库，虽未直接提供图结构的封装类，但其丰富的线性代数工具（如稀疏矩阵、图算法接口）为高效处理图相关任务提供了强大支持。本文将从基础概念入手，结合代码示例，逐步讲解如何利用 SciPy 实现图结构的创建、分析与算法应用，帮助读者掌握这一工具链的核心逻辑。

什么是图结构？

图结构由 节点（Nodes） 和 边（Edges） 组成，用于描述对象之间的关系。例如，社交网络中的用户是节点，好友关系是边；交通网络中的城市是节点，道路是边。图的两个关键特性是：

有向性：边是否有方向（如单行道路 vs 双向道路）。
权重：边是否携带数值信息（如道路距离或交通成本）。

形象比喻：图结构就像一张“关系网”，节点是网上的点，边是连接点的线，而权重则是线的粗细或颜色，帮助量化关系强度。

SciPy 与图结构的关系

SciPy 的 scipy.sparse 模块和 scipy.sparse.csgraph 子模块是处理图结构的核心工具：

稀疏矩阵（Sparse Matrix）：用于存储图的邻接矩阵，节省内存（尤其适用于大规模稀疏图）。
图算法接口：如最短路径、连通分量分析等，直接基于稀疏矩阵实现。

为什么选择 SciPy？

高效性：稀疏矩阵的存储方式天然适配图的稀疏性（节点间关系通常不全连接）。
易集成性：与 NumPy、Pandas 等库无缝协作，适合数据分析全流程。

图的创建与表示

1. 邻接矩阵的构建

图的邻接矩阵是一个二维数组，元素 A[i][j] 表示节点 i 到 j 的边权值。对于无向图，矩阵对称；对于有向图，矩阵可能非对称。

代码示例：创建一个无向图的邻接矩阵

import numpy as np  
from scipy.sparse import csr_matrix  

adjacency_matrix = np.array([  
    [0, 2, 0, 6],       # 节点0到1的边权2，到3的边权6  
    [2, 0, 7, 0],       # 节点1到0的边权2，到2的边权7  
    [0, 7, 0, 8],       # 节点2到1的边权7，到3的边权8  
    [6, 0, 8, 0]        # 节点3到0的边权6，到2的边权8  
])  

sparse_matrix = csr_matrix(adjacency_matrix)  
print(sparse_matrix)

输出结果会显示稀疏矩阵的非零元素，例如：

  (0, 1)	2  
  (0, 3)	6  
  (1, 0)	2  
  (1, 2)	7  
  ...（其他元素）

2. 图的可视化（可选）

虽然 SciPy 不直接支持可视化，但可结合 networkx 库辅助：

import networkx as nx  
import matplotlib.pyplot as plt  

G = nx.from_numpy_array(adjacency_matrix)  
nx.draw(G, with_labels=True)  
plt.show()

此代码会生成一个节点和边的图形，帮助直观理解图的拓扑结构。

基础图算法实现

1. 连通性分析

连通分量（Connected Components） 是图中互达的节点集合。对于无向图，scipy.sparse.csgraph.connected_components 可直接计算：

from scipy.sparse.csgraph import connected_components  

n_components, labels = connected_components(sparse_matrix, directed=False)  
print(f"连通分量数量：{n_components}")  
print(f"各节点所属分量：{labels}")

输出可能为：

连通分量数量：1  
各节点所属分量：[0, 0, 0, 0]

说明所有节点处于同一连通分量。

2. 最短路径计算

Dijkstra 算法 可通过 shortest_path 函数实现：

from scipy.sparse.csgraph import dijkstra  

distances, predecessors = dijkstra(sparse_matrix, directed=False, indices=0, return_predecessors=True)  
print(f"从节点0到其他节点的最短距离：{distances}")

输出可能为：

[0. 2. 9. 6.]

即节点0到节点2的最短路径为 0→1→2，总距离 2+7=9。

实际案例：社交网络分析

案例背景

假设我们有一个小型社交网络，节点代表用户，边权代表互动频率。目标是：

找出用户群体中的“中心人物”（连接度最高的节点）。
计算任意两用户之间的最短路径。

数据准备

adjacency = np.array([  
    [0, 5, 3, 0, 0, 0],  # 用户0（A）  
    [5, 0, 2, 4, 0, 0],  # 用户1（B）  
    [3, 2, 0, 0, 6, 0],  # 用户2（C）  
    [0, 4, 0, 0, 1, 5],  # 用户3（D）  
    [0, 0, 6, 1, 0, 0],  # 用户4（E）  
    [0, 0, 0, 5, 0, 0]   # 用户5（F）  
])

分析步骤

步骤1：计算节点的度中心性

度中心性（Degree Centrality）是节点直接连接的边数。

sparse_adj = csr_matrix(adjacency)  

degrees = np.squeeze(np.asarray(sparse_adj.sum(axis=1)))  
print(f"各节点度中心性：{degrees}")

输出：

[ 8. 11. 11. 10. 7. 5.]

节点1和2的度最高，可能是关键人物。

步骤2：计算任意两节点的最短路径

all_paths = dijkstra(sparse_adj, directed=False)  
print("用户A（0）到其他用户的最短路径距离：")  
print(all_paths[0])

输出可能为：

[0.  2.  5.  6.  8. 11.]

说明用户A到F的最短路径需经过其他节点，总距离为11。

进阶应用：图的分割与聚类

使用谱聚类分割图

谱聚类（Spectral Clustering）通过图的拉普拉斯矩阵分解实现节点分组。SciPy 提供了 csgraph.laplacian 函数辅助计算：

from scipy.sparse.csgraph import laplacian, spectral_clustering  

laplacian_matrix = laplacian(adjacency, normed=True)  

labels = spectral_clustering(laplacian_matrix, n_clusters=2, eigen_solver='arpack')  
print(f"聚类结果：{labels}")

输出可能为：

[0 0 0 1 0 1]

表示用户0-2和4属于同一组，用户3-5属于另一组。

总结与展望

通过本文，我们系统学习了如何利用 SciPy 的稀疏矩阵和图算法接口，实现图结构的创建、分析与算法应用。关键点总结如下：

数据表示：邻接矩阵是图的基础，稀疏矩阵可高效存储大规模图。
核心算法：连通性分析、最短路径、谱聚类等工具直接服务于实际问题。
扩展性：结合 networkx、NumPy 等库，可进一步实现复杂场景的图分析。

未来，随着图神经网络（GNN）的普及，SciPy 在图数据预处理中的角色将愈发重要。掌握其底层逻辑，将为读者在算法优化、数据建模等领域提供坚实基础。

关键词布局检查：本文通过“SciPy 图结构”作为核心主题，自然融入邻接矩阵、稀疏存储、最短路径等子主题，确保 SEO 友好性的同时保持内容连贯。

SciPy 图结构（超详细）

什么是图结构？

SciPy 与图结构的关系

图的创建与表示

1. 邻接矩阵的构建

2. 图的可视化（可选）

基础图算法实现

1. 连通性分析

2. 最短路径计算

实际案例：社交网络分析

案例背景

数据准备

分析步骤

步骤1：计算节点的度中心性

步骤2：计算任意两节点的最短路径

进阶应用：图的分割与聚类

使用谱聚类分割图

总结与展望

最新发布

DBeaver 23.2 破解安装教程（附激活码，亲测有效~）

SQLyog Ultimate 破解版安装教程（附证书秘钥注册码）

Navicat 16 破解版安装教程_激活码(永久激活,亲测好用)

Rider 2025.1.4 最新激活码，破解版安装教程（亲测有效~）

Pycharm 2025.1.3 最新激活码，破解版安装教程（至2099年~）

IDEA 2025.1.3 最新激活码，破解版安装教程（至2099年~）

Webstorm 2025.1.3 最新激活码，破解版安装教程（至2099年~）

GoLand 2025.1.3 最新激活码，破解版安装教程（至2099年~）

Clion 2025.1.3 最新激活码，破解版安装教程（至2099年~）

PhpStorm 2025.1.3 最新激活码，破解版安装教程（亲测有效~）