首页
/ 正文

Python 文件I/O（长文讲解）

更新时间: 2025-03-20 19:18:58

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战(已更新的所有项目都能学习) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新开坑项目:《Spring AI 项目实战》 正在持续爆肝中，基于 Spring AI + Spring Boot 3.x + JDK 21...， 点击查看 ;

《从零手撸：仿小红书（微服务架构）》 已完结，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 100w+ 字，讲解图 4013+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3700+ 小伙伴加入学习，欢迎点击围观

在编程的世界中，文件输入输出（File I/O）如同一座桥梁，连接着程序与外部数据世界。无论是读取配置文件、解析日志信息，还是生成报告文档，掌握 Python 文件I/O 的核心技能，都是开发者构建实用应用程序的基石。对于编程初学者和中级开发者而言，理解文件操作的底层逻辑与最佳实践，不仅能提升代码的健壮性，还能为后续学习数据处理、网络编程等进阶主题奠定扎实基础。本文将从基础概念逐步深入，结合生动的比喻与真实案例，系统化讲解 Python 文件I/O 的核心知识点，并提供可直接复用的代码示例。

一、基础概念：文件操作的底层逻辑

1.1 文件路径与模式

在 Python 中，文件操作的核心是 open() 函数，其语法为：

file = open(filename, mode='r', encoding=None, ...)

其中，filename 是文件路径，可以是绝对路径（如 /home/user/data.txt）或相对路径（如 ./data.txt）。而 mode 参数则决定了文件的打开模式，常见的模式包括：

r：只读模式（默认），若文件不存在则报错。
w：写入模式，若文件存在则清空内容，否则新建文件。
a：追加模式，文件指针定位到末尾，不会覆盖原有内容。
b：二进制模式，用于处理非文本文件（如图片、可执行文件）。

比喻：可以将文件模式理解为快递运输方式。例如，选择 r 模式就像要求快递员“只送包裹不取件”，而 w 模式则如同“清空原有包裹后放入新包裹”。

1.2 编码与换行符

文本文件的编码（如 UTF-8、GBK）决定了字符的存储方式。在 open() 中显式指定 encoding 参数可避免乱码问题。此外，不同操作系统对换行符的处理也不同：

Windows 使用 \r\n
Linux/macOS 使用 \n

Python 的 newline 参数允许统一处理换行符，例如：

with open('data.txt', mode='w', newline='\n') as f:  
    f.write("Hello\nWorld")

此代码在 Windows 环境下会写入 \n 而非默认的 \r\n，确保跨平台兼容性。

二、核心操作：读写文件的实用技巧

2.1 读取文本文件

2.1.1 逐行读取

逐行读取是处理大文件的高效方法，避免一次性加载全部内容占用内存：

with open('log.txt', 'r') as f:  
    for line in f:  
        print(line.strip())  # 去除换行符

比喻：这如同用吸管逐滴饮用一杯水，而非一口吞下整杯。

2.1.2 一次性读取

若文件较小，可直接读取全部内容：

with open('data.txt', 'r') as f:  
    content = f.read()  # 返回字符串  
    lines = f.readlines()  # 返回列表，包含换行符

注意：read() 和 readlines() 方法会移动文件指针，后续读取需重置位置：

f.seek(0)  # 将指针移至文件开头

2.2 写入文本文件

2.2.1 覆盖写入

使用 w 模式会清空原文件内容：

with open('output.txt', 'w') as f:  
    f.write("Hello, Python!\n")

2.2.2 追加写入

使用 a 模式可保留原内容：

with open('log.txt', 'a') as f:  
    f.write(f"[{datetime.now()}] 记录新事件\n")

三、进阶技巧：处理复杂场景

3.1 二进制文件操作

对于图片、视频等非文本文件，需使用 b 模式：

with open('image.jpg', 'rb') as src, open('copy.jpg', 'wb') as dst:  
    dst.write(src.read())

此代码通过 read() 直接复制二进制数据，无需考虑编码问题。

3.2 CSV 文件处理

Python 的 csv 模块简化了表格数据操作：

import csv  

with open('users.csv', 'w', newline='') as f:  
    writer = csv.writer(f)  
    writer.writerow(['ID', 'Name', 'Age'])  
    writer.writerow([1, 'Alice', 24])  

with open('users.csv', 'r') as f:  
    reader = csv.DictReader(f)  
    for row in reader:  
        print(f"Name: {row['Name']}, Age: {row['Age']}")

表格：CSV 模块常用方法对照表
| 方法/类 | 用途 | 示例代码 |
|-----------------|--------------------------|------------------------------|
| csv.writer() | 创建写入对象 | writer.writerow(data) |
| csv.DictWriter| 以字典形式写入CSV | writer.writeheader() |
| csv.reader() | 逐行读取CSV内容 | for row in reader: ... |
| csv.DictReader| 以字典形式读取CSV | row['Column Name'] |

四、异常处理：让代码更健壮

文件操作中常见的错误包括：

文件不存在
权限不足
内容格式错误

通过 try-except 块捕获异常可避免程序崩溃：

try:  
    with open('nonexistent.txt', 'r') as f:  
        content = f.read()  
except FileNotFoundError:  
    print("文件不存在，请检查路径！")  
except PermissionError:  
    print("无权访问该文件！")  
except Exception as e:  
    print(f"未知错误：{str(e)}")

五、实战案例：日志分析工具

5.1 案例背景

假设需统计 access.log 中的错误代码（如 404、500），并生成报告。

5.2 步骤分解

读取日志文件：逐行扫描日志内容。
解析日志行：提取错误代码（如 404 Not Found）。
统计结果：使用字典记录错误次数。
写入报告：将统计结果保存为文本文件。

5.3 完整代码

import re  

error_counts = {}  

with open('access.log', 'r') as log_file:  
    for line in log_file:  
        match = re.search(r'\[(\d{3})\]', line)  
        if match:  
            code = match.group(1)  
            error_counts[code] = error_counts.get(code, 0) + 1  

with open('error_report.txt', 'w') as report:  
    report.write("错误代码统计：\n")  
    for code, count in error_counts.items():  
        report.write(f"代码 {code}: {count} 次\n")

代码解释：

正则表达式 r'\[(\d{3})\]' 匹配类似 [404] 的模式，提取错误代码。
error_counts 字典通过 .get() 方法安全地统计计数。

结论

通过本文的讲解，读者应能掌握 Python 文件I/O 的核心操作、异常处理技巧，以及实际应用场景的实现方法。从基础的读写模式选择，到高级的二进制处理与 CSV 操作，每个知识点都通过代码示例与比喻进行了直观呈现。对于开发者而言，熟练运用文件I/O技术不仅能提升数据处理效率，更能为构建复杂系统（如日志分析工具、数据爬虫）打下坚实基础。建议读者结合本文代码，在本地环境中实践修改，逐步深化理解。记住，编程能力的提升源于不断尝试与迭代——每一次打开文件，都是一次与数据对话的旅程。

通过系统化学习 Python 文件I/O，开发者能够从容应对从简单文本处理到复杂数据流管理的各类挑战。希望本文提供的知识框架与案例，能成为您技术成长路上的可靠指南。

Python 文件I/O（长文讲解）

一、基础概念：文件操作的底层逻辑

1.1 文件路径与模式

1.2 编码与换行符

二、核心操作：读写文件的实用技巧

2.1 读取文本文件

2.1.1 逐行读取

2.1.2 一次性读取

2.2 写入文本文件

2.2.1 覆盖写入

2.2.2 追加写入

三、进阶技巧：处理复杂场景

3.1 二进制文件操作

3.2 CSV 文件处理

四、异常处理：让代码更健壮

五、实战案例：日志分析工具

5.1 案例背景

5.2 步骤分解

5.3 完整代码

结论

最新发布

Clion 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

RubyMine 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Rider 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

GoLand 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Pycharm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

PhpStorm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Webstorm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

IDEA 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Pycharm 2026.1.3 最新激活码，破解版安装教程（亲测至2099年）

Rider 2026.1.3 最新激活码，破解版安装教程（亲测至2099年）