首页
/ 正文

python yield（保姆级教程）

更新时间: 2025-03-22 19:16:36

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战(已更新的所有项目都能学习) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新开坑项目:《Spring AI 项目实战》 正在持续爆肝中，基于 Spring AI + Spring Boot 3.x + JDK 21...， 点击查看 ;

《从零手撸：仿小红书（微服务架构）》 已完结，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 100w+ 字，讲解图 4013+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3700+ 小伙伴加入学习，欢迎点击围观

前言

在 Python 开发中，yield 是一个看似简单却充满魔力的关键词。它不仅改变了函数的执行方式，还为处理大数据、优化内存和构建高效算法提供了独特方案。对于编程初学者，理解 yield 可能像解开一个谜题；而对中级开发者，掌握它则能显著提升代码的灵活性与性能。本文将通过循序渐进的讲解、生动的比喻和实际案例，帮助读者全面掌握 yield 的核心原理与应用场景。

什么是 Yield？它与 Return 的区别

基础概念：函数的“暂停-恢复”机制

在 Python 中，普通函数执行时会从 def 定义处开始运行，直到遇到 return 语句或函数末尾，然后一次性返回结果。而带有 yield 的函数被称为 生成器函数，其执行流程完全不同：

当函数被调用时，它不会立即执行代码，而是返回一个 生成器对象。
每次遇到 yield 关键字时，函数会暂停执行，将当前值返回给调用者，同时保留函数内部的状态（如变量值、执行位置）。
下次调用 next() 或通过 for 循环迭代时，函数会从暂停的位置继续执行，直至再次遇到 yield 或结束。

对比 Return 和 Yield 的核心差异

特性	Return	Yield
函数返回结果	返回单一值或 None	返回多个值（逐次产出）
函数执行流程	执行完即结束	暂停后可恢复执行
内存消耗	可能生成大型数据结构	延迟计算，节省内存
状态保留	不保留	保留函数内部状态

形象比喻：生产线的“按需生产”

想象一个制造汽车的工厂：

普通函数像一条传统生产线，必须一次性生产所有零件并组装成整车才能交付。
生成器函数则像一条“按需生产线”，每次 yield 都产出一个零件（例如车门），生产后暂停，等待客户取走后再继续生产下一个零件。这种模式避免了库存积压，且能灵活响应需求。

Yield 的核心用法与代码示例

基础案例：逐个生成斐波那契数列

def fibonacci(n):
    a, b = 0, 1
    for _ in range(n):
        yield a          # 每次循环产出一个值，然后暂停
        a, b = b, a + b

gen = fibonacci(5)
print(next(gen))  # 输出 0
print(next(gen))  # 输出 1
print(next(gen))  # 输出 1

关键点解析：

函数 fibonacci 返回一个生成器对象 gen，但实际未执行任何计算。
每次调用 next(gen) 时，函数从上次暂停的位置继续执行，直到遇到下一个 yield。
生成器结束后，再次调用 next() 会抛出 StopIteration 异常。

生成器的工作原理与状态保存

内存优化的原理：延迟计算

假设需要生成一个包含 100 万个元素的列表：

def large_list():
    result = []
    for i in range(1_000_000):
        result.append(i * 2)
    return result

def large_generator():
    for i in range(1_000_000):
        yield i * 2

对比分析：

large_list() 需要一次性存储所有计算结果，占用大量内存。
large_generator() 每次仅保存当前值和状态，后续元素按需计算，内存消耗几乎恒定。

状态保存的魔法：栈帧与上下文

Python 通过栈帧记录生成器函数的执行状态：

变量值（如 a, b 的当前值）。
当前代码行的位置（即 yield 语句的下一条指令）。
当再次调用生成器时，Python 直接恢复这些状态，无需重新初始化。

Yield 在实际开发中的应用场景

场景 1：处理大数据文件

当读取超大文本文件时，逐行处理比一次性加载更高效：

def read_large_file(file_path):
    with open(file_path, 'r') as file:
        for line in file:
            yield line.strip()  # 每次返回一行内容

for line in read_large_file("data.txt"):
    process(line)  # 按需处理，无需加载整个文件到内存

场景 2：实现惰性求值

惰性求值（Lazy Evaluation）是 Python 的核心特性之一，yield 是其重要实现工具。例如，构建一个无限序列：

def infinite_counter():
    count = 0
    while True:
        yield count
        count += 1

import itertools
for num in itertools.islice(infinite_counter(), 5):
    print(num)  # 输出 0,1,2,3,4

场景 3：协程（Coroutine）的基础

协程允许函数在暂停时接收外部输入，通过 yield 的值传递实现双向通信：

def coroutine():
    while True:
        received = yield  # 接收外部传入的值
        print(f"Received: {received}")

c = coroutine()
next(c)  # 预激活协程
c.send("Hello")  # 输出 "Received: Hello"

进阶技巧与常见误区

技巧 1：生成器表达式（Generator Expression）

类似列表推导式，但用圆括号包裹，直接返回生成器：

squares_list = [x**2 for x in range(1000000)]

squares_gen = (x**2 for x in range(1000000))

技巧 2：与迭代器协议的关联

生成器本质是一个实现了 迭代器协议 的对象，即具备 __iter__() 和 __next__() 方法。调用生成器时，其自身既是迭代器，因此无需额外封装。

常见误区：混淆生成器与普通迭代

误区：生成器只能迭代一次。
原因：生成器执行完毕后无法重复使用，需重新调用函数生成新实例。
误区：所有生成器必须包含 yield。
事实：若函数定义中包含 yield，Python 会自动将其识别为生成器函数。

Yield 与其他 Python 特性的结合

与装饰器的结合

通过装饰器封装生成器逻辑，提升代码复用性：

def log_yield(func):
    def wrapper(*args, **kwargs):
        gen = func(*args, **kwargs)
        while True:
            try:
                value = next(gen)
                print(f"Yielded: {value}")
                yield value
            except StopIteration:
                break
    return wrapper

@log_yield
def count_up(n):
    for i in range(n):
        yield i

for num in count_up(3):
    pass  # 输出 "Yielded: 0", "Yielded: 1", "Yielded: 2"

与异步编程的关联

虽然 yield 本身不直接支持异步，但早期的协程库（如 gevent）通过 yield 实现了协作式多任务。现代异步编程依赖 async/await，但理解 yield 仍是理解协程概念的基础。

总结与实践建议

核心知识点回顾

生成器函数通过 yield 实现“暂停-恢复”机制，逐次产出结果。
内存优化是其核心优势，适合处理大数据和无限序列。
协程是其进阶应用，支持双向通信与复杂流程控制。

python yield（保姆级教程）

前言

什么是 Yield？它与 Return 的区别

基础概念：函数的“暂停-恢复”机制

对比 Return 和 Yield 的核心差异

形象比喻：生产线的“按需生产”

Yield 的核心用法与代码示例

基础案例：逐个生成斐波那契数列

关键点解析：

生成器的工作原理与状态保存

内存优化的原理：延迟计算

对比分析：

状态保存的魔法：栈帧与上下文

Yield 在实际开发中的应用场景

场景 1：处理大数据文件

场景 2：实现惰性求值

场景 3：协程（Coroutine）的基础

进阶技巧与常见误区

技巧 1：生成器表达式（Generator Expression）

技巧 2：与迭代器协议的关联

常见误区：混淆生成器与普通迭代

Yield 与其他 Python 特性的结合

与装饰器的结合

与异步编程的关联

总结与实践建议

核心知识点回顾

推荐实践路径

最新发布

Clion 2026.2 最新激活码，破解版安装教程（亲测至2099年）

GoLand 2026.2 最新激活码，破解版安装教程（亲测至2099年）

PhpStorm 2026.2 最新激活码，破解版安装教程（亲测至2099年）

Webstorm 2026.2 最新激活码，破解版安装教程（亲测至2099年）

DataGrip 2026.2 最新激活码,破解版安装教程（亲测至2099年~）

IDEA 2026.2 最新激活码，破解版安装教程（亲测至2099年）

Clion 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

RubyMine 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Rider 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

GoLand 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）