首页
/ 正文

Selenium 文件上传和下载（保姆级教程）

更新时间: 2025-04-14 06:07:14

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战(已更新的所有项目都能学习) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新开坑项目:《Spring AI 项目实战》 正在持续爆肝中，基于 Spring AI + Spring Boot 3.x + JDK 21...， 点击查看 ;

《从零手撸：仿小红书（微服务架构）》 已完结，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 100w+ 字，讲解图 4013+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3700+ 小伙伴加入学习，欢迎点击围观

前言：自动化测试中的文件操作挑战

在软件测试领域，Selenium 是一款广受欢迎的自动化测试工具，它能够模拟用户在浏览器中的操作，完成从点击按钮到表单提交的多种任务。然而，当遇到需要上传或下载文件的场景时，许多开发者会感到困惑——如何让 Selenium 精准地完成这些操作呢？本文将通过深入浅出的讲解，结合实际案例和代码示例，帮助读者掌握 Selenium 在文件上传和下载场景下的核心技巧，并解析常见问题的解决方案。

上传文件的核心逻辑与实现步骤

1. 文件上传的底层原理

在网页中，文件上传功能通常通过 <input type="file"> 标签实现。当用户点击该输入框时，浏览器会弹出文件选择对话框，允许用户选择本地文件。Selenium 的核心挑战在于：如何模拟用户选择文件的行为。

由于浏览器的安全限制，直接通过 Selenium 发送文件路径并不容易。此时需要借助以下两种方法：

直接定位输入框并发送文件路径：通过定位到 <input type="file"> 元素，使用 send_keys() 方法直接传递文件的绝对路径。
使用第三方工具绕过对话框：例如通过 AutoIt 或 Robot 类库模拟键盘和鼠标操作，但这种方法的跨平台兼容性较差。

2. 实战代码示例

以下是一个典型的文件上传流程：

from selenium import webdriver
from selenium.webdriver.common.by import By
import time

driver = webdriver.Chrome()
driver.get("https://example.com/upload-page")

upload_input = driver.find_element(By.CSS_SELECTOR, "input[type='file']")

file_path = "/Users/username/Documents/example.txt"
upload_input.send_keys(file_path)

time.sleep(5)

driver.quit()

关键点解析：

路径格式：必须使用操作系统兼容的绝对路径（例如 Windows 使用反斜杠 \\，Linux/macOS 使用正斜杠 /）。
元素定位：确保输入框的定位器（如 CSS 选择器或 XPath）准确无误。
浏览器兼容性：部分旧版本浏览器可能需要额外配置，例如禁用安全警告。

文件下载场景的自动化处理

1. 下载机制的核心差异

文件下载与上传不同，其核心在于如何让 Selenium 处理浏览器弹出的下载确认对话框。现代浏览器通常会直接开始下载而不再弹出窗口，但测试环境可能需要干预以下环节：

下载路径的指定：通过修改浏览器配置，将文件保存到指定目录。
文件名与类型的验证：确认下载的文件名、大小和内容是否符合预期。

2. Chrome 浏览器的配置优化

以 Chrome 为例，通过设置 options 可以控制下载行为：

from selenium import webdriver
from selenium.webdriver.chrome.options import Options

chrome_options = Options()
prefs = {
    "download.default_directory": "/Users/username/Downloads/",
    "download.prompt_for_download": False  # 禁用下载确认对话框
}
chrome_options.add_experimental_option("prefs", prefs)

driver = webdriver.Chrome(options=chrome_options)
driver.get("https://example.com/download-page")

download_link = driver.find_element(By.LINK_TEXT, "Download File")
download_link.click()

time.sleep(10)

关键点解析：

download.prompt_for_download：设置为 False 后，浏览器将自动下载文件，无需用户确认。
跨浏览器适配：Firefox 需要通过 about:config 修改 browser.download.dir 等参数，配置方式与 Chrome 不同。

常见问题与解决方案

1. 文件路径错误导致上传失败

现象：代码执行后，目标页面显示“未选择文件”或“无效文件”。
原因：文件路径格式错误、权限不足或文件不存在。
解决方案：

检查路径的绝对性（避免使用相对路径）。

在代码中添加路径验证逻辑：

import os
if not os.path.exists(file_path):
    raise FileNotFoundError("文件路径不存在！")

2. 下载文件无法被测试脚本识别

现象：下载完成后，脚本无法读取文件内容或路径。
原因：下载时间不确定，文件名包含动态时间戳。
解决方案：

使用循环等待机制，直到目标文件出现：

import os
import time

expected_file = "report_2023.pdf"
download_dir = "/Users/username/Downloads/"
while True:
    if os.path.exists(os.path.join(download_dir, expected_file)):
        break
    time.sleep(1)

3. 浏览器安全策略的干扰

现象：某些网站会阻止自动下载或上传。
解决方案：

在 Chrome 中添加 --disable-features=DownloadBubble 参数禁用下载气泡：
```
chrome_options.add_argument("--disable-features=DownloadBubble")
```

进阶技巧：自动化流程的优化

1. 使用显式等待提升稳定性

显式等待（Explicit Wait）可以替代 time.sleep()，避免因网络延迟导致的测试失败。例如：

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

upload_complete = WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.ID, "upload-success"))
)

2. 处理多文件上传场景

某些页面支持同时上传多个文件，此时只需在 send_keys() 中传递多个路径，用分号 ; 分隔（适用于 Windows）或逗号 ,（适用于 macOS/Linux）：

multiple_files = "/path/file1.txt;/path/file2.jpg"  # Windows 格式
upload_input.send_keys(multiple_files)

3. 日志与异常处理

在生产环境中，建议添加详细的日志记录和异常捕获：

try:
    # 执行上传操作
except Exception as e:
    print(f"上传失败：{str(e)}")
    # 截图或记录当前页面状态
    driver.save_screenshot("upload-failure.png")
finally:
    driver.quit()

实战案例：自动化测试一个文件管理系统的全流程

场景描述

假设需要测试一个在线文件管理系统，包含以下功能：

上传 PDF 文件。
查看上传后的文件列表。
下载并验证文件内容。

完整代码示例

import os
import time
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options

def setup_driver():
    chrome_options = Options()
    prefs = {
        "download.default_directory": "/Users/username/Downloads/",
        "download.prompt_for_download": False
    }
    chrome_options.add_experimental_option("prefs", prefs)
    return webdriver.Chrome(options=chrome_options)

def test_file_operations():
    driver = setup_driver()
    driver.get("https://example.com/file-management")
    
    # 步骤1：上传文件
    upload_input = driver.find_element(By.ID, "file-upload-input")
    file_to_upload = "/Users/username/Documents/report.pdf"
    upload_input.send_keys(file_to_upload)
    time.sleep(3)  # 等待上传完成
    
    # 步骤2：验证文件列表
    file_list = driver.find_element(By.ID, "file-list")
    assert "report.pdf" in file_list.text, "文件未出现在列表中"
    
    # 步骤3：下载并验证文件
    download_link = driver.find_element(By.LINK_TEXT, "Download report.pdf")
    download_link.click()
    
    # 等待下载完成
    expected_file = "report.pdf"
    while not os.path.exists(f"/Users/username/Downloads/{expected_file}"):
        time.sleep(1)
    
    # 验证文件大小（假设预期大小为 1024 KB）
    file_size = os.path.getsize(f"/Users/username/Downloads/{expected_file}") / 1024
    assert file_size > 1000, "下载文件大小异常"
    
    print("测试通过！")
    driver.quit()

if __name__ == "__main__":
    test_file_operations()

结论：掌握文件操作，提升测试自动化效率

通过本文的讲解，读者应该能够理解 Selenium 在文件上传和下载场景中的核心原理，并掌握从基础代码到进阶优化的完整实践方法。无论是处理单文件上传、多文件操作，还是验证下载文件的完整性和一致性，都需要开发者结合具体业务场景灵活运用技巧。

在实际开发中，建议将文件操作的自动化脚本纳入持续集成（CI）流程，以确保系统功能的稳定性。未来，随着浏览器和 Selenium 的更新迭代，开发者需要持续关注新特性和兼容性问题，例如 Edge 浏览器对 Chromium 的整合、WebDriver 的新 API 等，以保持自动化测试的高效性和可靠性。

掌握 Selenium 的文件操作能力，不仅是技术层面的提升，更是对自动化测试完整生命周期理解的深化。希望本文能成为您迈向更高阶测试工程师的重要阶梯。

Selenium 文件上传和下载（保姆级教程）

前言：自动化测试中的文件操作挑战

上传文件的核心逻辑与实现步骤

1. 文件上传的底层原理

2. 实战代码示例

关键点解析：

文件下载场景的自动化处理

1. 下载机制的核心差异

2. Chrome 浏览器的配置优化

关键点解析：

常见问题与解决方案

1. 文件路径错误导致上传失败

2. 下载文件无法被测试脚本识别

3. 浏览器安全策略的干扰

进阶技巧：自动化流程的优化

1. 使用显式等待提升稳定性

2. 处理多文件上传场景

3. 日志与异常处理

实战案例：自动化测试一个文件管理系统的全流程

场景描述

完整代码示例

结论：掌握文件操作，提升测试自动化效率

最新发布

MySQL 测验（建议收藏）

IDEA 2025.3.1.1 最新激活码,破解版安装教程（亲测至2099年~）

DataGrip 2025.3.3 最新激活码,破解版安装教程（亲测至2099年~）

PhpStorm 2025.3.1.1 最新激活码,破解版安装教程（亲测至2099年~）

Webstorm 2025.3.1.1 最新激活码,破解版安装教程（亲测至2099年~）

GoLand 2025.3.1 最新激活码,破解版安装教程（附激活码，至2099年~）

Pycharm 2025.3.1.1 最新激活码,破解版安装教程（亲测至2099年~）

Clion 2025.3.1.1 最新激活码，破解版安装教程（附激活码，至2099年~）

RubyMine 2025.3.1.1 最新激活码，破解版安装教程（亲测至2099年~）

DataGrip 2025.3.2 最新激活码,破解版安装教程（亲测至2099年~）