AI智能文档扫描仪自动化测试：Selenium模拟上传流程脚本-编程实验室

AI智能文档扫描仪自动化测试：Selenium模拟上传流程脚本

1. 引言

1.1 业务场景描述

在现代办公自动化和数字化转型的背景下，AI 智能文档扫描仪作为一款高效、轻量级的图像处理工具，广泛应用于合同归档、发票识别、证件管理等场景。其核心功能是通过 OpenCV 实现文档边缘检测与透视矫正，无需依赖深度学习模型，具备启动快、隐私安全、零网络依赖等优势。

然而，随着产品迭代加速，手动测试 WebUI 界面的文件上传与处理流程已无法满足持续集成（CI）的需求。为保障每次版本更新后核心功能的稳定性，亟需构建一套可重复、高覆盖率、端到端的自动化测试方案。

1.2 痛点分析

当前面临的主要挑战包括：

手动上传图片验证耗时且易遗漏边界情况
缺乏对“上传 → 处理 → 结果展示”全流程的自动化校验
不同浏览器环境下行为可能存在差异
需要模拟真实用户操作（如点击、文件选择）以确保 UI 功能完整

1.3 方案预告

本文将介绍如何使用Selenium WebDriver自动化测试框架，编写 Python 脚本模拟用户上传图片、触发处理逻辑，并验证结果图像是否成功生成。该方案可无缝集成至 CI/CD 流程，实现每日构建自动回归测试。

2. 技术方案选型

2.1 为什么选择 Selenium？

对比项	Selenium	Playwright	Cypress	Requests + BeautifulSoup
浏览器支持	✅ 全主流浏览器	✅ 更现代	✅ 仅 Chromium 系	❌ 无 GUI 操作能力
文件上传支持	✅ 原生支持`<input type="file">`	✅ 支持	✅ 支持	❌ 无法操作 DOM 事件
易用性	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐
社区生态	✅ 极其丰富	较新但增长快	中等	不适用于 UI 测试
是否适合本项目	✅ 最佳选择	可替代	可替代	❌ 不适用

结论：Selenium 成熟稳定，社区资源丰富，特别适合模拟真实用户的文件上传操作，是本项目的最优解。

2.2 测试目标定义

本次自动化测试需覆盖以下关键路径：

启动浏览器并访问本地部署的 WebUI 页面
定位文件上传输入框并上传测试图像
等待图像处理完成（通过右侧预览图出现判断）
验证处理后的图像是否加载成功
截图保存测试结果用于后续分析
关闭浏览器释放资源

3. 实现步骤详解

3.1 环境准备

确保系统已安装以下组件：

# 安装 Selenium pip install selenium # 下载 ChromeDriver 并加入 PATH # 地址：https://sites.google.com/chromium.org/driver/

推荐使用webdriver-manager自动管理驱动版本：

pip install webdriver-manager

3.2 核心代码实现

以下是完整的自动化测试脚本，包含详细注释：

from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.common.exceptions import TimeoutException, NoSuchElementException import time import os # 配置参数 WEB_UI_URL = "http://localhost:8080" # 替换为实际服务地址 TEST_IMAGE_PATH = "./test_docs/invoice.jpg" # 测试图片路径 OUTPUT_DIR = "./test_results" os.makedirs(OUTPUT_DIR, exist_ok=True) def setup_driver(): """初始化 Chrome 浏览器实例""" options = webdriver.ChromeOptions() options.add_argument("--start-maximized") # 最大化窗口便于观察 options.add_argument("--disable-infobars") options.add_argument("--disable-extensions") options.add_argument("--no-sandbox") options.add_argument("--disable-dev-shm-usage") # 可选：启用 headless 模式用于 CI # options.add_argument("--headless") driver = webdriver.Chrome(options=options) return driver def wait_for_element(driver, locator, timeout=10): """等待元素可见""" return WebDriverWait(driver, timeout).until( EC.visibility_of_element_located(locator) ) def upload_image_and_verify(driver, image_path): """上传图片并验证处理结果""" try: # 访问页面 driver.get(WEB_UI_URL) print("✅ 页面加载成功") # 等待上传区域出现 upload_area = wait_for_element(driver, (By.CSS_SELECTOR, "input[type='file']"), 10) print("📁 找到文件上传输入框") # 直接发送文件路径到 input[type='file'] upload_area.send_keys(image_path) print(f"📤 已上传文件: {image_path}") # 等待右侧处理结果显示（假设处理后 img#result-img 存在） result_img_locator = (By.ID, "result-img") result_img = wait_for_element(driver, result_img_locator, 15) # 验证图像 src 是否非空 src = result_img.get_attribute("src") if src and len(src) > 10: print("✅ 图像处理成功，结果已显示") else: raise Exception("❌ 处理结果图像 src 为空") # 截图保存测试结果 timestamp = int(time.time()) screenshot_path = f"{OUTPUT_DIR}/test_result_{timestamp}.png" driver.save_screenshot(screenshot_path) print(f"📸 测试截图已保存至: {screenshot_path}") return True except TimeoutException: print("❌ 超时：未在规定时间内找到元素") driver.save_screenshot(f"{OUTPUT_DIR}/error_timeout.png") return False except NoSuchElementException as e: print(f"❌ 元素未找到: {e}") driver.save_screenshot(f"{OUTPUT_DIR}/error_no_element.png") return False except Exception as e: print(f"❌ 测试过程中发生异常: {e}") driver.save_screenshot(f"{OUTPUT_DIR}/error_exception.png") return False def main(): driver = None try: driver = setup_driver() success = upload_image_and_verify(driver, TEST_IMAGE_PATH) assert success, "📌 自动化测试失败" print("🎉 所有测试步骤执行成功！") except Exception as e: print(f"🔥 主流程异常: {e}") exit(1) finally: if driver: time.sleep(2) driver.quit() print("⏹️ 浏览器已关闭") if __name__ == "__main__": main()

3.3 代码解析

（1）浏览器初始化配置

options.add_argument("--headless") # CI 环境建议开启

在本地调试时建议关闭headless模式以便直观查看操作过程
在 Jenkins/GitLab CI 等环境中应启用--headless提升效率

（2）文件上传机制

upload_area.send_keys(image_path)

Selenium 不支持直接操作系统级文件选择对话框
但可通过定位<input type="file">元素并调用send_keys()直接传入本地文件路径实现上传

（3）结果验证策略

使用WebDriverWait等待#result-img出现
检查src属性长度避免占位符干扰
成功后截图留存证据，便于问题追溯

4. 实践问题与优化

4.1 常见问题及解决方案

问题现象	原因分析	解决方法
`Element not interactable`	元素被遮挡或未完全加载	使用显式等待`WebDriverWait`
文件未上传成功	路径错误或权限不足	检查`os.path.exists(TEST_IMAGE_PATH)`
处理超时	图像过大或算法性能瓶颈	增加等待时间或压缩测试图尺寸
Headless 下渲染异常	缺少视口设置	添加`--window-size=1920,1080`参数

4.2 性能优化建议

使用固定小图进行测试
推荐使用 800x600 左右的 JPEG 图像，减少 OpenCV 处理耗时，提升测试速度。
并行运行多组测试用例
可结合pytest+selenium-grid实现跨浏览器并发测试。
增加断言维度
- 检查原图与结果图宽高比变化
- 使用 OpenCV 比较两图结构相似性（SSIM）
- 记录处理耗时用于性能监控
集成至 CI/CD 流程

# .gitlab-ci.yml 示例片段 test-scanner: image: python:3.9 script: - pip install selenium webdriver-manager opencv-python - python test_upload.py artifacts: paths: - test_results/ expire_in: 1 week