Qwen2.5-1.5B Streamlit实战：添加对话导出PDF/CSV功能提升办公效率-编程实验室

Qwen2.5-1.5B Streamlit实战：添加对话导出PDF/CSV功能提升办公效率

1. 为什么你需要一个能“存下来”的AI对话助手？

你有没有遇到过这些场景？

和本地大模型聊了半小时，帮你想好了产品方案、改好了周报、理清了技术难点，结果一刷新页面，所有记录全没了；
团队内部用私有模型做知识问答，想把高频问题整理成FAQ文档，却得一行行手动复制粘贴；
客服培训时需要复盘典型对话，但Streamlit聊天界面不支持导出，只能截图拼接，费时又难归档。

这些问题背后，是一个被长期忽略的现实：对话本身是过程，而结果才是资产。
Qwen2.5-1.5B作为一款轻量、安全、开箱即用的本地对话模型，已经解决了“能不能跑”“快不快”“稳不稳”的基础问题；但真正进入日常办公流程，它还缺最后一块拼图——把每一次有价值的对话，变成可保存、可分享、可复用的结构化内容。

本文不讲模型原理，不堆参数配置，而是聚焦一个务实目标：
在原有Streamlit聊天界面基础上，零侵入式增加PDF与CSV双格式导出功能；
支持一键导出完整对话历史（含时间戳、角色标识、原始文本）；
导出文件命名智能、格式规范、开箱即读，适配会议纪要、知识沉淀、跨部门协作等真实办公场景；
全程不依赖外部服务、不上传数据、不修改模型逻辑，完全延续本地化、隐私优先的设计哲学。

你将获得一套可直接复用的代码模块、清晰的集成路径，以及几个已在实际使用中验证过的办公提效案例。

2. 功能设计思路：轻量、可靠、不破坏原有体验

2.1 不重写，只增强：导出功能的定位原则

很多开发者在加导出功能时容易陷入两个误区：
❌ 为了“功能完整”硬塞进复杂UI控件，让简洁界面变得臃肿；
❌ 为追求“通用性”引入重型PDF库（如WeasyPrint），导致依赖膨胀、启动变慢、甚至在低配环境报错。

我们反其道而行之，坚持三条铁律：

最小侵入：不改动原有st.chat_message渲染逻辑，仅在侧边栏新增两个按钮；
零新依赖：PDF生成用原生pdfkit（底层调用wkhtmltopdf，体积小、成熟稳），CSV用Python内置csv模块；
语义友好：导出内容不是原始HTML或JSON，而是带时间戳+角色标签+纯文本段落的可读格式，打开即用，无需二次加工。

2.2 导出内容结构：像人一样组织信息

导出不是简单“复制粘贴”，而是按办公场景重新组织对话：

字段	PDF体现方式	CSV体现方式	说明
时间戳	每条消息前加`[2024-06-12 14:32:05]`	单独`timestamp`列	精确到秒，便于回溯与审计
角色	`🧑‍ 你：`/`Qwen：`	`role`列（值为`user`/`assistant`）	清晰区分发言方，避免混淆
内容	段落式排版，保留换行与缩进	`content`列，自动转义特殊字符	原样保留用户输入与模型输出，包括代码块、列表、公式等

小技巧：PDF导出时，我们用CSS控制打印样式——隐藏Streamlit默认UI元素（如顶部菜单、侧边栏），只保留干净的对话气泡区域，生成的PDF就像一份精心排版的会议记录。

3. 核心代码实现：三步集成，15分钟上线

3.1 环境准备：轻量依赖，一步到位

在项目根目录执行以下命令（已适配Ubuntu/Debian/CentOS，Windows用户请先安装https://wkhtmltopdf.org/downloads.html）：

# 安装PDF生成核心依赖（Linux） sudo apt-get update && sudo apt-get install -y wkhtmltopdf # 安装Python包（仅需2个新增依赖） pip install pdfkit python-dotenv

注意：pdfkit本身不包含渲染引擎，必须配合系统级wkhtmltopdf二进制文件才能工作。上述apt-get命令已确保环境就绪，无需额外配置PATH。

3.2 新增导出逻辑：封装为独立函数

在你的主Streamlit脚本（如app.py）中，紧贴现有st.sidebar区域下方，插入以下代码模块（建议放在# --- Sidebar Controls ---注释块内）：

# --- Export Functionality --- import pdfkit import csv import io from datetime import datetime def export_to_pdf(messages): """将对话历史导出为PDF，格式：[时间] 角色：内容""" if not messages: st.warning(" 对话为空，无法导出PDF") return # 构建HTML内容（精简版，仅含对话气泡） html_content = """ <html> <head> <meta charset="UTF-8"> <style> body { font-family: "Segoe UI", sans-serif; line-height: 1.6; margin: 2cm; } .message { margin-bottom: 16px; } .user { color: #1E88E5; font-weight: bold; } .assistant { color: #333; } .timestamp { color: #777; font-size: 0.9em; margin-bottom: 4px; } </style> </head> <body> """ for msg in messages: role = "user" if msg["role"] == "user" else "assistant" timestamp = datetime.fromtimestamp(msg["timestamp"]).strftime("%Y-%m-%d %H:%M:%S") content = msg["content"].replace("\n", "<br>") html_content += f'<div class="message"><div class="timestamp">[{timestamp}]</div><div class="{role}">{msg["role"].capitalize()}：</div>{content}</div>' html_content += "</body></html>" # 生成PDF字节流 try: pdf_bytes = pdfkit.from_string(html_content, False) filename = f"qwen_dialog_{datetime.now().strftime('%Y%m%d_%H%M%S')}.pdf" st.download_button( label="📄 导出为PDF", data=pdf_bytes, file_name=filename, mime="application/pdf" ) except Exception as e: st.error(f"PDF导出失败：{str(e)}，请检查wkhtmltopdf是否安装正确") def export_to_csv(messages): """将对话历史导出为CSV，含timestamp, role, content三列""" if not messages: st.warning(" 对话为空，无法导出CSV") return # 创建内存CSV output = io.StringIO() writer = csv.writer(output) writer.writerow(["timestamp", "role", "content"]) # 表头 for msg in messages: timestamp = datetime.fromtimestamp(msg["timestamp"]).strftime("%Y-%m-%d %H:%M:%S") writer.writerow([timestamp, msg["role"], msg["content"]]) csv_bytes = output.getvalue().encode('utf-8-sig') # 加BOM支持中文Excel打开 filename = f"qwen_dialog_{datetime.now().strftime('%Y%m%d_%H%M%S')}.csv" st.download_button( label=" 导出为CSV", data=csv_bytes, file_name=filename, mime="text/csv" ) # 在侧边栏中调用 with st.sidebar: st.markdown("### 对话导出") export_to_pdf(st.session_state.messages) export_to_csv(st.session_state.messages)

3.3 对话存储升级：为导出提供结构化数据源

原有Streamlit聊天通常只用st.session_state.messages存{"role": "...", "content": "..."}，但缺少时间戳。我们需要在每次st.chat_message渲染前，自动注入当前时间戳。

找到你代码中处理用户输入与模型回复的核心循环（通常是for msg in st.session_state.messages:之前），将st.session_state.messages初始化逻辑更新为：

# 初始化对话历史（带时间戳） if "messages" not in st.session_state: st.session_state.messages = [] # 关键修改：每次添加新消息时，自动附带时间戳 def add_message(role, content): st.session_state.messages.append({ "role": role, "content": content, "timestamp": time.time() # 使用time.time()保证高精度 }) # 示例：用户发送消息后 if prompt := st.chat_input("你好，我是Qwen..."): add_message("user", prompt) # ... 模型推理逻辑 ... add_message("assistant", response_text)

验证效果：打开浏览器开发者工具 → Application → Local Storage → 查看st.session_state中的messages数组，确认每条均有timestamp字段。

4. 实际办公场景验证：三个高频用例

4.1 场景一：周报自动生成 —— 从对话到Word文档只需两步

操作流程：

在Qwen对话中输入：“帮我把今天和产品的三次讨论整理成周报，重点突出需求变更和排期风险”；
得到结构化回复后，点击侧边栏「📄 导出为PDF」；
将生成的PDF拖入Word（或直接用Adobe Acrobat“导出为Word”），5秒完成初稿。

效果对比：

传统方式：手动整理聊天记录 → 复制粘贴 → 调整格式 → 校对时间线 → 耗时约25分钟；
本方案：对话中明确指令 → 一键导出 → 自动带时间戳与角色标签 → 耗时约90秒，且信息零遗漏。

4.2 场景二：客服话术沉淀 —— 批量导出构建内部知识库

操作流程：

运营同学用Qwen模拟10类客户问题（如“订单没收到”“发票怎么开”），获取标准应答；
每轮对话结束后，点击「导出为CSV」；
将10个CSV文件合并为customer_qa_master.csv，导入Notion或Confluence，自动生成可搜索的知识卡片。

关键优势：

CSV格式天然兼容数据库与BI工具，后续可轻松统计“哪类问题回复率最高”“哪些回答被人工修改最多”；
时间戳字段成为质量追踪锚点，例如发现某次导出的“退款政策”回答与最新规则不符，可快速定位是哪次对话、何时生成。

4.3 场景三：技术方案评审 —— 导出PDF作为正式会议附件

操作流程：

架构师与Qwen就“微服务拆分边界”展开多轮深度对话，模型给出权衡分析与参考架构图描述；
点击「📄 导出为PDF」，得到带完整时间线的对话记录；
将PDF作为附件发给评审会成员，每人打开即见：
- [10:22:15] 架构师：当前单体应用耦合点主要在哪？
- [10:23:42] Qwen：根据您提供的模块依赖图，支付与订单模块存在双向强依赖…
- [10:25:08] 架构师：能否给出解耦的渐进式路径？
- [10:26:33] Qwen：推荐三阶段方案：第一阶段…

价值点：

彻底告别“会上说了一堆，会后没人记得清”的困境；
PDF不可编辑特性，天然适合作为会议留痕与决策依据。

5. 进阶优化建议：让导出更智能、更贴合你

5.1 智能命名：让文件名自带业务上下文

当前导出文件名为qwen_dialog_20240612_142233.pdf，虽规范但缺乏业务意义。可升级为：

# 替换原filename生成逻辑 first_user_msg = next((m["content"][:20] for m in messages if m["role"] == "user"), "untitled") safe_title = "".join(c for c in first_user_msg if c.isalnum() or c in " _-").strip() filename = f"Qwen_对话_{safe_title}_{datetime.now().strftime('%Y%m%d_%H%M%S')}.pdf"

效果：输入“帮我写一封给客户的道歉信”，导出文件名自动变为Qwen_对话_帮我写一封给客户的道歉信_20240612_142233.pdf。

5.2 批量导出：一次导出多个会话

若你管理多个项目对话（如project_a_messages,project_b_messages），可扩展侧边栏为下拉选择：

with st.sidebar: st.selectbox("选择对话记录", ["默认会话", "项目A", "项目B"], key="export_session") if st.session_state.export_session == "默认会话": export_to_pdf(st.session_state.messages) elif st.session_state.export_session == "项目A": export_to_pdf(st.session_state.project_a_messages)

5.3 权限控制（企业部署适用）

在团队共享环境中，可增加导出权限开关：

# 在st.sidebar中添加 if st.checkbox(" 启用导出权限控制（需管理员密码）"): pwd = st.text_input("请输入管理员密码", type="password") if pwd == os.getenv("EXPORT_ADMIN_PWD", "admin123"): export_to_pdf(st.session_state.messages) export_to_csv(st.session_state.messages) else: st.warning("密码错误，导出功能已锁定")