news 2026/5/1 9:26:00

Python之PDF小工具

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Python之PDF小工具

Python之PDF小工具

【穷鬼套餐(买不起WPS会员)】这是一个多功能工具,既可以将EPUB电子书转换为PDF格式,也可以对现有的PDF文件进行拆分。

1-epub_to_pdf

#!/usr/bin/env python3""" epub_to_pdf.py ebooklib>=0.20、weasyprint>=66.0 实测通过 """importosimportsysimportebooklibfromebooklibimportepubfromweasyprintimportHTMLfromweasyprint.text.fontsimportFontConfigurationdefconvert_epub_to_pdf(src_epub:str,dst_pdf:str|None=None)->str|None:"""把单个 epub 转 pdf,返回输出文件路径;失败返回 None"""try:book=epub.read_epub(src_epub)html_parts=[]foriteminbook.get_items():ifitem.get_type()==ebooklib.ITEM_DOCUMENT:html_parts.append(item.get_content().decode('utf-8',errors='ignore'))ifnothtml_parts:raiseValueError('文档不包含可解析章节')# 拼成完整 HTMLfull_html=f""" <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <style> body {{ font-family: "PingFang SC", "Helvetica Neue", "Arial", sans-serif; line-height: 1.6; }} </style> </head> <body>{''.join(html_parts)}</body> </html> """ifdst_pdfisNone:out_dir=os.path.join('.','pdf')os.makedirs(out_dir,exist_ok=True)title=os.path.splitext(os.path.basename(src_epub))[0]dst_pdf=os.path.join(out_dir,f"{title}.pdf")HTML(string=full_html).write_pdf(dst_pdf,font_config=FontConfiguration())print(f"✅ 成功:{dst_pdf}")returndst_pdfexceptExceptionase:print(f"❌ 失败:{src_epub}\n原因:{e}")returnNonedefmain(target):ifos.path.isfile(target)andtarget.lower().endswith('.epub'):convert_epub_to_pdf(target)elifos.path.isdir(target):epub_files=[fforfinos.listdir(target)iff.lower().endswith('.epub')]ifnotepub_files:print('📂 该目录下没有 epub 文件')returnforfinepub_files:convert_epub_to_pdf(os.path.join(target,f))# ----------------------------# 脚本入口# ----------------------------if__name__=='__main__':# if len(sys.argv) != 2:# print('用法:python epub_to_pdf.py <epub文件或文件夹路径>')# sys.exit(1)## target = sys.argv[1]main("/Users/rong/Documents/09-深度学习/epub_book")

2-epub_to_pdf

#!/usr/bin/env python3""" epub_to_pdf.py ebooklib>=0.20、weasyprint>=66.0 实测通过 """importsysimportos# 添加PyPDF2库用于PDF操作try:importPyPDF2 PDF_LIBRARY_AVAILABLE=TrueexceptImportError:PyPDF2=NonePDF_LIBRARY_AVAILABLE=Falsedefsplit_pdf(input_pdf_path:str,output_pdf_path:str,pdf_file_name:str,start_page:int,end_page:int)->bool:"""按指定页码范围拆分PDF文件"""ifnotPDF_LIBRARY_AVAILABLE:print("❌ 错误:缺少PyPDF2库,请安装PyPDF2")returnFalsetry:withopen(input_pdf_path+pdf_file_name,'rb')asinfile:reader=PyPDF2.PdfReader(infile)writer=PyPDF2.PdfWriter()# 检查页码范围是否有效total_pages=len(reader.pages)ifstart_page<1orend_page>total_pagesorstart_page>end_page:print(f"❌ 错误:页码范围无效。总页数:{total_pages},请求范围:{start_page}-{end_page}")returnFalse# 提取指定页面foriinrange(start_page-1,end_page):# 页码从0开始索引writer.add_page(reader.pages[i])# 确保输出目录存在os.makedirs(output_pdf_path,exist_ok=True)# 写入新文件output_file_name=output_pdf_path+str(start_page)+"_"+str(end_page)+"_"+pdf_file_namewithopen(output_file_name,'wb')asoutfile:writer.write(outfile)print(f"✅ 成功拆分PDF:{input_pdf_path}的第{start_page}-{end_page}页已保存到{output_file_name}")returnTrueexceptExceptionase:print(f"❌ 拆分PDF失败:{e}")returnFalsedefmain(pdf_file):split_pdf(pdf_file,"output.pdf",1,10)# ----------------------------# 脚本入口# ----------------------------if__name__=='__main__':input_pdf_path="./pdf/"output_pdf_path="./pdf_split/"input_pdf_name="曾国藩传_张宏杰.pdf"success=split_pdf(input_pdf_path,output_pdf_path,input_pdf_name,1,115)success=split_pdf(input_pdf_path,output_pdf_path,input_pdf_name,115,206)success=split_pdf(input_pdf_path,output_pdf_path,input_pdf_name,206,338)sys.exit(0ifsuccesselse1)

3-项目说明

功能特性

  1. EPUB转PDF转换器
  2. PDF文件按页码范围拆分

安装依赖

pipinstall-r requirements.txt

或者使用uv:

uv pipinstall-r.

使用方法

EPUB转PDF

python main.py<epub文件或文件夹路径>

示例:

# 转换单个EPUB文件python main.py books/example.epub# 转换目录下的所有EPUB文件python main.py books/

拆分PDF文件

python main.pysplit<输入PDF文件><输出PDF文件><起始页码><结束页码>

示例:

# 拆分PDF的第5页到第10页python main.pysplitinput.pdf output.pdf510

依赖库

  • ebooklib: 处理EPUB文件
  • weasyprint: 将HTML转换为PDF
  • PyPDF2: 操作PDF文件
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/28 12:34:55

显卡驱动深度清理终极指南:彻底告别蓝屏与游戏崩溃

显卡驱动深度清理终极指南&#xff1a;彻底告别蓝屏与游戏崩溃 【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitcode.com/gh_mirrors/di/display-drivers-uninstaller …

作者头像 李华
网站建设 2026/4/20 18:18:48

DriverStore Explorer终极指南:彻底清理Windows驱动仓库的完整教程

DriverStore Explorer终极指南&#xff1a;彻底清理Windows驱动仓库的完整教程 【免费下载链接】DriverStoreExplorer Driver Store Explorer [RAPR] 项目地址: https://gitcode.com/gh_mirrors/dr/DriverStoreExplorer Windows系统驱动管理一直是个令人头疼的问题&…

作者头像 李华
网站建设 2026/4/23 18:33:30

Windows系统性能优化终极指南:快速释放磁盘空间与提升运行速度

Windows系统性能优化终极指南&#xff1a;快速释放磁盘空间与提升运行速度 【免费下载链接】DriverStoreExplorer Driver Store Explorer [RAPR] 项目地址: https://gitcode.com/gh_mirrors/dr/DriverStoreExplorer 你是否注意到电脑变得越来越慢&#xff1f;磁盘空间不…

作者头像 李华
网站建设 2026/4/29 12:36:23

一键多平台直播:obs插件快速配置终极指南

还在为每次直播只能选择一个平台而烦恼吗&#xff1f;想要一次性覆盖YouTube、B站、Twitch等多个热门直播平台&#xff0c;却不知道如何操作&#xff1f;今天我要向你介绍一款实用的直播工具——obs-multi-rtmp插件&#xff0c;它能让你在5分钟内实现跨平台直播配置&#xff0c…

作者头像 李华
网站建设 2026/4/19 3:22:24

Java大厂求职面试: 从Spring到Kafka的技术探讨

面试场景: 互联网大厂Java求职者的面试 人物介绍 面试官: 严肃且专业&#xff0c;致力于发掘求职者的真实水平。谢飞机: 幽默风趣的程序员&#xff0c;希望能在大厂找到一席之地。 场景: 电商平台的技术面试 第一轮提问: Spring框架与微服务面试官: 谢飞机&#xff0c;请你谈谈…

作者头像 李华
网站建设 2026/4/30 13:56:43

异或门输入输出阻抗测量:实验方法与结果分析

异或门输入输出阻抗测量&#xff1a;从理论到实战的完整技术解析在高速数字电路设计中&#xff0c;我们常常把逻辑门当作“理想的开关”来处理——高电平就是5V&#xff08;或3.3V&#xff09;&#xff0c;低电平就是0V&#xff0c;传播延迟是数据手册上的一个固定数值。但当你…

作者头像 李华