news 2026/5/1 7:13:17

Python 实战:将 HTML 表格一键导出为 Excel(xlsx)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Python 实战:将 HTML 表格一键导出为 Excel(xlsx)

在数据采集、网页解析或自动化报表场景中,我们经常会遇到这样一个需求:

从 HTML 页面中提取表格数据,并导出为 Excel 文件

本文将使用BeautifulSoup + Pandas + OpenPyXL,实现一个通用、简单、可复用的工具函数,把 HTML 中的<table>表格直接导出为.xlsx文件。


一、实现思路

整体流程非常清晰:

  1. 使用BeautifulSoup解析 HTML
  2. 查找页面中所有<table>标签
  3. 使用pandas.read_html将表格转为 DataFrame
  4. 使用ExcelWriter将多个表格写入 Excel 的不同 Sheet

二、环境准备

1️⃣ 安装依赖

pipinstallbeautifulsoup4 pandas openpyxl lxml

lxmlpandas.read_html推荐的解析器,性能更好。


三、核心代码实现

1️⃣ HTML 表格导出函数

frombs4importBeautifulSoupimportpandasaspddefhtml_table_to_xlsx(html_content,output_file):""" 将 HTML 中的表格提取并导出为 xlsx 文件。 :param html_content: HTML 文本内容 :param output_file: 导出的 xlsx 文件路径 """# 使用 BeautifulSoup 解析 HTMLsoup=BeautifulSoup(html_content,'html.parser')# 查找 HTML 中的所有表格tables=soup.find_all('table')ifnottables:print("HTML 中没有找到表格!")return# 逐个解析表格并导出到 Excelwithpd.ExcelWriter(output_file,engine='openpyxl')aswriter:fori,tableinenumerate(tables):# 将 HTML table 转为 DataFramedf=pd.read_html(str(table))[0]# 不同表格写入不同的 sheetsheet_name=f"Sheet{i+1}"df.to_excel(writer,index=False,sheet_name=sheet_name)print(f"表格已成功导出到{output_file}")

四、示例演示

1️⃣ 示例 HTML 内容

html_content=""" <html> <head><title>测试表格</title></head> <body> <table border="1"> <tr> <th>姓名</th> <th>年龄</th> <th>城市</th> </tr> <tr> <td>张三</td> <td>28</td> <td>北京</td> </tr> <tr> <td>李四</td> <td>34</td> <td>上海</td> </tr> </table> </body> </html> """

2️⃣ 调用函数导出 Excel

html_table_to_xlsx(html_content,"output.xlsx")

执行后,会在当前目录生成一个output.xlsx文件,内容如下:

姓名年龄城市
张三28北京
李四34上海

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 5:10:02

学霸同款2026继续教育AI论文平台TOP10:毕业论文写作全测评

学霸同款2026继续教育AI论文平台TOP10&#xff1a;毕业论文写作全测评 2026继续教育AI论文平台测评&#xff1a;选对工具&#xff0c;提升写作效率 在当前学术环境日益严格的背景下&#xff0c;继续教育群体在撰写毕业论文时面临诸多挑战&#xff0c;如选题困难、文献检索繁琐、…

作者头像 李华
网站建设 2026/5/1 5:11:24

大模型测试的“评估指标”:BLEU?ROUGE?都不够!

传统指标的黄金时代与局限 在机器翻译与文本摘要时代&#xff0c;BLEU和ROUGE曾是指标领域的双璧。BLEU通过n-gram精确匹配衡量译文准确性&#xff0c;ROUGE则基于召回率评估摘要内容覆盖度。然而&#xff0c;当千亿参数大模型掀起生成式AI浪潮时&#xff0c;这些指标暴露了三…

作者头像 李华
网站建设 2026/5/1 5:09:20

大数据BI工具的分类预测模型

大数据BI工具的分类预测模型&#xff1a;用数据“算”出未来的魔法指南 关键词&#xff1a;大数据BI工具、分类预测模型、数据挖掘、业务决策、机器学习算法 摘要&#xff1a;在企业数字化转型的浪潮中&#xff0c;“用数据说话”早已不是口号——而大数据BI工具中的“分类预测…

作者头像 李华
网站建设 2026/5/1 7:11:11

小白必看!AR开发从入门到实战全攻略

把虚拟内容与真实世界精准融合的 AR&#xff08;增强现实&#xff09;技术&#xff0c;如今已在广告营销、教育科普、工业辅助等诸多领域大展身手。《精灵宝可梦 GO》的爆火让大众见识到AR的魅力&#xff0c;AR导航的普及则让这项技术走进了日常生活&#xff0c;种种迹象都让AR…

作者头像 李华
网站建设 2026/4/28 21:45:59

数字化做完却没有价值?问题可能不在技术,而在架构

从安托&#xff08;ATOZ&#xff09;30余年实践&#xff0c;看架构驱动与知识资本化的真正含义&#xff0c;以下内容源自《制造业数字化转型架构设计&#xff08;APA&#xff08;ATOZ Process Approach&#xff09;&#xff09;白皮书》在复杂制造业中&#xff0c;数字化转型失…

作者头像 李华