news 2026/6/15 21:13:15

新型Brotli压缩格式将优化PDF文件大小

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
新型Brotli压缩格式将优化PDF文件大小

Brotli是当今应用最广泛却鲜为人知的压缩格式之一,已被各大浏览器和内容分发网络广泛采用。然而在PDF文档领域,自1996年版本1.2以来,PDF一直采用FlateDecode过滤器进行压缩,该过滤器也被用于.zip和.png文件的压缩。

这一现状即将改变。PDF协会正推进在今年夏季发布规范说明书,供开发者在PDF处理器中添加Brotli支持。业界期待Brotli能够快速纳入由国际标准化组织维护的官方PDF 2.0标准ISO 32000-2。

随着PDF文件大小不断增加,企业数据湖中存储的文件数量每年激增数十亿,对更高效压缩方法的需求前所未有。

使用Brotli压缩的优势在于能显著减小PDF文件体积。根据PDF协会成员Artifex Software在2025年的测试,平均可减少10%至25%的文件大小,具体取决于所编码内容的类型。

然而对企业而言,这只是工作的开始。当采用Brotli压缩的PDF开始流通时,未更新应用程序和库依赖项的用户将无法解压和打开新格式文件。这对PDF来说是首次出现这样的情况——尽管自2008年成为ISO标准以来,PDF已添加众多新功能,但从未阻止用户打开PDF文件。

最主要需要升级以支持Brotli的软件包括专有PDF创建和阅读工具,如Adobe Acrobat、Foxit PDF编辑器和Nitro PDF。浏览器集成的PDF阅读器也属此列。

除此之外,还有大量不太显眼的开源工具、库和SDK生态系统,它们在企业PDF工作流和自动化批处理中被广泛使用。查找并更新这些组件,特别是那些隐藏在第三方库深处的组件,将耗时颇多。

如果企业延迟更新,则有可能遇到采用支持Brotli的新软件创建的PDF文件,这些文件将无法在其旧版、未更新的程序上打开。当用户联系IT团队报告无法打开文件时,IT人员将直面这一问题。

为了推动Brotli的采用,文档处理开发商Apryse的软件工程师Guust Ysebie指出,开发者需要鼓励和支持。他表示:"必须有人第一个跳出来并制造声势,这样其他产品才会跟进。"

这是一个挑战,因为如Ysebie在PDF协会网站的文章中所解释的,Brotli的采用速度缓慢,原因在于PDF规范需要数百个利益相关者达成共识。

他建议通过三种方式缓解这一过渡过程。最简单的方法是通过多种信息渠道宣传升级必要性,作为意识提升活动的一部分。

一个更激进的建议是,启用Brotli的PDF可以设置为使旧版阅读器不再崩溃,而是显示"不支持"错误信息,鼓励客户升级,作为压缩内容的占位符。

最后一种策略是,志同道合的开发者主动升级开源库。Ysebie表示他已为多个库添加了Brotli支持,包括Apryse的iText SDK。

他指出,这就是现实中采用的方式:先非官方地创建功能,然后早期采用者实现它,这促使更大的产品也采用它。采用Brotli软件的关键时刻将是其在Adobe Reader中的出现。这将在某个时刻发生,但具体时间仍不清楚。

好消息是,由于只有有限数量的软件库需要升级,为这些软件添加支持应该很直接。然而,企业仍需将这些更新的镜像应用到当前应用中。

关于何时将Brotli添加到ISO PDF 2.0规范(自2015年以来在进行中)中,Ysebie同意这还有很长的路要走。但业界必须在某个时刻从旧技术转向新技术。他表示,"我们需要推动生态系统向前发展。开始会有些混乱,但未来潜力巨大。"

Q&A

Q1:Brotli压缩格式相比传统FlateDecode有什么优势?

A:Brotli可以将PDF文件大小平均减少10%至25%,具体取决于内容类型。它已在浏览器和CDN中广泛应用,具有高度的可靠性和效率。

Q2:企业升级支持Brotli会面临什么挑战?

A:企业需要更新各种应用程序、库和SDK,包括Adobe Acrobat、Foxit等专有软件和众多隐藏在第三方库中的开源组件。未更新的系统将无法打开采用Brotli压缩的PDF文件。

Q3:Brotli的采用推广有什么障碍?

A:PDF规范需要数百个利益相关者达成共识,这导致采用速度缓慢。业界可通过提升意识、优化错误提示、开发者主动升级开源库等方式推动采用。Adobe Reader的支持将是关键转折点。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 14:06:11

jsp二手车管理系统261ay(程序+源码+数据库+调试部署+开发环境)

本系统(程序源码数据库调试部署开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表门店管理员,会员,汽车品牌,汽车类型,二手汽车,订单信息,租赁汽车,汽车租赁,汽车归还,保险信息,保险购买开题报告内容一…

作者头像 李华
网站建设 2026/6/15 16:04:15

从小白到RAG实践者,收藏这份超详细大模型应用指南

文章介绍了RAG(检索增强生成)技术的概念与工作流程,详细描述了作为AI小白如何使用RAGFlow平台构建基于可靠数据源的聊天机器人。从数据预处理、嵌入、相似度检测到LLM输出的完整流程,展示了如何利用低代码平台快速搭建RAG应用&…

作者头像 李华
网站建设 2026/6/15 15:45:34

ModelEngine智能编排:构建下一代AI驱动的创新应用生态

引言:从工具到智能体——AI应用开发的范式转变当我们谈论AI应用时,大多数人仍停留在"单一功能工具"的认知阶段:一个聊天机器人回答问题,一个数据分析工具生成图表,一个办公软件处理文档。但真正的AI革命&…

作者头像 李华
网站建设 2026/6/15 15:03:35

LangChain自动化工作流完全指南:从零构建到实战部署,附完整代码详解

本文以"每周自动汇总客户邮件反馈并生成报告"为例,介绍了如何使用LangChain的Chain、Agent、Tool和Memory等模块构建自动化工作流。文章提供了从安装依赖、定义工具、构建分析链到组装完整工作流的代码实现,并介绍了使用APScheduler进行自动化…

作者头像 李华
网站建设 2026/6/15 14:35:35

AI Agent在智能浴室毛巾架中的除菌功能

AI Agent在智能浴室毛巾架中的除菌功能 关键词:AI Agent、智能浴室毛巾架、除菌功能、物联网、传感器、算法模型 摘要:本文深入探讨了AI Agent在智能浴室毛巾架除菌功能中的应用。详细介绍了相关核心概念,阐述了AI Agent实现除菌功能的核心算…

作者头像 李华
网站建设 2026/6/15 13:32:33

临床前研究中AI驱动的虚拟细胞模型

AI驱动的虚拟细胞模型有望通过整合多模态组学数据(如单细胞转录组学、蛋白质组学)与深度生成模型、图神经网络等先进算法,实现对药物反应、基因扰动及疾病进展的高精度预测,从而变革生命科学研究范式。本综述概述了虚拟细胞的技术…

作者头像 李华