news 2026/6/15 18:32:57

SpringBoot进阶教程(八十七)数据压缩

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
SpringBoot进阶教程(八十七)数据压缩

拆分JSON字符串​

1.1按结构拆分​

数组拆分​​:若JSON包含大型数组,可将其拆分为多个小数组。

复制代码

// 示例:将大数组拆分为多个子数组

JSONArray bigArray = new JSONArray(jsonString);

int chunkSize = 100;

for (int i = 0; i < bigArray.length(); i += chunkSize) {

JSONArray chunk = new JSONArray();

for (int j = i; j < Math.min(i + chunkSize, bigArray.length()); j++) {

chunk.put(bigArray.get(j));

}

String chunkJson = chunk.toString();

// 处理或保存chunkJson

}

复制代码

​​对象拆分​​:若JSON是嵌套对象,可按层级拆分为子对象。

1.2按大小拆分(流式处理)​​

使用流式API(如Jackson的JsonParser)逐块读取JSON内容,避免一次性加载到内存:

JsonFactory factory = new JsonFactory();

try (JsonParser parser = factory.createParser(new File("large.json"))) {

while (parser.nextToken() != null) {

// 逐Token处理,如按特定条件拆分

}

}

回到顶部

v压缩JSON字符串​

2.1使用GZIP压缩​

复制代码

import java.util.zip.GZIPOutputStream;

import java.io.ByteArrayOutputStream;

public static byte[] compress(String data) throws IOException {

ByteArrayOutputStream bos = new ByteArrayOutputStream(data.length());

try (GZIPOutputStream gzip = new GZIPOutputStream(bos)) {

gzip.write(data.getBytes());

}

return bos.toByteArray();

}

// 压缩后的数据可用于传输或存储

byte[] compressed = compress(jsonString);

复制代码

2.2使用Deflater压缩​

复制代码

import java.util.zip.Deflater;

public static byte[] deflateCompress(String data) {

Deflater deflater = new Deflater();

deflater.setInput(data.getBytes());

deflater.finish();

byte[] buffer = new byte[1024];

ByteArrayOutputStream outputStream = new ByteArrayOutputStream();

while (!deflater.finished()) {

int count = deflater.deflate(buffer);

outputStream.write(buffer, 0, count);

}

deflater.end();

return outputStream.toByteArray();

}

复制代码

回到顶部

v优化JSON体积​​

3.1移除无用空格​

使用紧凑格式(无缩进、换行):

new JSONObject(jsonString).toString(); // 默认紧凑格式

3.2​​缩短键名​

将长字段名替换为短名称:

{"n":"Alice","a":30} // 原始键名可能为"name"、"age"

回到顶部

v流式处理大型JSON​​

使用流式API逐步解析,避免内存溢出:

复制代码

// Jackson流式API示例

JsonFactory factory = new JsonFactory();

try (JsonParser parser = factory.createParser(new File("large.json"))) {

JsonToken token;

while ((token = parser.nextToken()) != null) {

if (token == JsonToken.START_ARRAY) {

while (parser.nextToken() != JsonToken.END_ARRAY) {

// 逐条处理数组元素

JsonNode node = parser.readValueAsTree();

// 处理node...

}

}

}

}

复制代码

回到顶部

v分页处理​

其实也是拆分,将数据拆成若干份

回到顶部

v实践方案

复制代码

import com.fasterxml.jackson.databind.JsonNode;

import com.fasterxml.jackson.databind.ObjectMapper;

import java.io.ByteArrayInputStream;

import java.io.ByteArrayOutputStream;

import java.io.IOException;

import java.util.zip.GZIPInputStream;

import java.util.zip.GZIPOutputStream;

import org.apache.commons.codec.binary.Base64;

import java.nio.charset.StandardCharsets;

public class CompressHelper {

private static final ObjectMapper objectMapper = new ObjectMapper();

/**

* 方式1:去除JSON中的空格/换行等冗余字符(文本压缩)

* @param formattedJson 格式化的JSON字符串(含空格换行)

* @return 紧凑格式的JSON字符串

* @throws IOException JSON解析异常

*/

public static String compressJsonByRemovingSpaces(String formattedJson) throws IOException {

JsonNode jsonNode = objectMapper.readTree(formattedJson);

return objectMapper.writeValueAsString(jsonNode);

}

/**

* 方式2:使用GZIP算法对JSON字符串进行二进制压缩(适合网络传输)

* @param json 原始JSON字符串

* @return Base64编码的压缩后字符串(可直接传输)

* @throws IOException 压缩异常

*/

public static String compressJsonByGzip(String json) throws IOException {

try (ByteArrayOutputStream byteOut = new ByteArrayOutputStream();

GZIPOutputStream gzipOut = new GZIPOutputStream(byteOut)) {

gzipOut.write(json.getBytes("UTF-8"));

gzipOut.finish();

return Base64.encodeBase64String(byteOut.toByteArray());

}

}

public static String decompressJson(String source) throws IOException {

byte[] compressedData = Base64.decodeBase64(source);

try (ByteArrayInputStream byteIn = new ByteArrayInputStream(compressedData);

GZIPInputStream gzipIn = new GZIPInputStream(byteIn);

ByteArrayOutputStream byteOut = new ByteArrayOutputStream()) {

// 读取压缩数据并解压缩

byte[] buffer = new byte[1024];

int len;

while ((len = gzipIn.read(buffer)) != -1) {

byteOut.write(buffer, 0, len);

}

return byteOut.toString(StandardCharsets.UTF_8.name());

}

}

}

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 12:27:01

Instinct代码编辑模型:重新定义编程效率的终极解决方案

Instinct代码编辑模型&#xff1a;重新定义编程效率的终极解决方案 【免费下载链接】instinct 项目地址: https://ai.gitcode.com/hf_mirrors/continuedev/instinct 在当今快速发展的软件开发领域&#xff0c;代码编辑效率成为开发者面临的核心挑战。Instinct作为Conti…

作者头像 李华
网站建设 2026/6/15 12:27:06

PRQL跨语言集成揭秘:原来数据查询可以如此优雅

PRQL跨语言集成揭秘&#xff1a;原来数据查询可以如此优雅 【免费下载链接】prql PRQL/prql: 是一个类似于 SQL 的查询语言实现的库。适合用于查询各种数据库和数据格式。特点是支持多种数据库类型&#xff0c;提供了类似于 SQL 的查询语言。 项目地址: https://gitcode.com/…

作者头像 李华
网站建设 2026/6/15 12:27:07

分布式追踪工具终极对比:Jaeger与Zipkin完整指南

分布式追踪工具终极对比&#xff1a;Jaeger与Zipkin完整指南 【免费下载链接】orleans dotnet/orleans: Orleans是由微软研究团队创建的面向云应用和服务的分布式计算框架&#xff0c;特别适合构建虚拟 actor模型的服务端应用。Orleans通过管理actors生命周期和透明地处理网络通…

作者头像 李华
网站建设 2026/6/15 12:27:07

pulsar-admin终极指南:从零开始精通Apache Pulsar集群管理

你是否正在为Apache Pulsar这个强大的分布式消息系统的管理而头疼&#xff1f;面对复杂的配置参数和繁琐的操作流程&#xff0c;是否渴望找到一条快速上手的捷径&#xff1f;作为Apache Pulsar官方提供的命令行管理工具&#xff0c;pulsar-admin正是你需要的解决方案&#xff0…

作者头像 李华
网站建设 2026/6/15 12:27:03

如何在2025年让提示工程效果翻倍?实战技术解析与案例验证

如何在2025年让提示工程效果翻倍&#xff1f;实战技术解析与案例验证 【免费下载链接】Prompt-Engineering-Guide dair-ai/Prompt-Engineering-Guide: 是一个用于指导对话人工智能开发的文档。适合用于学习对话人工智能开发和自然语言处理。特点是提供了详细的指南和参考资料&a…

作者头像 李华
网站建设 2026/6/15 9:12:34

终极指南:快速掌握中文语义向量模型本地部署与推理

终极指南&#xff1a;快速掌握中文语义向量模型本地部署与推理 【免费下载链接】text2vec-base-chinese 项目地址: https://ai.gitcode.com/hf_mirrors/shibing624/text2vec-base-chinese 想要在本地环境中快速部署强大的中文语义向量模型吗&#xff1f;text2vec-base-…

作者头像 李华