news 2026/5/1 8:33:14

310. Java Stream API -大小特性和子大小特性流

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
310. Java Stream API -大小特性和子大小特性流

文章目录

  • 310. Java Stream API -大小特性和子大小特性流(Sized and Subsized Streams)
    • ✅ **SIZED 流**
      • 示例:
      • 示例代码:检查一个 `ArrayList` 是否是 SIZED 流
      • 输出:
    • ✅ **SUBSIZED 流**
      • **为什么有些流是 SUBSIZED 而有些不是?**
      • 示例代码:检查 `HashSet` 是否是 SUBSIZED 流
      • 输出:
    • ✅ **流转换对 SIZED 和 SUBSIZED 特性的影响**
      • 示例:映射流时保持特性
      • 输出:
      • 示例:过滤流时丧失特性
      • 输出:
    • ✅ **并行流的优化**
      • 小结:

310. Java Stream API -大小特性和子大小特性流(Sized and Subsized Streams)

在 Java 中,流的**大小特性(SIZED)子大小特性(SUBSIZED)**在处理数据时非常重要,尤其是在使用并行流时。掌握这两个特性有助于优化并行流的性能。

SIZED 流

SIZED流指的是已知流中元素的数量的流。简单来说,创建流时,如果能够提前知道流中元素的数量,那么这个流就是SIZED流。

示例:

  • 集合(Collection):所有实现了Collection接口的集合类(如ArrayListHashSet)都可以创建一个 SIZED 流,因为集合有一个size()方法,直接可以获取元素的数量。
  • 无法获取大小的流:某些流(如通过Files.lines(path)Pattern.splitAsStream(line)创建的流)不能在流创建时知道元素的数量,必须通过实际处理流的数据才能获得大小,因此它们不是 SIZED 流。

示例代码:检查一个ArrayList是否是 SIZED 流

Predicate<Stream<?>>isSized=stream->((stream.spliterator().characteristics()&Spliterator.SIZED)!=0);List<String>strings=newArrayList<>();System.out.println("ArrayList is sized? "+isSized.test(strings.stream()));

输出:

ArrayListis sized?true

这段代码演示了如何检查ArrayList创建的流是否具有SIZED特性。由于ArrayList可以在创建流时知道其大小,因此它是一个 SIZED 流。

SUBSIZED 流

SUBSIZED流涉及到流在并行处理时的分割方式。在并行流中,流会被分成多个部分并分配给不同的 CPU 核心进行计算。能够分割成相等大小子部分的流称为 SUBSIZED 流。

为什么有些流是 SUBSIZED 而有些不是?

  • ArrayListArrayList内部存储元素的数组非常适合分割,可以直接将其拆分成两个大小相等的部分,因此它是SIZEDSUBSIZED的流。
  • HashSet:虽然HashSet是 SIZED 流,但它的存储方式不同。由于HashSet是通过哈希算法存储元素的,无法直接知道如何将其拆分成大小相等的部分。因此,HashSet的流是 SIZED,但不是 SUBSIZED 流。

示例代码:检查HashSet是否是 SUBSIZED 流

Predicate<Stream<?>>isSubSized=stream->((stream.spliterator().characteristics()&Spliterator.SUBSIZED)!=0);Set<String>strings=newHashSet<>();System.out.println("HashSet is sized? "+isSized.test(strings.stream()));System.out.println("HashSet is subsized? "+isSubSized.test(strings.stream()));

输出:

HashSetis sized?trueHashSetis subsized?false

这段代码演示了如何检查一个HashSet创建的流是否是 SUBSIZED 流。虽然HashSet是 SIZED 流,但由于它的存储方式,无法分割成大小相等的子部分,因此它不是 SUBSIZED 流。

流转换对 SIZED 和 SUBSIZED 特性的影响

  • 保持 SIZED 和 SUBSIZED 特性:像map()sorted()等操作不会改变流的 SIZED 和 SUBSIZED 特性。
  • 丧失 SIZED 和 SUBSIZED 特性:像filter()distinct()flatMap()这样的操作会丧失流的 SIZED 和 SUBSIZED 特性。

示例:映射流时保持特性

Stream<String>nonSubSizedStream=Stream.of("apple","banana","cherry");Stream<String>mappedStream=nonSubSizedStream.map(String::toUpperCase);System.out.println("Mapped stream is sized? "+isSized.test(mappedStream));// truenonSubSizedStream=Stream.of("apple","banana","cherry");mappedStream=nonSubSizedStream.map(String::toUpperCase);System.out.println("Mapped stream is subsized? "+isSubSized.test(mappedStream));// true

输出:

Mappedstream is sized?trueMappedstream is subsized?true

这段代码演示了对流进行map()操作后,流仍然保留了 SIZED 和 SUBSIZED 特性。

示例:过滤流时丧失特性

Stream<String>filteredStream=nonSubSizedStream.filter(s->s.length()>5);System.out.println("Filtered stream is sized? "+isSized.test(filteredStream));// falseSystem.out.println("Filtered stream is subsized? "+isSubSized.test(filteredStream));// false

输出:

iltered stream is sized?falseFilteredstream is subsized?false

这段代码演示了对流进行filter()操作后,丧失了 SIZED ,SUBSIZED 特性。

并行流的优化

对于并行流,SIZED 和 SUBSIZED 特性尤其重要。通过确保流是 SIZED 且 SUBSIZED,可以使流在并行计算时更加高效。例如,当流的子部分大小已知时,流的并行执行能够更均匀地分配计算任务,从而减少处理时间。

小结:

  1. SIZED 流:知道流中元素的数量,适用于那些可以快速获取大小信息的数据源,如ArrayListHashSet
  2. SUBSIZED 流:能够将流分割成大小相等的部分,适用于那些数据结构具有明确划分和大小的流,如ArrayList
  3. 流转换:某些流操作(如map()sorted())会保留 SIZED 和 SUBSIZED 特性,而其他操作(如filter()flatMap()distinct())可能会丧失这些特性。
  4. 并行流优化:确保流是 SIZED 和 SUBSIZED 对于并行流的性能至关重要。

掌握这两个特性及其如何影响流的处理方式,可以帮助你在 Java 流处理中更好地优化性能,尤其是在并行处理时。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 4:24:52

一天一个Python库:pycparser - 解析C代码、理解C的抽象语法树

pycparser - 解析C代码、理解C的抽象语法树 一、什么是pycparser&#xff1f; pycparser 是一个用于纯 Python 实现的 C 语言解析器库。 它可以帮助你&#xff1a; 将 C 代码解析成抽象语法树&#xff08;AST&#xff09;。遍历和分析 C 语言的 AST。基于 C 代码进行静态分析和…

作者头像 李华
网站建设 2026/4/23 23:47:54

测试用例的负责人:AI时代下执行主体的重构与协同

责任主体的演变动因 传统测试体系中&#xff0c;测试工程师独立承担用例设计与执行的双重职责。但随着AI生成测试用例技术普及&#xff08;如DeepSeek、Testim等工具应用&#xff09;&#xff0c;执行主体呈现多元化趋势。2025年行业调研显示&#xff0c;73%的团队已采用"…

作者头像 李华
网站建设 2026/4/23 19:22:12

语义化标签页面布局:不使用DIV的完整解决方案

语义化标签页面布局&#xff1a;不使用DIV的完整解决方案 我将创建一个不使用任何<div>标签&#xff0c;完全基于语义化HTML标签的页面布局&#xff0c;包含完整的文章内容。这个页面将展示如何用语义化标签构建复杂的布局&#xff0c;并配有一篇超过10000字的深度技术文…

作者头像 李华
网站建设 2026/4/13 17:27:03

更新啦!我用 Claude Skills 做的剪辑 Agent!识别效果+交互大升级

大家好&#xff0c;我是成峰。 剪辑 Skills 更新了。 上一版发出去后&#xff0c;收到很多反馈&#xff1a; 最多的问题是两个&#xff1a; 下载 5GB 模型要等几十分钟&#xff0c;很多人直接放弃了 文档里一行行找口误&#xff0c;太累了 所以这次做了一次大改&#xff1…

作者头像 李华
网站建设 2026/5/1 7:51:10

某中心30余篇NAACL论文技术速览

近年来&#xff0c;自然语言处理&#xff08;NLP&#xff09;和计算语言学领域在十年前被深度学习革命化之后&#xff0c;再次被大语言模型&#xff08;LLM&#xff09;革命化。不出所料&#xff0c;在今年的计算语言学协会北美分会&#xff08;NAACL&#xff09;会议上&#x…

作者头像 李华