news 2026/6/12 4:52:58

当 CompletableFuture 遇到 AI:如何并行调用 5 个大模型并“投票”选出最佳答案?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
当 CompletableFuture 遇到 AI:如何并行调用 5 个大模型并“投票”选出最佳答案?

😵 前言:谁在说谎?

我们在使用大模型(LLM)开发应用时,最头疼的问题就是**“幻觉”**。
当你问:“鲁迅和周树人是什么关系?”

  • GPT-4 说:“是同一个人。”
  • 某个国产小模型说:“鲁迅是周树人的哥哥。”
  • 另一个模型说:“鲁迅是周树人的邻居。”

如果你只依赖一个模型,你的应用可能随时会“翻车”。
在金融、医疗或法律咨询等严谨场景下,我们不能把赌注押在一个模型上。我们需要一个**“专家评审团”**。

今天的方案非常硬核:我们将同时并行调用 5 个不同的大模型(GPT-4, Claude 3, DeepSeek, 文心一言, 通义千问),让它们对同一个问题进行作答,然后通过“投票算法”选出出现频率最高的答案作为最终结果。

这就对 Java 的并发能力提出了极高要求:串行调用要 20 秒,如何用 CompletableFuture 将其压缩到 3 秒?


🧠 核心架构:多模型并发投票 (MoE 思想)

我们的目标不是让模型排队回答,而是“万箭齐发”。

架构流程图:

决策层
并发执行层
异步线程 1
异步线程 2
异步线程 3
异步线程 4
异步线程 5
答案 A
答案 A
答案 A
答案 B
超时 Null
多数票决
选出最佳答案
投票算法
结果聚合器
最终响应: 答案 A
GPT-4
Java 后端服务
Claude-3
DeepSeek
文心一言
通义千问
用户提问

🛠️ 实战代码:CompletableFuture 的艺术

1. 定义模型接口

首先,我们定义一个统一的接口,并模拟 5 个不同的实现。

publicinterfaceLlmClient{Stringchat(Stringquestion);}// 模拟不同模型的实现类// 在真实场景中,这里会调用 HTTP API
2. 并行调用核心逻辑 (Magic Happens Here)

这是本文的精华。我们需要处理两个关键问题:

  1. 并行:所有模型必须同时开跑。
  2. 兜底:如果某个模型挂了或者太慢,不能拖累整体流程(设置超时)。
importjava.util.Arrays;importjava.util.List;importjava.util.Map;importjava.util.concurrent.CompletableFuture;importjava.util.concurrent.TimeUnit;importjava.util.stream.Collectors;publicclassModelEnsembleService{privatefinalList<LlmClient>clients;publicModelEnsembleService(List<LlmClient>clients){this.clients=clients;}publicStringgetBestAnswer(Stringquestion){// 1. 将每个模型调用封装成 CompletableFutureList<CompletableFuture<String>>futures=clients.stream().map(client->CompletableFuture.supplyAsync(()->client.chat(question))// 关键点:每个任务单独设置 3秒超时// 如果超时,返回 null,不抛异常打断主流程.completeOnTimeout(null,3,TimeUnit.SECONDS).exceptionally(ex->null)// 如果报错也忽略).collect(Collectors.toList());// 2. 等待所有任务完成 (join 阻塞主线程,直到所有 future 返回或超时)CompletableFuture.allOf(futures.toArray(newCompletableFuture[0])).join();// 3. 收集非空结果List<String>results=futures.stream().map(CompletableFuture::join).filter(response->response!=null&&!response.isBlank()).collect(Collectors.toList());// 4. 进行投票决策returnvote(results);}}
3. 投票算法 (Voting Mechanism)

对于文本生成的投票,比选择题要复杂。这里我们实现一个简易版:基于语义相似度的归类投票(实际生产中可以使用 Embedding 向量距离计算)。

为了演示简单,我们假设模型输出的是简短的确定性答案。

privateStringvote(List<String>answers){if(answers.isEmpty()){return"所有模型均调用失败";}System.out.println("收到有效回答数: "+answers.size());answers.forEach(System.out::println);// 简单统计:寻找出现次数最多的答案Map<String,Long>frequencyMap=answers.stream().collect(Collectors.groupingBy(String::trim,Collectors.counting()));// 找到票数最高的returnfrequencyMap.entrySet().stream().max(Map.Entry.comparingByValue()).map(Map.Entry::getKey).orElse(answers.get(0));// 兜底返回第一个// 进阶思路:如果 5 个答案都不一样,可以让 GPT-4 来当“裁判”进行总结。}

💥 效果演示:5 模大战

假设我们问:“Java 的String是基础数据类型吗?”

后台日志输出:

[pool-1-thread-1] GPT-4: 不是 [pool-1-thread-2] Claude: 不是引用类型 [pool-1-thread-3] Ernie: 是基础类型 (幻觉) [pool-1-thread-4] DeepSeek: 不是 [pool-1-thread-5] Qwen: (超时 null) 收到有效回答数: 4 投票结果: - "不是": 3 票 - "是基础类型": 1 票 🏆 最终当选答案: 不是

看!哪怕有一个模型(Ernie)因为训练数据问题回答错误,另一个模型(Qwen)因为网络超时挂了,我们的系统依然通过“多数服从少数”的机制,输出了正确的结论。

这就叫系统鲁棒性


📝 总结

AI 模型本身是不完美的,但良好的工程架构可以弥补模型的缺陷

通过 Java 的CompletableFuture,我们能够以极低的成本构建出一个“MoE (Mixture of Experts)”架构。这在企业级 RAG(检索增强生成)和高可靠 AI 助手场景中,是绝对的杀手锏。

不要总是试图去微调模型,有时候,多雇几个“实习生”一起干活,比请一个“专家”更靠谱。


博主留言:
在实际业务中,你是如何处理 AI 模型输出不一致的问题的?
在评论区回复“并发”,我发给你一份《Java 并发编程与 AI 工程化实战源码》,包含更高级的 Embedding 投票算法实现!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 23:32:12

25、常见加密文件系统解密与磁盘分区分析指南

常见加密文件系统解密与磁盘分区分析指南 在数据处理与分析过程中,我们常常会遇到各种加密的文件系统以及不同的磁盘分区方案。了解如何解密这些加密系统以及分析磁盘分区布局,对于数据恢复、取证等工作至关重要。本文将详细介绍几种常见加密文件系统(如 BitLocker、Apple F…

作者头像 李华
网站建设 2026/6/11 18:57:12

Java毕设项目:基于Java web的在线数码商城销售系统基于java的华为数码商城交易平台(源码+文档,讲解、调试运行,定制等)

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

作者头像 李华
网站建设 2026/6/9 20:02:30

Linux中用于切换目录的cd命令

1. 基本概念1.1 命令作用当我们使用Linux系统时&#xff0c;会在不同目录之间进行切换&#xff0c;为此&#xff0c;我们必须使用cd命令。 cd是“更改目录”的缩写&#xff0c;表示“更改目录”。当目录切换成功时&#xff0c;cd命令返回0;而目录切换失败时&#xff0c;cd命令返…

作者头像 李华
网站建设 2026/6/10 18:27:24

Java毕设项目:基于Web的酒店客房管理系统设计与实现基于Java的酒店住宿管理系统的设计与实现基于Java的酒店客房管理系统设计与实现(源码+文档,讲解、调试运行,定制等)

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

作者头像 李华
网站建设 2026/6/12 1:08:32

24、Linux 设备驱动与网络设备全解析

Linux 设备驱动与网络设备全解析 1. 网络设备概述 网络设备与普通设备不同,它不通过设备节点访问,也没有主次设备号。内核会根据字符串和实例编号为网络设备分配名称。例如,网络驱动注册接口的代码如下: my_netdev = alloc_netdev(0, "net%d", NET_NAME_UNKN…

作者头像 李华