news 2026/6/15 15:37:25

使用SpringAI实现对话机器人

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
使用SpringAI实现对话机器人

一、spring-ai实现对话机器人

step1.引入spring-ai的依赖管理项

<dependencyManagement><dependencies><dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-bom</artifactId><version>${spring-ai.version}</version><type>pom</type><scope>import</scope></dependency></dependencies></dependencyManagement>

在项目pom.xml中添加spring-ai的版本信息:

<spring-ai.version>1.1.2</spring-ai.version>

step2.引入模型对应的依赖
如:引入spring-ai-ollama的依赖:

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-ollama-spring-boot-starter</artifactId></dependency>

SpringAI完全适配了SpringBoot的自动装配功能,而且给不同的大模型提供了不同的starter,比如:

模型/平台starter
Anthropic<dependency> <groupId>org.springframework.ai</groupId> <artifactId>spring-ai-anthropic-spring-boot-starter</artifactId> </dependency>
Azure OpenAI<dependency> <groupId>org.springframework.ai</groupId> <artifactId>spring-ai-azure-openai-spring-boot-starter</artifactId> </dependency>
DeepSeek<dependency> <groupId>org.springframework.ai</groupId> <artifactId>spring-ai-openai-spring-boot-starter</artifactId> </dependency>
Hugging Face<dependency> <groupId>org.springframework.ai</groupId> <artifactId>spring-ai-huggingface-spring-boot-starter</artifactId> </dependency>
Ollama<dependency> <groupId>org.springframework.ai</groupId> <artifactId>spring-ai-ollama-spring-boot-starter</artifactId> </dependency>
OpenAI<dependency> <groupId>org.springframework.ai</groupId> <artifactId>spring-ai-openai-spring-boot-starter</artifactId> </dependency>

step3.配置模型

以ollama为例,我们将application.properties修改为application.yaml,然后添加下面的内容:

spring: application: name: ai-demo ai: ollama: base-url: http://localhost:11434 # ollama服务地址, 这就是默认值 chat: model: deepseek-r1:7b # 模型名称 options: temperature: 0.8 # 模型温度,影响模型生成结果的随机性,越小越稳定

以openai为例,添加下面的内容:

spring: ai: openai: base-url: https://dashscope.aliyuncs.com/compatible-mode api-key: ${OPENAI_API_KEY} chat: options: model: qwen-max-latest #模型名称 temperature: 0.8 #模型温度,值越大,输出结果越随机

step4.配置客户端
ChatClient中封装了与AI大模型对话的各种API,同时支持同步式或响应式交互。

不过,在使用之前,首先我们需要声明一个ChatClient。
在config包下新建一个Configuration类:

importorg.springframework.ai.chat.client.ChatClient;importorg.springframework.ai.chat.client.advisor.SimpleLoggerAdvisor;importorg.springframework.ai.ollama.OllamaChatModel;importorg.springframework.context.annotation.Bean;importorg.springframework.context.annotation.Configuration;@ConfigurationpublicclassCommonConfiguration{// 注意参数中的model就是使用的模型,这里用了Ollama,也可以选择OpenAIChatModel@BeanpublicChatClientchatClient(OllamaChatModelmodel){returnChatClient.builder(model)// 创建ChatClient工厂.build();// 构建ChatClient实例}}

step5. 同步调用

我们定义一个Controller,在其中接收用户发送的提示词,然后把提示词发送给大模型,交给大模型处理,拿到结果后返回。

importlombok.RequiredArgsConstructor;importorg.springframework.ai.chat.client.ChatClient;importorg.springframework.web.bind.annotation.RequestMapping;importorg.springframework.web.bind.annotation.RequestParam;importorg.springframework.web.bind.annotation.RestController;@RequiredArgsConstructor@RestController@RequestMapping("/ai")publicclassChatController{privatefinalChatClientchatClient;@RequestMapping("/chat")publicStringchat(@RequestParam(defaultValue="讲个笑话")Stringprompt){returnchatClient.prompt(prompt)// 传入user提示词.call()// 同步请求,会等待AI全部输出完才返回结果.content();//返回响应内容}}

注意,基于call()方法的调用属于同步调用,需要所有响应结果全部返回后才能返回给前端。

step6.流式调用

在SpringAI中使用了WebFlux技术实现流式调用。

修改ChatController中的chat方法:

// 注意看返回值,是Flux<String>,也就是流式结果,另外需要设定响应类型和编码,不然前端会乱码@RequestMapping(value="/chat",produces="text/html;charset=UTF-8")publicFlux<String>chat(@RequestParam(defaultValue="讲个笑话")Stringprompt){returnchatClient.prompt(prompt).stream()// 流式调用.content();}

step7.System设定
在SpringAI中,设置System信息非常方便,不需要在每次发送时封装到Message,而是创建ChatClient时指定即可。
我们修改Configuration中的代码,给ChatClient设定默认的System信息:

@BeanpublicChatClientchatClient(OllamaChatModelmodel){returnChatClient.builder(model)// 创建ChatClient工厂实例.defaultSystem("").defaultAdvisors(newSimpleLoggerAdvisor()).build();// 构建ChatClient实例}
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 13:52:10

PyTorch模型导出ONNX格式:跨平台部署前置步骤

PyTorch模型导出ONNX格式&#xff1a;跨平台部署前置步骤 在智能设备无处不在的今天&#xff0c;一个训练好的深度学习模型如果无法高效运行在手机、边缘网关或云端服务器上&#xff0c;那它的价值就大打折扣。算法工程师常面临这样的困境&#xff1a;在 PyTorch 中训练出高精…

作者头像 李华
网站建设 2026/6/15 14:52:12

Markdown生成PDF文档:PyTorch技术报告输出

Markdown生成PDF文档&#xff1a;PyTorch技术报告输出 在深度学习项目迭代日益频繁的今天&#xff0c;一个常被忽视却至关重要的问题浮出水面&#xff1a;如何让实验成果高效、准确地传达给团队成员或上级决策者&#xff1f; 很多工程师都经历过这样的场景——模型训练完成&…

作者头像 李华
网站建设 2026/6/15 12:49:40

SSH隧道转发可视化界面:远程调试PyTorch模型的新方法

SSH隧道转发可视化界面&#xff1a;远程调试PyTorch模型的新方法 在深度学习项目开发中&#xff0c;一个常见的场景是&#xff1a;你的代码跑在一个远在数据中心的服务器上&#xff0c;那台机器配备了多块A100显卡&#xff0c;而你坐在咖啡馆里&#xff0c;手边只有一台轻薄本。…

作者头像 李华
网站建设 2026/6/15 13:47:48

YOLOv11论文解读:创新点与PyTorch代码复现可能性

YOLOv11论文解读&#xff1a;创新点与PyTorch代码复现可能性 在计算机视觉领域&#xff0c;目标检测的演进速度令人瞩目。从早期两阶段模型到YOLO系列开创的“单次推理”范式&#xff0c;实时性与精度的边界不断被突破。近年来&#xff0c;尽管Ultralytics官方尚未发布YOLOv11&…

作者头像 李华
网站建设 2026/6/10 2:16:45

基于麻雀搜索(ssa-cnn)优化卷积神经网络数据预测模型 开发语言matlab

基于麻雀搜索(ssa-cnn)优化卷积神经网络数据预测模型 开发语言matlab 多输入单输出麻雀搜索算法&#xff08;SSA&#xff09;和卷积神经网络&#xff08;CNN&#xff09;的结合&#xff0c;最近在时间序列预测领域逐渐火了起来。这种组合特别适合处理多变量输入但只需要输出单…

作者头像 李华