news 2026/6/4 16:00:03

Ollama 安装,流式输出,多模态,思考模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Ollama 安装,流式输出,多模态,思考模型

接入ollama本地模型

ollama是大语言模型的运行环境 , 支持将开源的大语言模型以离线的方式部署到本地,进行私有化部署。 这也是企业中常用的方案, 因为本地化部署能保证企业级的数据安全, 降低企业使用成本。

可以将我们的 ollama 理解为是我们的 Docker 容器(Docker 拉取的是镜像),而 Ollama 拉取的就是大模型的镜像,同时运行大模型

本地大模型安装

https://ollama.com/download

点击下载, 一直下一步即可非常简单

安装完后运行cmd --> ollama list 查看已安装的大模型(开始肯定什么都没有)

拉取模型 ollama run qwen3:4b

https://ollama.com/library/qwen3

1. 这里的4b=40亿参数 对应gpu显存差不多是4G ,当然8B也可以只是比较卡

测试

基于spring-ai使用 上我们在 Ollama 本地模型部署的大模型

添加依赖(添加 ollama 的 SDK 依赖)

<dependency>

<groupId>org.springframework.ai</groupId>

<artifactId>spring-ai-starter-model-ollama</artifactId>

</dependency>

配置(配置 ollama 的配置,注意:ollama 是不需要配置 api_key 的,因为只有云端大模型才需要根据你的 api_key 计费算钱,授权。本地大模型是不需要的)。ollama 的默认端口 11434 。

ollama 是可以拉取配置运行多个本地大模型的,所以这里需要配置指明我们使用的是 ollama 本地当中的那个大模型

ollama list # 查看 ollama 当前含有配置拉取的有那些大模型

spring.ai.ollama.base-url= http://localhost:11434 # 默认端口是:11434

spring.ai.ollama.chat.model= qwen3:4b

测试

/**

* @author

*/

@SpringBootTest

public class OllamaTest {

@Test

public void testChat(

// 自动装配了 OllamaChatModel 配置类

@Autowired OllamaChatModel ollamaChatModel) {

String text = ollamaChatModel.call("你是谁");

System.out.println(text);

}

}

关闭 thingking

因为我们的 qwen3 大模型是一个思考模型(存在一个深度思考的过程),所以可能会思考的比较久,这里我们可以关闭 ollama 当中的大模型思考(深度思考)模式

可以通过 在提示词结尾加入“/no_think” 指令

String text = ollamaChatModel.call("你是谁/no_think"); // 你的提示词上加上 /no_think 软关闭,深度思考过程

System.out.println(text);

但是依然有标签, 暂时可以前端单独处理下

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/1 16:12:17

【毕业设计】JAVA实现公交线路管理系统基于JAVA的北京市公交管理系统(源码+文档+远程调试,全bao定制等)

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

作者头像 李华
网站建设 2026/6/3 20:05:26

【毕业设计】基于Java的校内外卖订餐点餐配送系统基于JAVA的学院校内订餐系统的实现(源码+文档+远程调试,全bao定制等)

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

作者头像 李华
网站建设 2026/6/2 16:32:52

操作符详解

1. 算术操作符 - * / % &#xff08;1&#xff09; 除了%操作符之外&#xff0c;其他的几个操作符可以作用于整数和浮点数。 &#xff08;2&#xff09; 对于/操作符如果两个操作数都为整数&#xff0c;执行整数除法。而只要有浮点数执行的就是浮点数除法。 &#xff08;3&…

作者头像 李华
网站建设 2026/6/1 12:20:55

Java计算机毕设之基于Spring Boot+vue律师事务所案件管理系统的设计与开发基于java案件管理系统设计与实现(完整前后端代码+说明文档+LW,调试定制等)

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

作者头像 李华
网站建设 2026/6/4 19:04:07

Java计算机毕设之基于JAVA白云山景点门票销售在线管理系统基于JAVA白云山景点门票销售管理系统(完整前后端代码+说明文档+LW,调试定制等)

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

作者头像 李华
网站建设 2026/6/2 16:58:32

Java计算机毕设之基于Java web的汽车租赁系统设计与实现基于Javaweb的租车管理系统的设计与实现(完整前后端代码+说明文档+LW,调试定制等)

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

作者头像 李华