news 2026/5/31 4:14:07

LangChain4j 开发Java Agent智能体- 阿里云百炼大模型平台接入以及Ollama简介以及安装和使用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
LangChain4j 开发Java Agent智能体- 阿里云百炼大模型平台接入以及Ollama简介以及安装和使用

大家好,我是Java1234_小锋老师,最近更新《2027版本 LangChain4j 开发Java Agent智能体 视频教程》专辑,感谢大家支持。


本课程主要介绍和讲解 LangChain4j 简介,阿里云百炼大模型平台接入,Ollama简介以及安装和使用,HelloWorld 实现,日志配置,集成SpringBoot,Ai Service 使用,对话与提示词工程(Prompt),结构化输出,会话记忆,工具调用(Function Calling),嵌入模型与向量数据库,RAG(检索增强生成),MCP(模型上下文协议),多模态支持

视频教程+课件+源码打包下载:

链接:https://pan.baidu.com/s/1o-zRfndo1HHrS_uFroOiCw?pwd=1234
提取码:0000

LangChain4j 开发Java Agent智能体- 阿里云百炼大模型平台接入以及Ollama简介以及安装和使用

阿里云百炼大模型平台接入

阿里云百炼平台简介

阿里云百炼平台是阿里云推出的一站式大模型开发与应用平台。它的核心目标是为企业和开发者提供从模型选择、训练调优到应用部署的全链路服务,降低AI应用的开发门槛和周期。

阿里云百炼平台官方

具体来说,它具备以下核心能力和特点:

  • 丰富的模型选择:平台集成了包括阿里通义系列在内的上百款国内外主流大模型,覆盖文本生成、多模态理解等多种场景。用户可以根据业务需求灵活选择。

  • 一站式模型定制:支持用户利用自己的数据,通过可视化界面进行模型的微调(SFT)、评估和部署,让模型更贴合特定业务场景。

  • 便捷的应用构建:提供低代码的开发环境,通过简单的流程编排和知识库集成,可以快速搭建如智能客服、AI助手等应用。它支持检索增强生成技术,让模型能结合企业私有知识进行回答。

  • 开放的生态与工具:首批上线了50多款主流的MCP服务(如高德、Notion等),让大模型能轻松连接和使用外部工具,实现更复杂的任务,比如构建一个能自动规划行程的智能体。

  • 灵活的成本与安全:采用按量付费模式,新用户通常有免费额度。同时,平台承诺不会将用户数据用于模型训练,并采用多重加密保障数据安全。

阿里云百炼大模型平台注册以及创建API key

打开阿里云百炼平台官方

我们用支付宝快捷登录。

官方默认给我们一些主流模型的试用100万 token额度,学习足够了,我们点“模型服务” -> "工作台" -> 模型用量",这里有个非常重要的注意点,大家一定要开启下“免费额度用完即停”。

接下来,我们要使用阿里云百炼平台接口的话,需要先创建API Key。

我们点“模型服务” -> "秘钥服务" ,点击“创建API Key”

弹出“创建API Key”窗体,选择归属账号,然后点“确定”即可

这样的话,我们就创建好了API Key

环境变量里面,我们要把API KEY配置上去,后面我们讲项目需要用到:

环境变量名:OPENAI_API_KEY

Ollama简介以及安装和使用

前面我们用阿里云百炼平台,是很方便,快捷,有免费额度,但是仅仅是部分模型有免费额度,而且额度也是有限制的。所以我们还有一种本地方案 - 使用Ollama部署蒸馏模型。

Ollama简介

Ollama官网

Ollama 是一个开源的本地大语言模型运行工具,它让用户能够轻松地在自己的电脑上部署和使用各种大型语言模型,无需联网也不需要昂贵的云服务。

核心特点

1. 简单易用

  • 一键安装,命令行操作

  • 几条命令就能下载和运行模型

  • 类似 Docker 的使用体验

2. 本地运行

  • 数据完全本地保存,保护隐私

  • 无需联网,随时随地可用

  • 没有 API 调用限制和费用

3. 模型支持

  • 支持 Llama 3、Phi 3、Mistral、Gemma 等主流开源模型

  • 可通过 Modelfile 自定义模型

  • 支持 GGUF 格式的模型导入

适用场景

  • 开发者本地测试和开发

  • 隐私敏感的数据处理

  • 离线环境使用

  • 学习和研究大模型

Ollama 极大地降低了普通人使用大语言模型的门槛,让任何人都能方便地在自己的电脑上体验先进的 AI 技术。

Ollama蒸馏模型介绍

蒸馏模型(Distilled Model)是通过知识蒸馏技术压缩后的小型模型,Ollama 支持运行这类轻量化模型,让普通电脑也能流畅运行 AI。

什么是知识蒸馏?

知识蒸馏就像一个师生学习过程

  • 教师模型:大型模型(如 700 亿参数的 Llama),知识丰富但运行慢

  • 学生模型:小型模型(如 70 亿参数),学习模仿教师模型的输出

  • 结果:学生模型体积小、速度快,同时保持接近教师模型的性能

Ollama 支持的蒸馏模型

1. Llama 3.2 系列(Meta)

  • 1B 和 3B 参数版本

  • 适合移动设备和低配置电脑

  • 保持较好的对话能力

2. Phi-3 系列(微软)

  • Mini(3.8B)、Small(7B)版本

  • 微软精心挑选训练数据

  • 小尺寸但推理能力强

3. Gemma 系列(Google)

  • 2B 和 7B 参数

  • 基于 Gemini 技术蒸馏而来

  • 开源免费商用

4. Qwen 系列(阿里)

  • 0.5B、1.8B、4B、7B 版本

  • 中英文能力均衡

  • 适合中文场景

蒸馏模型在 Ollama 中的优势

性能对比(以 Llama 3 为例):

模型参数内存需求速度适用设备
原版70B>140GB服务器
蒸馏版8B~16GB个人电脑
蒸馏版3B~6GB极快笔记本/RPi

实际好处

  • 普通电脑(8-16GB 内存)也能运行

  • 生成速度快 3-10 倍

  • 功耗低,适合长时间运行

  • 硬盘空间占用小

Ollama下载安装

ollama下载地址:

https://ollama.com/

点击 下载即可。

下载到本地后,我们双击安装:

出现下面这个界面,就说明安装好了

默认界面还是很简约的,提供了聊天对话框,以及右侧可以选择模型,我们可以搜索然后下载需要的模型

这里面每个模型后面都有多少b,比如4b,这个b就是10亿参数,4b就是40亿参数,我们根据当前机器的显卡显存大小来选择具体的参数模型,比如你电脑就4个G的显存,那就选个4b,如果是高配32G显存,那基本都能跑。

比如我们选择一个4b(40亿参数)的qwen模型,去提问“你是谁?”,那么Ollama先会自动下载模型,然后回答问题。

下载完后,就自动回答你的问题。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/31 4:09:52

手把手教你用信号源和示波器DIY一个简易TDR,实测同轴电缆阻抗(附详细波形分析)

低成本DIY时域反射仪:用信号源和示波器精准测量同轴电缆阻抗在电子工程和射频系统设计中,同轴电缆的特征阻抗匹配是确保信号完整性的关键因素。专业级时域反射仪(TDR)动辄数万元的价格让许多爱好者望而却步。本文将揭示一个行业内的实用技巧:…

作者头像 李华
网站建设 2026/5/31 4:09:39

从MySQL转战PostgreSQL?这份避坑指南和实战对比帮你平滑迁移

从MySQL到PostgreSQL:技术栈迁移的深度避坑指南1. 迁移前的战略评估当技术团队考虑将数据库从MySQL迁移到PostgreSQL时,首先需要明确的是:这不是简单的语法转换,而是两种不同设计哲学的技术栈切换。PostgreSQL以其严格的SQL标准兼…

作者头像 李华
网站建设 2026/5/31 4:09:37

从海量数据到物理洞察:SISSO符号回归的完整实践指南

从海量数据到物理洞察:SISSO符号回归的完整实践指南 【免费下载链接】SISSO A data-driven method combining symbolic regression and compressed sensing for accurate & interpretable models. 项目地址: https://gitcode.com/gh_mirrors/si/SISSO 在…

作者头像 李华