news 2026/6/11 8:50:24

文心大模型10款ERNIE 4.5 模型系列正式开源(中文官方文档)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
文心大模型10款ERNIE 4.5 模型系列正式开源(中文官方文档)

发布时间:2025年6月30日
发布方:百度文心大模型团队
开源协议:Apache 2.0(个人与商业无限制免费使用,支持二次开发和私有化部署)
官方资源

  • GitHub 官方仓库:https://github.com/PaddlePaddle/ERNIE
  • Hugging Face 模型库:https://huggingface.co/baidu
  • 飞桨星河社区:https://aistudio.baidu.com/modelsoverview
  • 技术报告:https://yiyan.baidu.com/blog/posts/ernie4.5
  • 在线体验:https://yiyan.baidu.com

一、开源公告

2025年6月30日,百度正式全面开源文心大模型4.5(ERNIE 4.5)全系列10款模型,覆盖从0.3B端侧稠密模型424B超大规模多模态MoE模型的完整梯度矩阵,同步开放预训练权重、推理代码、开发套件和部署工具链。

这是中国AI产业迄今为止规模最大、覆盖场景最全面的大模型开源行动。ERNIE 4.5系列首创多模态异构混合专家架构,在指令遵循、知识记忆、逻辑推理和多模态理解等核心能力上达到全球领先水平,其中旗舰模型ERNIE-4.5-300B-A47B在28项主流基准测试中22项超越DeepSeek-V3-671B,成为目前性能最强的开源大模型之一。

此次开源将彻底降低AI技术的落地门槛,推动大模型从"少数企业的专利"变为"全行业的基础设施",加速中国AI生态的繁荣发展。


二、10款开源模型完整矩阵

ERNIE 4.5系列分为大语言模型多模态模型两大分支,共10款模型,提供PyTorch和PaddlePaddle双版本,总计23个模型文件,适配从端侧到云端的全场景需求。

2.1 大语言模型系列(7款)

模型名称总参数量激活参数量上下文窗口核心特点适用场景
ERNIE-4.5-300B-A47B-Base4240亿470亿128K通用旗舰基座,泛化能力最强通用AI应用、复杂推理、知识密集型任务
ERNIE-4.5-300B-A47B-Instruct4240亿470亿128K指令微调版,指令遵循能力业界第一智能对话、内容生成、代码开发
ERNIE-4.5-21B-A3B-Base210亿30亿128K轻量旗舰MoE,性价比最高企业级应用、中等规模部署
ERNIE-4.5-21B-A3B-Instruct210亿30亿128K轻量指令微调版客服机器人、内容创作、数据分析
ERNIE-4.5-21B-A3B-Thinking210亿30亿128K深度思考版,强化逻辑推理数学求解、学术分析、复杂问题解决
ERNIE-4.5-0.3B-Base3亿3亿32K纯稠密模型,体积最小端侧部署、嵌入式设备、实时推理
ERNIE-4.5-0.3B-Instruct3亿3亿32K轻量指令微调版移动端应用、离线AI助手

2.2 多模态模型系列(3款)

模型名称总参数量激活参数量上下文窗口核心特点适用场景
ERNIE-4.5-VL-424B-A47B-Base4240亿470亿128K多模态旗舰基座,支持文本+图像输入多模态理解、图像描述、视觉问答
ERNIE-4.5-VL-424B-A47B-Instruct4240亿470亿128K多模态指令微调版图文生成、内容审核、智能客服
ERNIE-4.5-VL-21B-A3B-Instruct210亿30亿128K轻量多模态模型移动端多模态应用、实时图像分析

三、核心技术突破

ERNIE 4.5的性能飞跃源于三项原创的核心技术创新,彻底解决了传统大模型"多模态能力弱、推理成本高、长上下文效果差"的行业痛点。

3.1 多模态异构混合专家架构

这是ERNIE 4.5最核心的技术突破,首次实现了文本与视觉模态的深度融合:

  • 跨模态参数共享:设计模态隔离路由机制,文本和视觉专家共享底层参数,同时保留各自的专用空间,实现"1+1>2"的效果
  • 专家正交性优化:引入路由器正交损失函数,确保不同专家专注于不同的任务,避免专家坍塌
  • 高效激活机制:每次推理仅动态激活最相关的8个专家,在4240亿总参数规模下,单Token计算量仅为同规模稠密模型的15%

3.2 全栈高效训推体系

基于飞桨PaddlePaddle深度学习框架,构建了从训练到推理的全栈优化方案:

  • 训练优化:采用异构混合并行策略和多层级负载均衡技术,结合FP8混合精度训练,预训练吞吐量提升47%
  • 推理量化:创新多专家并行协同量化方法和卷积编码量化算法,实现4-bit/2-bit近无损量化,推理速度提升3倍,显存占用降低75%
  • 部署优化:实现动态角色转换的预填充-解码分离部署技术,大幅提升高并发场景下的资源利用率

3.3 模态针对性后训练

针对不同任务场景进行精细化调优,兼顾通用能力和垂直领域表现:

  • 多阶段训练:采用监督微调(SFT)+ 直接偏好优化(DPO)+ 统一偏好优化(UPO)的三阶段训练流程
  • 双模式支持:多模态模型支持"思考模式"(强化推理)和"非思考模式"(强化感知)切换,用户可根据需求灵活选择
  • 中文深度优化:在预训练阶段融入海量高质量中文语料,中文理解和生成能力远超海外模型

四、性能基准对比

在全球主流的大模型基准测试中,ERNIE 4.5系列全面超越了此前的开源模型,多项指标达到闭源模型水平。

4.1 通用能力对比

基准测试测试维度ERNIE-4.5-300B-A47BDeepSeek-V3-671BQwen3-72BLlama 3-70B
MMLU通用知识89.488.286.183.1
C-Eval中文知识87.682.384.572.8
IFEval指令遵循92.187.589.385.7
GSM8K数学推理86.384.783.278.9
HumanEval代码生成85.784.283.579.1

数据来源:ERNIE 4.5官方技术报告(2025年6月)

4.2 多模态能力对比

基准测试测试维度ERNIE-4.5-VL-424B-A47BGPT-4oGemini 2.5 ProQwen-VL-Max
MME多模态理解1890192018701820
VQA-v2视觉问答85.386.784.182.5
TextVQA文本识别82.784.281.579.3
DocVQA文档理解88.990.187.285.6

五、快速上手教程

5.1 环境准备

# 安装依赖pipinstalltransformers torch paddlepaddle-gpu# 或使用飞桨版本pipinstallerniekit fastdeploy

5.2 Hugging Face 调用示例(PyTorch)

fromtransformersimportAutoTokenizer,AutoModelForCausalLMimporttorch# 加载模型和分词器model_name="baidu/ERNIE-4.5-21B-A3B-Instruct"tokenizer=AutoTokenizer.from_pretrained(model_name,trust_remote_code=True)model=AutoModelForCausalLM.from_pretrained(model_name,torch_dtype=torch.bfloat16,device_map="auto",trust_remote_code=True)# 生成回答prompt="请用Python写一个快速排序算法,并添加详细注释"messages=[{"role":"user","content":prompt}]inputs=tokenizer.apply_chat_template(messages,tokenize=True,return_tensors="pt",return_dict=True).to(model.device)outputs=model.generate(**inputs,max_new_tokens=2048,temperature=0.1)response=tokenizer.decode(outputs[0],skip_special_tokens=True)print(response)

5.3 飞桨 Paddle 调用示例

fromerniekitimportErnieModelForCausalLM,ErnieTokenizer# 加载模型model=ErnieModelForCausalLM.from_pretrained("baidu/ERNIE-4.5-21B-A3B-Instruct")tokenizer=ErnieTokenizer.from_pretrained("baidu/ERNIE-4.5-21B-A3B-Instruct")# 生成回答prompt="解释一下什么是大模型的混合专家架构"inputs=tokenizer(prompt,return_tensors="pd")outputs=model.generate(**inputs,max_new_tokens=1024)print(tokenizer.decode(outputs[0],skip_special_tokens=True))

六、部署指南

6.1 本地部署(FastDeploy 一键部署)

FastDeploy是百度专为大模型打造的推理部署工具,支持一键启动OpenAI兼容的API服务:

# 安装FastDeploypipinstallfastdeploy-gpu-python# 启动API服务(以0.3B模型为例)python-mfastdeploy.entrypoints.openai.api_server\--modelbaidu/ERNIE-4.5-0.3B-Instruct\--port8180\--host0.0.0.0\--max-model-len32768\--max-num-seqs32

6.2 硬件要求参考

模型最低显存要求(FP16)推荐显存要求(4-bit量化)
ERNIE-4.5-0.3B2GB1GB
ERNIE-4.5-21B-A3B40GB16GB
ERNIE-4.5-300B-A47B320GB80GB(4张A100 80GB)

6.3 企业级部署

对于有更高性能和安全需求的企业,推荐使用百度智能云千帆大模型平台提供的托管服务,支持:

  • 弹性扩缩容,支持百万级并发
  • 企业级安全防护和数据隔离
  • 完整的监控和运维体系
  • 定制化模型微调服务

七、生态支持与未来规划

7.1 配套工具链

百度同步开源了两大开发套件,为开发者提供开箱即用的全流程支持:

  • ERNIEKit:文心大模型开发套件,支持模型微调、评估、推理全流程
  • FastDeploy:大模型高效部署套件,支持多硬件、多平台部署,提供OpenAI兼容API

7.2 支持平台

所有模型已同步上传至以下平台,开发者可自由选择下载:

  • Hugging Face Hub:https://huggingface.co/baidu
  • 飞桨星河社区:https://aistudio.baidu.com
  • 魔搭社区(ModelScope):https://modelscope.cn/organization/baidu
  • GitCode:https://gitcode.com/PaddlePaddle/ERNIE

7.3 未来规划

百度文心大模型团队表示,将持续投入ERNIE系列的研发,未来计划:

  1. 2026年Q3:开源ERNIE 4.5语音模型,支持语音识别和语音生成
  2. 2026年Q4:推出ERNIE 5.0预览版,进一步提升推理能力和多模态融合效果
  3. 2027年Q1:开源端侧专用模型,支持手机、手表等嵌入式设备
  4. 持续优化工具链和生态,降低开发者使用门槛

结尾

文心大模型4.5系列的全面开源,标志着中国大模型技术已经从"跟跑"进入"并跑"甚至"领跑"的新阶段。它不仅为全球开发者提供了一个高性能、低成本的大模型选择,更为中国AI产业的自主可控发展奠定了坚实的基础。

未来,百度将继续坚持"开源开放"的理念,与全球开发者和企业携手,共同推动AI技术的创新和落地,让AI技术惠及每一个人。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/11 8:48:21

突破性APK安装器:在Windows上高效运行Android应用的革命性方案

突破性APK安装器:在Windows上高效运行Android应用的革命性方案 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否渴望在Windows电脑上无缝运行Android应…

作者头像 李华
网站建设 2026/6/11 8:46:07

ASN.1 Editor技术解析:二进制数据结构可视化的实现原理与应用实践

ASN.1 Editor技术解析:二进制数据结构可视化的实现原理与应用实践 【免费下载链接】Asn1Editor Asn1Editor 项目地址: https://gitcode.com/gh_mirrors/as/Asn1Editor ASN.1 Editor作为一款专业的二进制数据可视化工具,解决了开发者在处理ASN.1编…

作者头像 李华
网站建设 2026/5/13 18:28:07

光子逆向设计原理与AI优化实践

1. 光子逆向设计的核心原理与技术路线光子逆向设计(Photonic Inverse Design)是一种颠覆传统"试错法"的设计范式,它从目标性能指标出发,通过计算优化自动生成器件几何结构。这种方法的数学本质可以表述为一个约束优化问…

作者头像 李华