news 2026/5/1 13:01:09

百度文心大模型4.5全系列源代码开放 配套API服务同步上线

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
百度文心大模型4.5全系列源代码开放 配套API服务同步上线

百度文心大模型4.5全系列源代码开放 配套API服务同步上线

【免费下载链接】ERNIE-4.5-21B-A3B-PT项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-PT

2025年6月30日,百度正式对外宣布文心大模型4.5系列完成开源工作,并同步推出API服务接口。此次开源行动涵盖10款不同规格的模型产品,参数规模从470亿混合专家(MoE)架构延伸至3亿轻量级稠密模型,全面覆盖文本生成、多模态交互等主流AI应用场景。开发者可通过飞桨星河社区、HuggingFace平台及百度智能云千帆大模型平台获取完整的模型权重与代码资源,所有开源资产均采用Apache 2.0协议授权,为商业应用与学术研究提供灵活支持。

百度文心大模型4.5开源家族在技术架构上实现重大突破,创新性地提出多模态异构模型设计。该架构专门优化大语言模型向多模态能力扩展的持续预训练流程,在确保文本任务性能不降反升的前提下,通过多模态混合专家预训练机制、高效训练推理引擎以及模态专属后训练策略等三大技术支柱,显著增强模型对跨模态信息的理解能力。全系列模型均基于飞桨深度学习框架开发,在大语言模型预训练阶段实现47%的FLOPs利用率(MFU),达到行业领先的计算效率水平。

如上图所示,该架构图清晰呈现了文心大模型4.5系列的产品矩阵,通过A47B、A3B和0.3B三个技术分支构建起完整的模型生态。这一模块化设计充分体现了百度在大模型架构创新上的系统性思考,为开发者提供了从超大规模到轻量化部署的全场景技术选择。

第三方评测数据显示,文心大模型4.5系列在12项国际权威基准测试中刷新性能纪录,尤其在指令理解准确率、世界知识覆盖率、视觉语义解析和跨模态推理速度等关键指标上表现突出。文本模型方面,其在MMLU、HumanEval等主流评测中全面超越DeepSeek-V3和Qwen3等竞品;多模态领域更实现突破性进展,依托精细化视觉感知能力与海量视觉常识库,成功构建"思考-执行"一体化认知框架,在VQAv2、Flickr30K等多模态评测中性能超越闭源的OpenAI o1模型。轻量化产品矩阵中,210亿参数的文心4.5-21B-A3B-Base文本模型与同量级Qwen3性能持平,而280亿参数的文心4.5-VL-28B-A3B多模态模型不仅在同参数开源模型中位列第一,甚至可与320亿参数的Qwen2.5-VL展开性能竞争。

作为国内AI技术研发的先行者,百度构建了从算力基础设施、深度学习框架、大模型算法到行业应用的全栈技术体系。此次开源行动中,基于飞桨平台多年积累的开源生态优势,同步发布文心大模型开发套件ERNIEKit和高效部署工具FastDeploy,形成覆盖模型训练、微调优化、推理部署的全流程技术支持。特别值得关注的是,该系列模型通过飞桨框架实现多芯片架构兼容,可无缝适配CPU、GPU及各类国产加速芯片,大幅降低企业级应用的部署门槛。这种"框架+模型"的双层开源模式,标志着我国大模型技术在生态开放度与产业实用性方面进入新阶段,将加速AI技术在智能制造、智慧城市、医疗健康等关键领域的深度渗透。

随着文心大模型4.5系列的开源,百度正在重塑AI产业的创新格局。Apache 2.0协议下的商业友好特性,结合飞桨生态丰富的工具链支持,预计将吸引超过10万家企业加入模型应用开发。这种开放式创新模式不仅有利于构建良性竞争的技术生态,更能通过开发者社区的集体智慧推动模型持续进化。未来,随着模型轻量化技术的成熟与垂直领域知识库的完善,文心大模型有望在边缘计算设备、嵌入式系统等终端场景实现规模化应用,最终形成"通用智能+行业专精"的多层次AI服务体系,为数字经济发展注入新动能。

【免费下载链接】ERNIE-4.5-21B-A3B-PT项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-PT

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 10:32:01

【健康管理】第15章 健康管理服务营销 1/2

健康管理 相关文档,希望互相学习,共同进步 风123456789~-CSDN博客 慢性病相关文章: 1.【健康管理】第4章 常见慢性病 1/2 2.【健康管理】第4章 常见慢性病 4.5 冠心病 3.【健康管理】第4章 常见慢性病 4.6 脑卒中 4.【健康管理】…

作者头像 李华
网站建设 2026/5/1 6:53:00

端到端语音交互新纪元:Step-Audio 2 mini开源模型刷新多项全球性能纪录

在人工智能语音交互领域,一场技术革命正悄然发生。阶跃星辰近期正式推出其最新力作——开源端到端语音大模型Step-Audio 2 mini,该模型凭借创新性的多模态架构设计,在国际权威测评中全面超越现有开源方案,甚至在核心任务上接近闭源…

作者头像 李华
网站建设 2026/5/1 5:52:48

4、数字转型时代的商业模式与高增长企业价值构成

数字转型时代的商业模式与高增长企业价值构成 1. 数字转型时代的商业模式洞察 1.1 数字转型的综合分析 在当今经济环境中,数字转型已成为企业发展的关键议题。通过对相关材料的频率和相关性分析,并与国内外学术文献进行关联,我们能更全面地理解数字转型背景下的商业模式。…

作者头像 李华
网站建设 2026/5/1 7:05:08

智谱AI推出GLM-4.5V-FP8多模态模型,视觉语言理解能力刷新行业标杆

智谱AI推出GLM-4.5V-FP8多模态模型,视觉语言理解能力刷新行业标杆 【免费下载链接】GLM-4.5V-FP8 项目地址: https://ai.gitcode.com/zai-org/GLM-4.5V-FP8 2024年人工智能技术领域迎来重要突破,智谱AI正式对外发布全新一代视觉语言模型GLM-4.5V…

作者头像 李华
网站建设 2026/5/1 5:54:05

谷歌Gemma 3 270M开源:轻量级AI模型如何重塑移动端智能体验

谷歌Gemma 3 270M开源:轻量级AI模型如何重塑移动端智能体验 【免费下载链接】gemma-3-270m-it-qat-GGUF 项目地址: https://ai.gitcode.com/hf_mirrors/unsloth/gemma-3-270m-it-qat-GGUF 在人工智能模型参数规模动辄数十亿甚至千亿的当下,谷歌最…

作者头像 李华