news 2026/5/1 7:03:17

韩国 DEEPX 携手文心飞桨:推动 AI 从云端走向物理世界,构建 Physical AI 新范式

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
韩国 DEEPX 携手文心飞桨:推动 AI 从云端走向物理世界,构建 Physical AI 新范式

在年初的 CES 2026 展会,一块不足手掌大小的 AI 芯片,以在 OCR 与视觉推理等任务上接近 GPU 级别的性能表现,重塑着 AI 在真实世界中运行的边界条件。

当全球算力仍在向数据中心持续堆叠、以百瓦级 GPU 追逐更大模型规模时,来自韩国的 AI 芯片公司 DEEPX,选择了一条截然不同的路径——让 AI 走出云端,真正嵌入现实世界的每一台设备、每一个物理系统之中。这是一项芯片技术的突破,更是 AI 计算范式的一次重要转向。

DeepX 成立于 2018 年,总部位于韩国京畿道城南市,是一家专注于人工智能和物联网技术的韩国公司,致力于开发高性能 AI 半导体和计算解决方案的底层技术,使所有电子设备实现智能化。DEEPX 目前拥有超过 400 项专利组合,并获得广泛的国际认可,包括斩获 5 项 CES 创新奖、入选 EE Times “Silicon 100” 并获得最佳产品奖,以及被 Frost & Sullivan 评为最佳公司之一。

2026年1月22日,在上海举行的「百度文心 Moment」大会现场,舞台灯光聚焦在 DEEPX 创始人兼 CEO 金錄元(Lokwon Kim)身上。这位曾主导 Apple A11 Bionic 芯片研发、在 IBM T.J. Watson 研究中心深耕 AI 处理器的工程师,向现场开发者演示 AI 正在发生的变化——

两块芯片、相同的 AI 负载、各自放置一块黄油。数分钟后,竞品芯片因高功耗迅速升温,黄油完全融化;而 DEEPX 的芯片表面,黄油依然保持原状。“这不是噱头,”Kim在现场说道,“这是 AI 是否能够真正进入物理世界的分水岭。”

依托百度文心飞桨生态,DEEPX 正在将“高性能、低功耗、可规模化”的 Physical AI 从概念变为现实:在仅5瓦功耗条件下,接近 GPU 级别的 OCR 与视觉推理能力,使 AI 得以拥有在真实工业与复杂环境中长期稳定运行的可能性。

从计算重构出发

为 Physical AI 重新定义能效边界

在《贯通数字与物理世界,携手百度将AI芯片之梦变为现实》主题分享中,Kim讲述了DEEPX 如何携手百度文心飞桨,实现 AI 计算形态从云端向端侧、从“远程智能”走向“物理智能”。他指出,当算力长期依赖高功耗 GPU 与数据中心架构时,AI 天然受限于能耗、散热、成本与网络条件,只能以“远程智能”的形态存在。而 Physical AI 的核心命题,正是让 AI 能够在真实物理环境中长期、稳定、可规模化地运行。

围绕这一目标,DEEPX 的 DX-M1 / DX-M2 系列 NPU 以5 瓦功耗作为明确的工程边界,在该能耗水平下实现对大规模 AI 模型的高效推理能力。通过对 AI 计算本质的重构,DEEPX 采用高度聚焦的 NPU 架构,剥离通用计算逻辑,针对 OCR、视觉与推理任务进行算子级与指令级优化,在相同工艺条件下实现显著的能效跃迁。

正如Kim所言:“当芯片的成本与能耗低于人工成本,AI 才真正具备被大规模部署的意义。”

案例落地

基于 PaddleOCR 的端侧文档智能实践

技术能力的价值,最终需要在真实业务场景中得到验证。DEEPX 将百度文心飞桨作为其端侧 AI 规模化落地的重要生态支点。目前,基于双方在 OCR 与文档智能等高价值场景展开的深度合作,DEEPX 首代芯片 DX-M1 已完成量产,并在全球超过 50 个项目中实现落地,覆盖机器人、工业制造、智能家电、国防等多个高要求场景

在文档智能领域,传统 OCR 与文档解析方案长期面临多重挑战:复杂文字场景下精度不足,边缘或私有化环境中推理效率受限,以及云端部署带来的数据安全与合规压力等问题,是企业在核心业务系统中引入文档智能能力的重要制约因素。

针对上述行业痛点,DEEPX 与百度文心飞桨基于 PP-OCRv5 模型,针对以连续文字为主的企业文档场景进行专项微调,并将模型能力深度适配至其自研 DeepX NPU,共同推出 DocMind 文档智能 SaaS 一体机产品。在5瓦功耗下,实现比300瓦 GPU 更高的 OCR 推理性能,支持中、英、韩等 100+语言文本识别,满足 OCR 相机、微型服务器、无人机等端侧部署需求。

在算法层面,PP-OCRv5 在多语言文字识别、复杂版式鲁棒性与推理效率方面具备成熟能力,为端侧与私有化部署提供稳定可靠的模型基础;在系统层面,DocMind 通过软硬一体化设计,实现文档识别与解析能力的本地化高效部署,避免数据上传云端带来的潜在泄露风险,满足金融、工业及跨国企业对数据安全的刚性需求。

在实际测试中,DX-M1 在关键性能指标上相较主流 GPU(NVIDIA GeForce RTX 2080 Ti)表现出更优的功耗效率与每秒帧数(FPS),尤其在依赖有限电池资源的边缘工业环境中优势明显。结合 PP-OCRv5 的高精度识别能力,该方案在工厂巡检、设备监控、文档处理等场景中,实现了“看得更快、更清、更持久”。

开源项目地址👉

https://github.com/DEEPX-AI/DXNN-OCR-cpp

生态共创

构建面向端侧智能的开放技术协同体系

目前,该双方共创产品 DocMind 已作为“首批文心大模型软硬一体共创产品”于「百度文心 Moment」大会正式发布,并荣获星河产业应用创新奖海外创新赛道一等奖。这一“软硬协同”模式,也使 DEEPX 成为全球首家推出“专为 OCR 优化的 NPU 模组”的芯片公司,并因此斩获美国 CES 创新奖

会上,DEEPX 系统性展示了与百度文心飞桨的多层协同路径:

  • 模型层:实现PaddleOCR、文心大模型与 NPU 架构的深度适配;其第二代芯片DeepX M2将深度集成文心大模型与PaddleOCR-VL能力,将合作延伸至生成式AI前沿;

  • 算法层:共建面向开发者的优化算法与推理能力库;

  • 工具层:结合百度 Comate 等 AI 工具,降低端侧 AI 开发门槛;

  • 演进层:持续探索在 5 瓦功耗条件下运行文心大模型的可行路径,为文心大模型打造定制化的高效硬件底座。

此外,DEEPX 已完成对 PaddleX 系列视觉模型(目标检测、分类、图像分割等)的高效适配验证,验证结果显示,飞桨视觉模型在 DEEPX 低功耗芯片上实现了性能与能效的良好平衡,为行业用户提供可灵活组合的端侧视觉解决方案。

面向未来

Co-Innovate. Co-Deploy. Co-Scale.

在Kim看来,Physical AI 的规模化并非单一技术或单一企业可以独立完成,而是一项需要模型、工具、硬件与应用生态长期协同演进的系统工程。

作为百度飞桨优选级技术伙伴,DEEPX 持续活跃于百度文心飞桨生态活动,共同推动端侧 OCR 与视觉推理方案在真实场景中的验证与落地;同时也在美国 CES 等国际展会上联合展示基于文心飞桨生态的产品及方案,共同开拓全球产业界影响力。

面向未来,双方将进一步围绕文心大模型、PaddleOCR-VL等百度文心飞桨前沿技术成果,探索“识别—理解—生成”全链路文档智能能力在端侧与私有化环境中的实现路径,并在产品共创、联合人才培养及国际市场合作等方面持续深化协同。

从参与 Apple、IBM 的前沿芯片研发,到创立 DEEPX 并投身 Physical AI 基础设施建设,金錄元的选择映射出 AI 产业正在经历的深层转向。当 AI 不再局限于云端,而是具备在真实世界中感知、推理与行动的能力,算力形态、成本结构与能源逻辑都将被重新定义。

正如Kim在演讲中所言,“我们设计的是小芯片,但依托百度文心飞桨生态,它们承载的是让智能真正进入物理世界的可能性。”

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 5:11:33

何恺明团队最新力作“漂移模型”:全新生成范式,颠覆传统!

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【顶会/顶刊】投稿交流群 添加微信号:CVer2233,小助手拉你进群! 扫描下方二维码,加入CVer学术星球!可以获得最新顶…

作者头像 李华
网站建设 2026/5/1 5:10:48

效率直接起飞!AI论文工具 千笔 VS 万方智搜AI,专科生写作神器

随着人工智能技术的迅猛迭代与普及,AI辅助写作工具已逐步渗透到高校学术写作场景中,成为专科生、本科生、研究生完成毕业论文不可或缺的辅助手段。越来越多面临毕业论文压力的学生,开始依赖各类AI工具简化写作流程、提升创作效率。但与此同时…

作者头像 李华
网站建设 2026/5/1 5:09:20

CANN通信库:分布式训练的容错机制

CANN通信库:分布式训练的容错机制 参考链接 cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn 引言 在分布式深度学习训练中,容错机制是保证训练稳定性的关键。如何检测故障、恢复训练…

作者头像 李华
网站建设 2026/4/30 10:16:20

springboot基于Java的二手书籍交易系统(源码+文档+运行视频+讲解视频)

文章目录 系列文章目录目的前言一、详细视频演示二、项目部分实现截图三、技术栈 后端框架springboot前端框架vue持久层框架MyBaitsPlus系统测试 四、代码参考 源码获取 目的 Spring Boot框架下的二手书籍交易系统,通过模块化设计实现书籍发布、搜索、交易及评价全…

作者头像 李华
网站建设 2026/5/1 4:45:31

GNN虚拟筛选:药物研发的“压力测试引擎”

对于软件测试从业者而言,GNN(图神经网络)驱动的药物虚拟筛选工具本质上是一个超大规模分子兼容性测试系统。它通过构建蛋白质-配体的拓扑图结构,将传统药物筛选转化为分子级的“接口压力测试”:测试框架革新动态断言机…

作者头像 李华