news 2026/5/9 13:46:21

快讯|DeepSeek Engram论文详解存算分离,华为SWE-Lego开源轻量级代码智能体全栈方案,

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
快讯|DeepSeek Engram论文详解存算分离,华为SWE-Lego开源轻量级代码智能体全栈方案,

🐾 具身智能赛道,架构革新、巨头合纵、芯片突围的戏码接连上演,热度从没降过,好了,让我们直接发车。

📜政策风向

1. 八部门联合发文,养老服务机器人获明确政策支持

民政部、工信部等八部门联合印发《关于培育养老服务经营主体 促进银发经济发展的若干措施》。文件明确,要加大养老服务机器人研发力度,并推进人形机器人、健康监测等产品在家庭、社区等场景的规模化应用。这意味着,一个需求明确、受人口结构支撑的庞大市场,获得了国家层面的清晰政策指引。它为机器人技术从实验室走向真实、复杂的生活场景提供了宝贵的“练兵场”。

据悉,行业内在该场景的探索已开始落地,例如灵心巧手正与合作伙伴在养老机构中,共同实验基于智能轮椅平台集成其Linker Hand灵巧手的组合方案,以测试在辅助老人抓取物品、进行简单交互等场景下的实际表现。这类前沿探索,正是响应政策号召、将尖端技术转化为切实照护能力的具体实践。

🌟 重磅速递

2. DeepSeek抛出Engram“记忆外挂”,大模型架构战开打新维度
就在这两天,DeepSeek和北大联合发布的论文,把一个叫Engram(记忆印迹)的新模块推到了聚光灯下。这玩意儿想解决的事儿挺本质:大模型处理“戴安娜王妃”这种事实知识,为啥还得劳师动众动用好几层网络去“推理”?

Engram的思路是“存算分离”,专门造个“外置知识硬盘”来存静态知识,模型推理部分(MoE)就专注干复杂的逻辑活儿。需要的时候,直接用哈希“查表”,又快又省。实测下来,挂载千亿参数知识库到CPU内存,对GPU推理速度的影响不到3%。这可不只是小优化,这是动底层架构的刀子。如果传闻2月发布的V4用上它,那竞争的焦点可就从“谁参数大”转向“谁架构更聪明”了。看来,拼完算力之后,真正的效率战争刚刚打响。

3. 苹果谷歌“复合”,OpenAI移动端入口遭遇重击
北京时间的深夜,苹果和谷歌抛出了一枚重磅炸弹:双方达成多年深度合作,谷歌Gemini将成为下一代苹果基础模型和Siri的云脑核心

这远不止是给Siri接个API那么简单,是Gemini要住进苹果AI的“地基”里。对比两年前苹果和OpenAI的高调牵手,这次OpenAI的彻底“出局”显得格外扎眼。背后逻辑其实很商业:面对一个亿级用户的“算力吞金兽”,拥有从芯片到数据中心全栈能力的谷歌,比起依赖微软云的OpenAI,是更稳妥的基建伙伴;同时,OpenAI自己搞硬件的动作,估计也让苹果嗅到了竞争的味道。这笔交易重新划定了移动AI的势力范围,也告诉我们,巨头游戏里,没有永恒的盟友,只有对“入口”和“地基”的永恒争夺

🔧 产业脉动

4. 英特尔1.8nm芯片量产,给“混合AI”与端侧智能添了把猛火
英特尔在CES上终于亮出了基于Intel 18A(1.8纳米级)工艺的第三代酷睿Ultra处理器(Panther Lake)。这不只是一次制程迭代,更是其RibbonFET晶体管和PowerVia背面供电两大赌注性技术的成功量产。性能数据很猛,多线程提升60%,整机AI算力更是堆到了180 TOPS

英特尔喊出的“混合AI”口号,目标很明确:把更多AI推理从昂贵、有延迟的云端,拽回你的个人设备上来。这对于那些需要快速响应、注重隐私的具身智能和机器人应用来说,意味着本地的“小脑”可以更强大、决策更迅捷。芯片底层的突破,正在为上层应用的爆发铺设硬件跑道。

5. Meta启动“Meta Compute”计划:算力军备竞赛进入“能源绑定”新阶段
扎克伯格宣布了“Meta Compute”计划,目标直指在2030年前自建数十吉瓦(GW)级别的算力基础设施。配套动作更值得玩味:锁定6.6 GW的核电供应。这传递的信号再清晰不过:顶尖科技公司判断,未来AI发展的终极瓶颈,将不再是算法或模型设计,而是最基础的电力与计算基础设施。这场军备竞赛已经进入了“能源绑定”的新维度,谁掌握了稳定、巨量的“燃料”,谁才有资格跑完下一场马拉松。

6. 华为开源“代码智能体”秘籍,轻量化路线挑战复杂训练范式
华为开源了软件工程智能体SWE-Lego,它证明了一条不太一样的路:仅用监督微调(SFT),加上高质量数据和精巧的训练技巧(如步骤级错误掩码、课程学习),就能在代码任务上达到顶尖水平,无需昂贵复杂的强化学习(RL)。这等于给行业,特别是中小团队,递上了一本“降本增效”的实战手册,把基础功夫做扎实同样能出奇效,降低了AGI智能体的研发门槛。

🎙️ 人物声音

7. 王小川交卷:百川医疗大模型夺冠,手握30亿瞄准严肃医疗
沉寂一段时间的王小川,带着百川智能的医疗大模型Baichuan-M3重回视野,并在权威评测中取得了领先成绩。他明确公司已彻底转向严肃医疗赛道,并透露账上仍有30亿资金,可能于2027年启动IPO。在通用模型公司扎堆上市的喧嚣后,百川选择深耕医疗这条“重”赛道。它的探索,将成为检验大模型在高专业度、高合规性垂直领域究竟能创造多大商业价值的试金石。


(本资讯由AI猫站长精选自公开信息,仅供参考,不构成任何投资建议。热潮之下,不妨多看看那些在为技术“夯地基”、为应用“找场景”的公司。喵~)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/5 16:07:26

改进A星算法:剔除冗余节点与光滑转折点

改进A星算法 剔除冗余节点,光滑转折点 对比优化前后路径。在路径规划领域,A星算法无疑是一颗耀眼的明星。然而,原始的A星算法生成的路径可能存在冗余节点,并且转折点不够光滑,影响了路径的实用性和美观性。今天咱们就来…

作者头像 李华
网站建设 2026/5/9 6:26:30

WSRP(Web Services for Remote Portlets)技术详解

前言 在现代企业信息系统架构中,统一门户(Enterprise Portal)作为用户访问各类业务系统的单一入口,承担着信息聚合、身份统一、用户体验一致等关键职责。然而,随着业务系统的不断扩展,如何高效、安全、可维…

作者头像 李华
网站建设 2026/5/2 12:10:40

SOLIDWORKS Simulation:“本地交互”的接触参数,都代表什么?

在使用 SOLIDWORKS Simulation 进行装配体或多实体零件受力分析时,关键的本地交互功能该如何设置? “连接” 功能中的“本地交互”是定义零件间接触关系的核心工具,其中“相触”设置最为常用,直接决定了力如何通过接触面进行传递…

作者头像 李华
网站建设 2026/5/4 17:03:34

技术架构自动化转换工具避坑实录:架构师分享10个血泪教训与解决方案

技术架构自动化转换工具避坑实录:架构师的10个血泪教训与实战解决方案 摘要/引言 问题陈述:在数字化转型浪潮中,企业架构升级已成为技术部门的核心任务。手动进行架构转换不仅耗时耗力(平均周期6-12个月,错误率高达35%),更难以应对快速变化的业务需求。架构自动化转换…

作者头像 李华
网站建设 2026/5/8 1:47:57

为什么律师花在汽车和衣服上的钱,比同等收入的大学教授更多?

律师在汽车和衣物上的支出高于同等收入的大学教授,核心是职业属性、形象价值、社交需求的差异,导致两类群体对 “外在形象” 的投入逻辑完全不同 —— 对律师而言,汽车和衣物是生产性投资;对教授而言,更多是消费性支出…

作者头像 李华
网站建设 2026/5/1 6:14:12

全球首个1米高精度特大城市开放空间数据集(Tif)

数据简介 本数据集提供全球169个特大城市的开放空间分类数据,涵盖公园绿地、运动空间、交通空间等五类城市开放空间,为城市宜居性和可持续发展研究提供精细空间数据。 数据详情 基本参数 数据引用 引用:Fan, R., Wang, L., Xu, Z. et al.…

作者头像 李华