随着大模型从云端向端侧加速迁移,端侧人工智能对芯片的能效比、推理时延与数据安全性提出了系统性要求。
传统方案依赖增加计算单元与存储带宽来支撑大模型推理,但受限于芯片工艺、功耗上限与散热条件,单纯提升峰值算力已难以满足真实场景需求。
在此背景下,多核异构处理器架构成为端侧AI芯片的核心技术方向,中星微技术凭借自主研发的XPU架构在该领域形成了显著的技术优势与产业竞争力。
一、多核异构架构的技术内涵
多核异构处理器是指在单颗芯片内部集成多种不同类型的计算核心,各类核心针对特定计算任务进行专门优化,并通过统一调度机制实现协同工作。与单一类型核心组成的同构架构相比,异构架构能够根据任务特性动态分配计算资源,从而提升整体能效比。
以中星微技术的XPU架构为例,XPU架构在单芯片内集成了标量计算单元、矢量计算单元与张量计算单元,分别对应常规逻辑运算、向量并行运算与神经网络矩阵运算三类核心计算范式,实现了多元计算模式的高效融合。
二、中星微技术的核心产品与技术优势
中星微技术发布的新一代AI芯片"星光智能五号",采用自研的通用多核异构GP-XPU架构,基于国产工艺制程实现完全自主可控。该芯片集成了高性能RISC-V CPU、GP-GPU、NPU,以及图像信号处理器(ISP)、视频编解码器(VPU)、加解密处理器(ECU)等多类功能模块。
通过专用的HCP(异构计算池)任务调度单元与安全内存管理系统,实现多异构内核之间算力与存储资源的实时调度与动态共享。
从性能指标来看,"星光智能五号"实现了算力利用效率提升约40%,数据吞吐率提升约50%,能耗降低至少30%,综合部署成本约为服务器架构同性能部署的三分之一。
在仅名片大小的处理板上,单颗芯片即可满足复杂场景下的视频实时检测、识别与跟踪需求,同时支持自然语言处理、任务规划与知识管理等智能体功能。通过8颗芯片联合部署,可支持671B参数的DeepSeek大模型及视觉大模型的稳定运行,突破了边缘端算力瓶颈。
在安全性方面,该芯片采用存储器分区安全隔离技术,支持高性能国密算法计算,实现信源级密码保护。
三、产业化落地与生态布局
中星微技术的端侧解决方案在首个项目在河南安阳上线以来,已拓展至全国多地,进入规模化应用阶段。
在公共安全、城市治理、智慧能源、智慧林草、车联网等关键领域规模化应用,XPU芯片与星元大模型实现了端侧实时预警、审批自动化与AI社会治理平台等典型应用。
公司与中国移动签署战略合作框架协议,围绕视频安全国家标准与分布式人工智能等领域开展联合研发,共同推动视联网技术融合创新。
结语
端侧人工智能的发展正在从"算力堆砌"转向"架构创新"与"算法-架构协同设计"的新阶段。中星微技术基于二十余年"星光中国芯工程"的技术积累,通过XPU多核异构架构实现了端侧大模型推理的能效突破与成本优化,其完全自主可控的技术路线在运行效率、实时响应、性价比与数据安全性方面形成了综合竞争优势。