news 2026/6/4 20:57:14

【昇腾实战派】技术洞察知识地图

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【昇腾实战派】技术洞察知识地图

"昇腾实战派"知识地图 — 技术洞察

← 返回系列总目录 | 覆盖 29 篇文章。


DeepSeek 模型系列

  • DeepSeek-V3: MTP多Token预测 — 2026-01-19
  • DeepSeek-V3模型结构拆解 — 2026-01-18
  • DeepSeek: MLA原理介绍 — 2026-01-18
  • DeepSeek v3: 无辅助损失负载均衡&序列维度辅助损失原理以及MindSpeed代码走读 — 2026-01-19

并行策略与分布式

  • PyTorch FSDP 设计解读与性能分析 — 2025-11-20
  • ulysses序列并行 — 2025-12-01
  • 序列并行SP算法及算子实现 — 2025-12-01
  • 【通算掩盖】sp场景如何实现99.5%的通算掩盖 — 2025-12-01
  • Deepspeed框架并行算法解析 — 2026-04-28
  • 长序列大语言模型推理中的显存优化方案:Context Parallel (CP) 深度解析 — 2026-05-26
  • DeepSpeed ZeRO-3 源码解析:初始化与显存分配 — 2026-05-26
  • DeepSpeed ZeRO-3 源码解析:前向与反向 — 2026-05-26

模型架构与基础概念

  • torch.compile学习笔记 — 2025-11-15
  • FA原理介绍以及使用方法 — 2025-11-17
  • 奇异值分解如何重塑优化器?Muon优化器技术解析 — 2025-11-17
  • 大模型FLOPs利用率_MFU计算方法与注意事项 — 2026-01-19
  • 昇腾GE图模式基础简介 — 2026-02-28
  • 多层感知机(MLP):深度学习中的基础构建模块 — 2026-04-07
  • 投机推理技术原理 — 2026-04-08
  • Qwen3.5-27B Dense模型网络结构以及关键算子分析 — 2026-05-26

多模态技术

  • 视觉推理洞察 — 2025-12-15
  • 多模态MoE模型训练策略解析 — 2026-02-26
  • 多模态基础介绍 — 2026-02-14
  • 多模态MOE—理解类模型Qwen3-VL-Moe结构分析 — 2026-02-27
  • 多模态理解类模型技术小结 — 2026-04-28

其他模型与技术分析

  • 风乌_V2 训练模型走读及评测方法 — 2025-12-23
  • Gpt-oss模型介绍 — 2025-12-16
  • veRL异步方案考古 — 2025-12-29
  • triton简介 — 2026/2/14

← 返回系列总目录

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/4 20:56:54

AI转账准确率从94.7%跃升至99.992%:基于FinBERT微调+多源账本对账引擎的工业级实践(含开源POC代码仓链接)

更多请点击: https://codechina.net 第一章:AI工具与智能转账整合 现代金融基础设施正加速融合人工智能能力,智能转账已从简单的规则引擎演进为具备上下文理解、风险自适应与多模态交互的AI原生服务。AI工具通过自然语言处理解析用户意图&am…

作者头像 李华
网站建设 2026/6/4 20:55:40

AI时代,网络安全该怎么做?Fortinet给出一种思路

作者:王聪彬和所有行业一样,这几年网络安全行业最热的词也是AI。当企业在加速上线AI应用时,没有人能保证,每一个模型、每一份数据、每一个Prompt都足够安全。2025年12月至2026年2月,一名独立攻击者利用Claude Code和GP…

作者头像 李华
网站建设 2026/6/4 20:55:38

2026中国光网络研讨会开幕:产业链齐聚北京,共探AI时代光通信未来

来自运营商、设备供应商、科研院所、研究机构及产业链上下游企业的专家学者齐聚一堂,围绕超高速光传输、800G/1.6T光模块、高集成光互连、新型光纤、全光智能网、智算中心光互联、原生AI架构等热点议题展开讨论,旨在探讨AI时代下光通信如何构建信息通信基…

作者头像 李华
网站建设 2026/6/4 20:52:17

云原生大模型推理排障:快速排查分布式训练网络瓶颈导致的容器冷启动超时故障

云原生大模型推理排障:快速排查分布式训练网络瓶颈导致的容器冷启动超时故障一、引言:训练与推理混合部署的挑战 在云原生大模型平台中,分布式训练和在线推理经常共享同一套基础设施。训练任务对网络带宽要求极高(如 AllReduce 操作),而推理服务对冷启动时间敏感。当…

作者头像 李华
网站建设 2026/6/4 20:50:41

微软剑桥博士夏令营深度解析:学术交流如何加速科研成长

1. 一次顶尖计算科学前沿的沉浸式体验:2014微软剑桥博士夏令营深度解析每年夏天,全球顶尖学府的计算机科学博士生们都会将目光投向英国剑桥。这里不仅是徐志摩笔下“再别康桥”的浪漫之地,更是现代计算机科学的摇篮之一。2014年6月底&#xf…

作者头像 李华