"昇腾实战派"知识地图 — 技术洞察
← 返回系列总目录 | 覆盖 29 篇文章。
DeepSeek 模型系列
- DeepSeek-V3: MTP多Token预测 — 2026-01-19
- DeepSeek-V3模型结构拆解 — 2026-01-18
- DeepSeek: MLA原理介绍 — 2026-01-18
- DeepSeek v3: 无辅助损失负载均衡&序列维度辅助损失原理以及MindSpeed代码走读 — 2026-01-19
并行策略与分布式
- PyTorch FSDP 设计解读与性能分析 — 2025-11-20
- ulysses序列并行 — 2025-12-01
- 序列并行SP算法及算子实现 — 2025-12-01
- 【通算掩盖】sp场景如何实现99.5%的通算掩盖 — 2025-12-01
- Deepspeed框架并行算法解析 — 2026-04-28
- 长序列大语言模型推理中的显存优化方案:Context Parallel (CP) 深度解析 — 2026-05-26
- DeepSpeed ZeRO-3 源码解析:初始化与显存分配 — 2026-05-26
- DeepSpeed ZeRO-3 源码解析:前向与反向 — 2026-05-26
模型架构与基础概念
- torch.compile学习笔记 — 2025-11-15
- FA原理介绍以及使用方法 — 2025-11-17
- 奇异值分解如何重塑优化器?Muon优化器技术解析 — 2025-11-17
- 大模型FLOPs利用率_MFU计算方法与注意事项 — 2026-01-19
- 昇腾GE图模式基础简介 — 2026-02-28
- 多层感知机(MLP):深度学习中的基础构建模块 — 2026-04-07
- 投机推理技术原理 — 2026-04-08
- Qwen3.5-27B Dense模型网络结构以及关键算子分析 — 2026-05-26
多模态技术
- 视觉推理洞察 — 2025-12-15
- 多模态MoE模型训练策略解析 — 2026-02-26
- 多模态基础介绍 — 2026-02-14
- 多模态MOE—理解类模型Qwen3-VL-Moe结构分析 — 2026-02-27
- 多模态理解类模型技术小结 — 2026-04-28
其他模型与技术分析
- 风乌_V2 训练模型走读及评测方法 — 2025-12-23
- Gpt-oss模型介绍 — 2025-12-16
- veRL异步方案考古 — 2025-12-29
- triton简介 — 2026/2/14
← 返回系列总目录