面经-CPU、内存、GPU的性能优化-编程实验室

一、如何定位问题

Profiler/Frame Debugger 之类工具确认瓶颈。

CPU bound：Profiler 里 Main Thread/Render Thread 很高，GPU 还很空；或降低分辨率没提升 FPS
GPU bound：GPU time 高；降低分辨率/关闭后处理 FPS 明显提升
内存/GC bound：卡顿呈“尖刺”，GC.Alloc 很多，周期性 GC spike，或内存持续增长导致加载/换场抖动

二、 CPU 优化（主线程、脚本、物理、动画、渲染提交）

A. 脚本 Update/逻辑过多

把“每帧轮询”改成事件驱动（状态变化才更新 UI/逻辑）
降频：InvokeRepeating/自定义 tick（比如 10Hz/5Hz）替代每帧计算
缓存引用：避免每帧GetComponent/Find（只在初始化取一次）
避免 LINQ/闭包/foreach 装箱等隐式分配（也会牵扯 GC）

B. 物理开销（Physics）

减少Physics.Raycast数量（合批检测、分层检测、降频）
合理 Layer 碰撞矩阵，减少无意义碰撞对
Rigidbody 数量/碰撞体复杂度控制；尽量用简单 Collider
FixedUpdate 频率不要过高（默认 50Hz，必要时调低并保持稳定）

C. 动画/IK

Animator 层数、BlendTree 复杂度、IK/约束数量控制
远处角色降低动画更新频率 / 关闭 IK
共享 AnimatorController、减少 Animator 组件数量

D. 渲染提交（CPU 侧）

DrawCall 太多：SRP Batcher、GPU Instancing、合批、静态批处理
UI Canvas：避免整个 Canvas 每帧重建，拆分静态/动态 Canvas，少改 Layout
大量 SetPass/材质切换：合材质、合贴图（图集）、减少 shader variant

三、内存优化（峰值、常驻、加载、GC）

内存优化在 Unity 常见两类：减少分配 + 控制资源常驻/峰值。

A. 减少 GC（卡顿尖刺的主要来源）

避免每帧分配：字符串拼接、new、LINQ、频繁Instantiate临时对象
对象池：子弹、特效、UI item、怪物等（并配合预热）
复用容器：List/Dictionary 清理用Clear()，避免反复 new
UI 文本更新：减少频繁 SetText/字符串格式化（尤其移动端）

B. 控制资源内存（贴图/网格/音频）

贴图压缩格式正确（ASTC/ETC2/BCn 视平台），mipmap、分辨率分级
Mesh/SkinnedMesh：骨骼数量、网格面数、Blendshape 控制
音频：长音频用 streaming，短音效压缩/内存加载策略区分

C. 资源加载与峰值（Addressables/AssetBundle）

异步加载，避免主线程阻塞（尤其切场景）
资源分组、依赖分析，避免“一加载加载一堆”
正确释放：Addressables.Release、卸载不用的 bundle、场景切换后清理
关注“峰值内存”：加载新场景时旧场景资源未释放会导致瞬时爆内存

四、GPU 优化（像素、顶点、带宽、过度绘制）

GPU 优化核心是：少画、画得更便宜、减少带宽/状态切换。

A. 像素成本（Fillrate）与过度绘制

降低分辨率/动态分辨率（最直接验证 GPU bound）
减少全屏后处理（Bloom、SSAO、DoF、TAA 等）
UI/透明物体过多会 Overdraw：减少透明层级、能用不透明就不用透明
合理裁剪：UI Mask/ScrollRect 也会增加开销

B. Shader & 材质

Shader 复杂度：减少计算、纹理采样数、分支
减少 shader variant：剔除不用关键字，避免爆炸式编译与运行时切换
使用 SRP Batcher（URP/HDRP），减少 CPU+GPU 的状态成本

C. 几何（顶点）与阴影

LOD、Impostor、合并远景
阴影：降低 shadow distance、分辨率、cascade 数，减少投射/接收对象
粒子：控制数量、启用 GPU Instancing（支持时）

D. 带宽（移动端尤其重要）

贴图压缩、减少 RT 数量/分辨率（后处理链路）
避免频繁读写大 RenderTexture

AI出海新趋势：开源翻译镜像助力中小企业全球化布局

AI出海新趋势：开源翻译镜像助力中小企业全球化布局 🌐 AI 智能中英翻译服务 (WebUI API) 从“能用”到“好用”：AI翻译的进化之路在全球化加速的今天，语言壁垒依然是中小企业出海过程中最现实的障碍之一。传统机器翻译工具虽然普…

李华

【计算机毕业设计案例】基于python-CNN深度学习的食物识别

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…

李华

[嵌入式系统-162]：尽快消除现场问题与解决现场bug，这是两种不同的思维模式

“消除现场问题”与“解决现场bug”确实是两种不同的思维模式，尽管它们都发生在生产或运行环境中，但背后的逻辑、目标和处理方式存在显著差异。我们可以从以下几个维度来深入理解这两种思维模式的区别：一、定义上的区别解决现场bug&#xff0…

李华

深度测评MBA必备一键生成论文工具TOP8：开题报告文献综述全攻略

深度测评MBA必备一键生成论文工具TOP8：开题报告文献综述全攻略 2026年MBA论文写作工具测评：为何需要这份深度榜单随着MBA课程的深入，论文撰写成为每位学生必须面对的重要任务。从开题报告到文献综述，再到最终的论文成稿&#xff…

李华

Anaconda加速AI模型训练全攻略

Anaconda加速AI模型训练的技术文章大纲加速环境配置使用Anaconda创建独立Python环境，避免依赖冲突安装CUDA和cuDNN以启用GPU加速通过conda安装TensorFlow/PyTorch的GPU版本优化数据加载利用Dask或Modin替代Pandas处理大型数据集使用TensorFlow Dataset或PyTorch …

李华