华为AI infra大模型面试，我跪了！！！-编程实验室

你们能想象吗？

就是那种，面试官坐在对面，轻飘飘问出一个问题，然后我脑子里的知识库瞬间“404 Not Found”的感觉。

没错，刚结束的华为AI infra大模型岗面试，我就是这个状态。赶紧写篇文章复盘一下。趁着记忆还热乎，把那些让我当场“裂开”的问题和我的真实反应记录下来。不是为了吐槽，是真的想帮大家感受一下，这种硬核岗位的面试，到底长什么样。

面试总共两面，连着面的，没给我太多喘息机会。

说实话，现在回想起来，手心还有点冒汗。

一面：技术硬核，招招致命

一面面试官一看就是技术出身，问题非常直接，基本没废话。

“聊聊你微调Qwen的时候，踩过什么坑？”

这个问题我事先准备过，所以还算稳。我说了数据集质量的问题——刚开始用开源数据直接训练，损失函数下降得很漂亮，但生成的答案完全没法看。

后来发现是数据里混了大量噪声，模型学到的是“如何说废话”，而不是“如何回答问题”。

面试官点了点头，紧接着就问：

“训练参数怎么设的？每个参数是干嘛的？”

这个问题看着基础，但很见功力。你不能只说学习率设了多少，得说清楚为什么这么设。

我当时大概这么回的：

学习率选的 2e-4，用的余弦退火调度。这个值不是拍脑袋定的，是我先用 1e-5 到 1e-3 跑了个小范围搜索，发现 2e-4 附近收敛最稳。这个值要是太大，微调时预训练权重会被迅速覆盖，灾难性遗忘就来了；太小呢，模型根本学不动新数据。

LoRA 的 rank 设的 64。rank 控制低秩矩阵的表达能力。rank 太低，微调效果差；rank 太高，计算量上去了，而且容易过拟合。我当时用的 QLoRA，所以还涉及 4-bit 量化的配置。

“那你怎么评估微调出来的模型？”

这是个开放性问题。我分了三层：

自动化指标：在验证集上算 loss 和 perplexity，这是基础门槛。
任务指标：针对下游任务算准确率、F1 这些。比如我做的文本分类任务，就看分类准确率有没有提升。
人工评估：生成式任务，光看指标不够。我会自己看生成样例，从相关性、逻辑连贯性、格式遵循度几个维度打分。

这里面试官没追问，算是过了。

QLoRA

QLoRA 这块问得比较细。

我说的核心思路是：QLoRA = 4-bit NormalFloat 量化 + Double Quantization + LoRA。关键点是，量化只针对基础模型权重，LoRA 的 adapter 权重还是用 BF16 存。这样显存占用只有原来的一半左右，但效果能逼近全参数微调。

“Agent 的架构你了解吗？”

这块我知道一些，但不算特别深。我画了个简单的图来解释：

Agent 核心就三件事：规划（下一步做什么）、记忆（之前做了什么、有什么知识）、工具调用（怎么跟外部交互）。

然后他顺着问：

“ReAct 和 CoT 的区别？”

这个我比较熟。

CoT（Chain of Thought）是“想清楚了再回答”，就是让模型一步步推理，最后输出答案。整个过程是线性的，推理过程和最终输出是分开的。

ReAct（Reason + Act）是“边想边做”。每一步都是“思考 → 行动 → 观察结果 → 再思考”。它更适合需要和外部环境交互的任务，比如查资料、调用 API。

CoT 适合纯推理问题，ReAct 适合需要行动反馈的问题。

“记忆系统怎么设计？”

这个问题我开始有点虚了。我说了短期记忆和长期记忆的区分。

短期记忆就是当前的对话上下文，存的是最近几轮交互。长期记忆需要外部向量数据库，把历史信息 embedding 后存进去，需要的时候做相似性检索。

面试官追问了检索策略，我说了 RAG 那套，结合相似度阈值和 top-k 召回。

致命问题来了：“对GPU底层计算有了解吗？”

到这里我开始冒汗了。

我说了解一些 CUDA 编程的基础，知道 kernel 函数、线程块的概念。但说实话，我对底层算子优化、Tensor Core 的具体指令、L2 Cache 的管理这些，真不熟。

面试官很温和：“没关系，那KV Cache了解吗？”

我：？？？

KV Cache

这个我真没深入用过，只能硬着头皮说原理。

Transformer 推理的时候，decoder 是自回归的，每生成一个新 token，都要重新计算前面所有 token 的 Key 和 Value。这显然很蠢。KV Cache 就是把之前算好的 K 和 V 存起来，新 token 只算自己的 Q，然后跟缓存里的 K、V 做 attention。

这样复杂度从 O(n²) 降到 O(n)。

面试官点了点头，没继续追问。但我心里清楚，这块我答得不够深。比如显存怎么管理、PageAttention 是怎么回事、连续批处理怎么做，这些都没能展开说。

手撕代码：优先级任务调度

最后一道手撕题。

题目大概是：实现一个任务调度器，任务有优先级和执行时间，要求按优先级调度，同优先级按提交顺序。

这题不算难，我用优先队列（堆）实现的。但写的时候还是有点紧张，边界条件差点漏了。

大概逻辑就是：维护一个时间戳，每次从堆顶取出优先级最高的任务执行执行完后时间推进，然后继续取下一个

一面结束后没有反问环节，直接进入二面。我连水都没来得及喝一口。

二面：综合面，反而更紧张？

二面面试官明显风格不同，更像综合面 + HR面的混合体。

“自我介绍，以及你报的哪个岗位？”

我又来了一遍自我介绍。然后明确说了是 AI infra 训推方向。

“针对这个岗位，你有什么优势？”

这个问题我觉得是全场最关键的一题。

我的回答分了三条线：算法理解能力（知道模型怎么训、为什么这么训）、工程落地能力（Docker、K8s、推理服务部署都做过）、性能意识（训练的时候就会关注吞吐量和显存占用，不是只管 loss 下降）。

说实话第三条是临时加的，因为一面让我意识到，这个岗位对底层性能非常看重。

“为什么从福大转到杭电？”

这个问题有点私人。我如实说了：研究方向更匹配，导师的项目跟大模型相关，而且杭州的互联网氛围更好。

面试官看起来接受了。

“美赛经历”

我简单说了下美赛的建模题，用机器学习做预测，拿了什么奖。这块不是重点，一两句带过。

“说说华为的价值观”

这道题我真没想到。

说实话，我背过，但背得不太熟。我说了“以客户为中心，以奋斗者为本，长期艰苦奋斗”这些。面试官听了没说什么，但我感觉他们更想听到的是我怎么理解这些价值观，而不是背诵原文。

“你来实习的话，期待是什么？”

我说了三点：想接触真正的千卡、万卡训练集群（学校没这条件）；想把训练和推理的整套 pipeline 跑通；想跟高水平的人学东西。

什么是AI大模型应用开发工程师？

如果说AI大模型是蕴藏着巨大能量的“后台超级能力”，那么AI大模型应用开发工程师就是将这种能量转化为实用工具的执行者。

AI大模型应用开发工程师是基于AI大模型，设计开发落地业务的应用工程师。

这个职业的核心价值，在于打破技术与用户之间的壁垒，把普通人难以理解的算法逻辑、模型参数，转化为人人都能轻松操作的产品形态。

无论是日常写作时用到的AI文案生成器、修图软件里的智能美化功能，还是办公场景中的自动记账工具、会议记录用的语音转文字APP，这些看似简单的应用背后，都是应用开发工程师在默默搭建技术与需求之间的桥梁。

他们不追求创造全新的大模型，而是专注于让已有的大模型“听懂”业务需求，“学会”解决具体问题，最终形成可落地、可使用的产品。

CSDN粉丝独家福利

给大家整理了一份AI大模型全套学习资料，这份完整版的 AI 大模型学习资料已经上传CSDN，朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取【保证100%免费】

AI大模型应用开发工程师的核心职责

需求分析与拆解是工作的起点，也是确保开发不偏离方向的关键。

应用开发工程师需要直接对接业务方，深入理解其核心诉求——不仅要明确“要做什么”，更要厘清“为什么要做”以及“做到什么程度算合格”。

在此基础上，他们会将模糊的业务需求拆解为具体的技术任务，明确每个环节的执行标准，并评估技术实现的可行性，同时定义清晰的核心指标，为后续开发、测试提供依据。

这一步就像建筑前的图纸设计，若出现偏差，后续所有工作都可能白费。

技术选型与适配是衔接需求与开发的核心环节。

工程师需要根据业务场景的特点，选择合适的基础大模型、开发框架和工具——不同的业务对模型的响应速度、精度、成本要求不同，选型的合理性直接影响最终产品的表现。

同时，他们还要对行业相关数据进行预处理，通过提示词工程优化模型输出，或在必要时进行轻量化微调，让基础模型更好地适配具体业务。

此外，设计合理的上下文管理规则确保模型理解连贯需求，建立敏感信息过滤机制保障数据安全，也是这一环节的重要内容。

应用开发与对接则是将方案转化为产品的实操阶段。

工程师会利用选定的开发框架构建应用的核心功能，同时联动各类外部系统——比如将AI模型与企业现有的客户管理系统、数据存储系统打通，确保数据流转顺畅。

在这一过程中，他们还需要配合设计团队打磨前端交互界面，让技术功能以简洁易懂的方式呈现给用户，实现从技术方案到产品形态的转化。

测试与优化是保障产品质量的关键步骤。

工程师会开展全面的功能测试，找出并修复开发过程中出现的漏洞，同时针对模型的响应速度、稳定性等性能指标进行优化。

安全合规性也是测试的重点，需要确保应用符合数据保护、隐私安全等相关规定。

此外，他们还会收集用户反馈，通过调整模型参数、优化提示词等方式持续提升产品体验，让应用更贴合用户实际使用需求。

部署运维与迭代则贯穿产品的整个生命周期。

工程师会通过云服务器或私有服务器将应用部署上线，并实时监控运行状态，及时处理突发故障，确保应用稳定运行。

随着业务需求的变化，他们还需要对应用功能进行迭代更新，同时编写完善的开发文档和使用手册，为后续的维护和交接提供支持。

薪资情况与职业价值

市场对这一职业的高度认可，直接体现在薪资待遇上。

据猎聘最新在招岗位数据显示，AI大模型应用开发工程师的月薪最高可达60k。

在AI技术加速落地的当下，这种“技术+业务”的复合型能力尤为稀缺，让该职业成为当下极具吸引力的就业选择。

AI大模型应用开发工程师是AI技术落地的关键桥梁。

他们用专业能力将抽象的技术转化为具体的产品，让大模型的价值真正渗透到各行各业。

随着AI场景化应用的不断深化，这一职业的重要性将更加凸显，也必将吸引更多人才投身其中，推动AI技术更好地服务于社会发展。

华为AI infra大模型面试，我跪了！！！

一面：技术硬核，招招致命

“聊聊你微调Qwen的时候，踩过什么坑？”

“训练参数怎么设的？每个参数是干嘛的？”

“那你怎么评估微调出来的模型？”

QLoRA

“Agent 的架构你了解吗？”

“ReAct 和 CoT 的区别？”

“记忆系统怎么设计？”

致命问题来了：“对GPU底层计算有了解吗？”

KV Cache

手撕代码：优先级任务调度

二面：综合面，反而更紧张？

“自我介绍，以及你报的哪个岗位？”

“针对这个岗位，你有什么优势？”

“为什么从福大转到杭电？”

“美赛经历”

“说说华为的价值观”

“你来实习的话，期待是什么？”

CSDN粉丝独家福利

CSDN粉丝独家福利

项目级AGENTS.md

AI写论文工具深度测评：通用大模型与专业工具的真实表

内存池：从减少 malloc 开销到工程化内存管理

ABB 控制器 4LA41100102V1.3

075 2026版国家级科研痛点攻关高纯钛（Ti）靶材及氮化钛（TiN）反应溅射传世级硬核工程学术大典

淡泊名利之前，先承认我们都很焦虑

一面：技术硬核，招招致命

“聊聊你微调Qwen的时候，踩过什么坑？”

“训练参数怎么设的？每个参数是干嘛的？”

“那你怎么评估微调出来的模型？”

QLoRA

“Agent 的架构你了解吗？”

“ReAct 和 CoT 的区别？”

“记忆系统怎么设计？”

致命问题来了：“对GPU底层计算有了解吗？”

KV Cache

手撕代码：优先级任务调度

二面：综合面，反而更紧张？

“自我介绍，以及你报的哪个岗位？”

“针对这个岗位，你有什么优势？”

“为什么从福大转到杭电？”

“美赛经历”

“说说华为的价值观”

“你来实习的话，期待是什么？”

CSDN粉丝独家福利

CSDN粉丝独家福利

项目级AGENTS.md

AI写论文工具深度测评：通用大模型与专业工具的真实表

内存池：从减少 malloc 开销到工程化内存管理

ABB 控制器 4LA41100102V1.3

075 2026版国家级科研痛点攻关 高纯钛（Ti）靶材及氮化钛（TiN）反应溅射 传世级硬核工程学术大典

淡泊名利之前，先承认我们都很焦虑

075 2026版国家级科研痛点攻关高纯钛（Ti）靶材及氮化钛（TiN）反应溅射传世级硬核工程学术大典