news 2026/6/24 2:26:41

华为AI infra大模型面试,我跪了!!!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
华为AI infra大模型面试,我跪了!!!

你们能想象吗?

就是那种,面试官坐在对面,轻飘飘问出一个问题,然后我脑子里的知识库瞬间“404 Not Found”的感觉。

没错,刚结束的华为AI infra大模型岗面试,我就是这个状态。赶紧写篇文章复盘一下。趁着记忆还热乎,把那些让我当场“裂开”的问题和我的真实反应记录下来。不是为了吐槽,是真的想帮大家感受一下,这种硬核岗位的面试,到底长什么样。

面试总共两面,连着面的,没给我太多喘息机会。

说实话,现在回想起来,手心还有点冒汗。

一面:技术硬核,招招致命

一面面试官一看就是技术出身,问题非常直接,基本没废话。

“聊聊你微调Qwen的时候,踩过什么坑?”

这个问题我事先准备过,所以还算稳。我说了数据集质量的问题——刚开始用开源数据直接训练,损失函数下降得很漂亮,但生成的答案完全没法看。

后来发现是数据里混了大量噪声,模型学到的是“如何说废话”,而不是“如何回答问题”。

面试官点了点头,紧接着就问:

“训练参数怎么设的?每个参数是干嘛的?”

这个问题看着基础,但很见功力。你不能只说学习率设了多少,得说清楚为什么这么设。

我当时大概这么回的:

学习率选的 2e-4,用的余弦退火调度。这个值不是拍脑袋定的,是我先用 1e-5 到 1e-3 跑了个小范围搜索,发现 2e-4 附近收敛最稳。这个值要是太大,微调时预训练权重会被迅速覆盖,灾难性遗忘就来了;太小呢,模型根本学不动新数据。

LoRA 的 rank 设的 64。rank 控制低秩矩阵的表达能力。rank 太低,微调效果差;rank 太高,计算量上去了,而且容易过拟合。我当时用的 QLoRA,所以还涉及 4-bit 量化的配置。

“那你怎么评估微调出来的模型?”

这是个开放性问题。我分了三层:

  • 自动化指标:在验证集上算 loss 和 perplexity,这是基础门槛。
  • 任务指标:针对下游任务算准确率、F1 这些。比如我做的文本分类任务,就看分类准确率有没有提升。
  • 人工评估:生成式任务,光看指标不够。我会自己看生成样例,从相关性、逻辑连贯性、格式遵循度几个维度打分。

这里面试官没追问,算是过了。

QLoRA

QLoRA 这块问得比较细。

我说的核心思路是:QLoRA = 4-bit NormalFloat 量化 + Double Quantization + LoRA。关键点是,量化只针对基础模型权重,LoRA 的 adapter 权重还是用 BF16 存。这样显存占用只有原来的一半左右,但效果能逼近全参数微调。

“Agent 的架构你了解吗?”

这块我知道一些,但不算特别深。我画了个简单的图来解释:

Agent 核心就三件事:规划(下一步做什么)、记忆(之前做了什么、有什么知识)、工具调用(怎么跟外部交互)。

然后他顺着问:

“ReAct 和 CoT 的区别?”

这个我比较熟。

CoT(Chain of Thought)是“想清楚了再回答”,就是让模型一步步推理,最后输出答案。整个过程是线性的,推理过程和最终输出是分开的。

ReAct(Reason + Act)是“边想边做”。每一步都是“思考 → 行动 → 观察结果 → 再思考”。它更适合需要和外部环境交互的任务,比如查资料、调用 API。

CoT 适合纯推理问题,ReAct 适合需要行动反馈的问题。

“记忆系统怎么设计?”

这个问题我开始有点虚了。我说了短期记忆和长期记忆的区分。

短期记忆就是当前的对话上下文,存的是最近几轮交互。长期记忆需要外部向量数据库,把历史信息 embedding 后存进去,需要的时候做相似性检索。

面试官追问了检索策略,我说了 RAG 那套,结合相似度阈值和 top-k 召回。

致命问题来了:“对GPU底层计算有了解吗?”

到这里我开始冒汗了。

我说了解一些 CUDA 编程的基础,知道 kernel 函数、线程块的概念。但说实话,我对底层算子优化、Tensor Core 的具体指令、L2 Cache 的管理这些,真不熟。

面试官很温和:“没关系,那KV Cache了解吗?”

我:???

KV Cache

这个我真没深入用过,只能硬着头皮说原理。

Transformer 推理的时候,decoder 是自回归的,每生成一个新 token,都要重新计算前面所有 token 的 Key 和 Value。这显然很蠢。KV Cache 就是把之前算好的 K 和 V 存起来,新 token 只算自己的 Q,然后跟缓存里的 K、V 做 attention。

这样复杂度从 O(n²) 降到 O(n)。

面试官点了点头,没继续追问。但我心里清楚,这块我答得不够深。比如显存怎么管理、PageAttention 是怎么回事、连续批处理怎么做,这些都没能展开说。

手撕代码:优先级任务调度

最后一道手撕题。

题目大概是:实现一个任务调度器,任务有优先级和执行时间,要求按优先级调度,同优先级按提交顺序。

这题不算难,我用优先队列(堆)实现的。但写的时候还是有点紧张,边界条件差点漏了。

大概逻辑就是:维护一个时间戳,每次从堆顶取出优先级最高的任务执行执行完后时间推进,然后继续取下一个

一面结束后没有反问环节,直接进入二面。我连水都没来得及喝一口。

二面:综合面,反而更紧张?

二面面试官明显风格不同,更像综合面 + HR面的混合体。

“自我介绍,以及你报的哪个岗位?”

我又来了一遍自我介绍。然后明确说了是 AI infra 训推方向。

“针对这个岗位,你有什么优势?”

这个问题我觉得是全场最关键的一题。

我的回答分了三条线:算法理解能力(知道模型怎么训、为什么这么训)、工程落地能力(Docker、K8s、推理服务部署都做过)、性能意识(训练的时候就会关注吞吐量和显存占用,不是只管 loss 下降)。

说实话第三条是临时加的,因为一面让我意识到,这个岗位对底层性能非常看重。

“为什么从福大转到杭电?”

这个问题有点私人。我如实说了:研究方向更匹配,导师的项目跟大模型相关,而且杭州的互联网氛围更好。

面试官看起来接受了。

“美赛经历”

我简单说了下美赛的建模题,用机器学习做预测,拿了什么奖。这块不是重点,一两句带过。

“说说华为的价值观”

这道题我真没想到。

说实话,我背过,但背得不太熟。我说了“以客户为中心,以奋斗者为本,长期艰苦奋斗”这些。面试官听了没说什么,但我感觉他们更想听到的是我怎么理解这些价值观,而不是背诵原文

“你来实习的话,期待是什么?”

我说了三点:想接触真正的千卡、万卡训练集群(学校没这条件);想把训练和推理的整套 pipeline 跑通;想跟高水平的人学东西。

01

什么是AI大模型应用开发工程师?

如果说AI大模型是蕴藏着巨大能量的“后台超级能力”,那么AI大模型应用开发工程师就是将这种能量转化为实用工具的执行者。

AI大模型应用开发工程师是基于AI大模型,设计开发落地业务的应用工程师。

这个职业的核心价值,在于打破技术与用户之间的壁垒,把普通人难以理解的算法逻辑、模型参数,转化为人人都能轻松操作的产品形态。

无论是日常写作时用到的AI文案生成器、修图软件里的智能美化功能,还是办公场景中的自动记账工具、会议记录用的语音转文字APP,这些看似简单的应用背后,都是应用开发工程师在默默搭建技术与需求之间的桥梁。

他们不追求创造全新的大模型,而是专注于让已有的大模型“听懂”业务需求,“学会”解决具体问题,最终形成可落地、可使用的产品。

CSDN粉丝独家福利

给大家整理了一份AI大模型全套学习资料,这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取【保证100%免费】

02

AI大模型应用开发工程师的核心职责

需求分析与拆解是工作的起点,也是确保开发不偏离方向的关键。

应用开发工程师需要直接对接业务方,深入理解其核心诉求——不仅要明确“要做什么”,更要厘清“为什么要做”以及“做到什么程度算合格”。

在此基础上,他们会将模糊的业务需求拆解为具体的技术任务,明确每个环节的执行标准,并评估技术实现的可行性,同时定义清晰的核心指标,为后续开发、测试提供依据。

这一步就像建筑前的图纸设计,若出现偏差,后续所有工作都可能白费。

技术选型与适配是衔接需求与开发的核心环节。

工程师需要根据业务场景的特点,选择合适的基础大模型、开发框架和工具——不同的业务对模型的响应速度、精度、成本要求不同,选型的合理性直接影响最终产品的表现。

同时,他们还要对行业相关数据进行预处理,通过提示词工程优化模型输出,或在必要时进行轻量化微调,让基础模型更好地适配具体业务。

此外,设计合理的上下文管理规则确保模型理解连贯需求,建立敏感信息过滤机制保障数据安全,也是这一环节的重要内容。

应用开发与对接则是将方案转化为产品的实操阶段。

工程师会利用选定的开发框架构建应用的核心功能,同时联动各类外部系统——比如将AI模型与企业现有的客户管理系统、数据存储系统打通,确保数据流转顺畅。

在这一过程中,他们还需要配合设计团队打磨前端交互界面,让技术功能以简洁易懂的方式呈现给用户,实现从技术方案到产品形态的转化。

测试与优化是保障产品质量的关键步骤。

工程师会开展全面的功能测试,找出并修复开发过程中出现的漏洞,同时针对模型的响应速度、稳定性等性能指标进行优化。

安全合规性也是测试的重点,需要确保应用符合数据保护、隐私安全等相关规定。

此外,他们还会收集用户反馈,通过调整模型参数、优化提示词等方式持续提升产品体验,让应用更贴合用户实际使用需求。

部署运维与迭代则贯穿产品的整个生命周期。

工程师会通过云服务器或私有服务器将应用部署上线,并实时监控运行状态,及时处理突发故障,确保应用稳定运行。

随着业务需求的变化,他们还需要对应用功能进行迭代更新,同时编写完善的开发文档和使用手册,为后续的维护和交接提供支持。

03

薪资情况与职业价值

市场对这一职业的高度认可,直接体现在薪资待遇上。

据猎聘最新在招岗位数据显示,AI大模型应用开发工程师的月薪最高可达60k。

在AI技术加速落地的当下,这种“技术+业务”的复合型能力尤为稀缺,让该职业成为当下极具吸引力的就业选择。

AI大模型应用开发工程师是AI技术落地的关键桥梁。

他们用专业能力将抽象的技术转化为具体的产品,让大模型的价值真正渗透到各行各业。

随着AI场景化应用的不断深化,这一职业的重要性将更加凸显,也必将吸引更多人才投身其中,推动AI技术更好地服务于社会发展。

CSDN粉丝独家福利

给大家整理了一份AI大模型全套学习资料,这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取【保证100%免费】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/24 2:25:01

项目级AGENTS.md

项目级AGENTS.md 【免费下载链接】agents.md AGENTS.md — a simple, open format for guiding coding agents 项目地址: https://gitcode.com/GitHub_Trending/ag/agents.md 开发环境配置 Node.js版本:18.x包管理器:pnpm开发命令:pn…

作者头像 李华
网站建设 2026/6/24 2:24:31

AI写论文工具深度测评:通用大模型与专业工具的真实表

凌晨两点,第七次把论文初稿扔进查重系统,屏幕上刺眼的42%重复率——你是不是也在怀疑人生?更崩溃的是,那些AI生成的参考文献,在知网根本搜不到,导师一眼就看出是编的。 这不是你一个人的困境。2024年高校应…

作者头像 李华
网站建设 2026/6/24 2:23:59

内存池:从减少 malloc 开销到工程化内存管理

摘要在高并发服务器、游戏引擎、数据库、消息队列等系统中,频繁申请和释放小块内存会带来明显的性能损耗,并可能造成内存碎片。内存池的核心思想是:提前申请一大块内存,再按固定或半固定策略进行分配和回收,从而降低系…

作者头像 李华
网站建设 2026/6/24 2:23:04

ABB 控制器 4LA41100102V1.3

一、概述与背景介绍 ABB控制器4LA41100102V1.3属于ABB的要件设备系列(Instrumentation Devices for Process Control Systems),具体型号为AI732。它是一种高精度模拟输入模块,主要用于ILAS(Industrial Logic and Auto…

作者头像 李华
网站建设 2026/6/24 2:13:07

淡泊名利之前,先承认我们都很焦虑

在技术变化、裁员传闻和收入比较里,IT人的焦虑常不是贪心,而是怕失去选择。淡泊名利不是不努力,而是把工资、职级降为参考,重新搭起更稳的生活系统。这几年做技术,越发觉得很多 IT 人不是不想“淡泊名利”,…

作者头像 李华