腾讯Teg大模型暑期算法一二三面面经-编程实验室

本文总结了大模型面试高频考点，涵盖Transformer架构、LoRA原理、SFT后训练、DPO与GRPO损失函数、Agent框架设计、高质量训练集构造、量化技术、ZeRO优化策略等关键技术点。同时深入探讨了显存优化方案、算法题（合并区间、KV Cache计算）及MoE模型推理特性。内容结合实习项目经验，提供问题解决思路与实验设计要点，助力求职者系统复习，提升面试竞争力。

一面

1.自我介绍

2.介绍主流 Transformer-based 模型架构

3.讲一下 LoRA 原理

4.为什么 SFT 之后还要进行后训练

5.讲一下 DPO 的损失函数怎么计算

6.讲一下 GRPO 原理

7.使用 GRPO 时，构造数据要符合什么要求

8.熟悉哪些 Agent 框架

9.如果要设计一个好的 Agent，除了大模型，还会设计哪些部分

10.怎么构造高质量训练集

11.Dense 模型和 MoE 模型有什么区别

12.量化发挥作用的原理是什么

13.讲一下 ZeRO-1、ZeRO-2、ZeRO-3

14.如果显存有限，会选择哪个方案训练

15.算法题：LeetCode 56 合并区间

二面

1.自我介绍

2.详细介绍实习工作

3.重点讲清楚自己解决的是什么问题

4.讲清楚背景、自己负责的问题、以及一步步解决的过程

5.讲一下通过这段工作总结了哪些经验

6.介绍最终各个指标

7.SFT 的 LoRA 和 DPO 的 LoRA 有什么区别

8.详细展开实习工作

9.设计了哪些实验

10.最终选择了哪个方案，为什么

11.最终交付是怎么交付的

12.聊了一下 RAG

13.反问：组里大概工作方向

三面

1.自我介绍

2.讲一下实习工作主要解决的是什么问题

3.训练数据怎么来的，最终几个评测集怎么用，训练了多少个 Epoch

4.为什么在做完一个项目后离职

5.算法题和开放题：计算 KV Cache 显存需要哪些前置数据，KV Cache 显存怎么计算

6.3B Dense 模型和 32B-a3B MoE 模型，哪个推理延迟更低、推理速度更快

7.MoE 模型第一次推理激活专家 1、3、5，第二次激活专家 2、4、6，专家切换的成本主要是什么

8.大模型服务 API 定价问题：不同服务方案下，1K Token、32K 上下文、128K 上下文的输入输出定价如何设计

9.算法题：会议室预定问题，判断某个时刻点是否可以预定

假如你从2026年开始学大模型，按这个步骤走准能稳步进阶。

接下来告诉你一条最快的邪修路线，

3个月即可成为模型大师，薪资直接起飞。

阶段1:大模型基础

阶段2:RAG应用开发工程

阶段3:大模型Agent应用架构

阶段4:大模型微调与私有化部署

配套文档资源+全套AI 大模型学习资料，朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】👇👇

配套文档资源+全套AI 大模型学习资料，朋友们如果需要可以微信扫描下方二维码免费领取【`保证100%免费`】👇👇

CAXA 曲线

位置和内容1、样条【作用】根据点击的点，画出一条平滑的曲线；直接作图1、输入点；依次输入多个点；2、空格键结束；开曲线/闭曲线【闭曲线】闭合曲线应用例1：正视图表示螺纹孔的剖切图，边缘就用样…

李华

社会风气何以如此？渡劫未彻底，继续渡劫。从为人民服务到为节点服务

社会风气何以如此？渡劫未彻底，继续渡劫。从为人民服务到为节点服务。 Jianbing Zhu 1 1 ECT-OS-JiuHuaShan 文明实践室 ORCID: 0009-0006-8591-1891 DOI: 10.5281/zenodo.20302480 Email: ect-os-jiuhuashanzohomail.cn 预印本提交：202…

李华

Agent 为什么一上层级规划就开始子目标漂移：从 Hierarchical Task Network 到 Subgoal Verification 的工程实战

一、层级规划为什么越拆越散很多团队把单步 Agent 升级为层级规划后，任务完成率反而下降。HTN 拆分子目标后，中层计划与底层执行频繁脱节。 1.1 高层目标与子行动的断裂 Agent 收到"预订北京到上海商务舱机票"目标，HTN 拆分为查询…

李华

Redistributor：分布式系统动态负载均衡与故障转移的核心组件设计

1. 项目概述：从“分发者”到系统架构的稳定基石在构建现代分布式系统时，我们常常会遇到一个看似简单却至关重要的挑战：如何将任务、请求或数据，高效、公平、稳定地分配给一组对等的服务节点？这个问题，就是“…

李华

P1281 书的复制【洛谷算法习题】

P1281 书的复制网页链接 P1281 书的复制题目背景大多数人的错误原因：尽可能让前面的人少抄写，如果前几个人可以不写则不写，对应的人输出 0 0 。不过，已经修改数据，保证每个人都有活可干。题目描述现在要…

李华

在openclaw工具中一键写入taotoken配置以驱动ai工作流

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度在OpenClaw工具中一键写入Taotoken配置以驱动AI工作流基础教程类，面向使用OpenClaw构建AI工作流或Agent的开发者&…

李华

配套文档资源+全套AI 大模型 学习资料，朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】👇👇

CAXA 曲线

社会风气何以如此？渡劫未彻底，继续渡劫。从为人民服务到为节点服务

Agent 为什么一上层级规划就开始子目标漂移：从 Hierarchical Task Network 到 Subgoal Verification 的工程实战

Redistributor：分布式系统动态负载均衡与故障转移的核心组件设计

P1281 书的复制【洛谷算法习题】

在openclaw工具中一键写入taotoken配置以驱动ai工作流

配套文档资源+全套AI 大模型学习资料，朋友们如果需要可以微信扫描下方二维码免费领取【`保证100%免费`】👇👇