AIGC面试指南：从Transformer到RAG与Agent的实战知识体系-编程实验室

1. 项目概述：一本面向AIGC求职者的实战指南

最近几年，AI生成内容（AIGC）领域的热度可以说是席卷全球。从能写代码、写文章的ChatGPT，到能生成逼真图像的Stable Diffusion、Midjourney，再到Sora这样的视频生成模型，技术迭代的速度快得让人目不暇接。这股浪潮带来的，不仅是产品和应用的爆发，更催生了一个全新的、充满机遇的就业市场。无论是大厂还是初创公司，都在争相设立AIGC相关的岗位，从算法工程师、产品经理到内容策略师，需求缺口巨大。

但问题也随之而来。对于想进入这个领域的求职者，尤其是应届生或希望转型的从业者，面前仿佛横着一道高墙。岗位描述里充斥着各种陌生的术语：提示工程、LoRA微调、多模态理解、RAG、Agent……传统的计算机或AI面试准备资料，比如刷LeetCode、看《剑指Offer》，似乎已经不够用了。AIGC的面试考察的不仅仅是扎实的编程和算法基础，更看重你对这个新兴领域的理解深度、对前沿技术的实践能力，以及解决实际业务问题的思维。

正是在这个背景下，我注意到了GitHub上一个名为“WeThinkIn/AIGC-Interview-Book”的开源项目。简单来说，它试图成为一本“AIGC面试百科全书”。这个定位非常精准，它瞄准的正是当前求职者最核心的痛点：信息分散、知识体系不完整、缺乏实战导向的面试指导。这个项目不是一本枯燥的理论教科书，它的目标很明确——帮你系统性地面试准备，从基础概念到高频考点，再到手撕代码和项目复盘，提供一条清晰的路径。

我自己在带团队和面试候选人的过程中，也深感市面上缺乏这样一份整合性的资源。面试官希望看到候选人不仅知道Transformer是什么，更能说清楚它在Diffusion模型里起了什么作用；不仅会用ChatGPT的API，更能设计一个基于大语言模型的智能客服系统架构。因此，当我深入翻阅这个项目的目录和内容时，我觉得它做对了几件关键的事：它试图构建一个从理论到实践的知识图谱，并且以问题驱动的方式组织内容，这非常符合面试准备的实战场景。接下来，我就结合自己的经验，对这个项目进行一次深度的拆解和延展，希望能为正在准备AIGC面试的你，提供一份更立体的“食用指南”。

2. 核心内容架构与设计思路拆解

2.1 知识体系的结构化：从散点到图谱

一份好的面试指南，首先得有一个清晰的骨架。AIGC-Interview-Book 在内容架构上，采用了模块化、分层级的组织方式，这反映了构建AIGC知识体系的经典思路。通常，我们可以将AIGC领域的知识分为几个核心层次：

基础理论层：这是地基，包括深度学习基础（如神经网络、反向传播）、自然语言处理基础（如词向量、注意力机制）、计算机视觉基础（如CNN、GAN）以及最重要的——Transformer架构。这个项目通常会把Transformer及其变体（如BERT、GPT、T5）的原理、实现和演进作为重中之重，因为它是当今绝大多数AIGC模型的基石。

模型与技术层：在地基之上，是各种具体的AIGC模型和技术。这又可以分为几条主线：

文本生成：专注于自回归语言模型（如GPT系列）、文本到文本的模型（如T5），以及相关的技术如思维链、指令微调。
图像生成：以扩散模型（Diffusion Models）为核心，涵盖DDPM、Stable Diffusion、ControlNet等关键模型，以及LoRA、DreamBooth等微调技术。
多模态与交叉领域：这是当前最前沿的方向，包括图文理解（如CLIP）、图文生成（如DALL-E系列）、视频生成（如Sora、Pika），以及智能体（Agent）和检索增强生成（RAG）等应用框架。

工程与实践层：理论最终要落地。这一层关注如何把模型用起来，包括：

提示工程：如何与大模型高效对话，设计出高质量的Prompt。
模型部署与优化：涉及模型量化、剪枝、蒸馏，以及使用vLLM、TensorRT等工具进行高性能推理。
应用开发：如何基于LangChain、LlamaIndex等框架快速搭建AI应用，如何设计基于大模型的系统架构。

行业与业务层：技术最终服务于业务。这一层会探讨AIGC在不同行业（如内容创作、教育、金融、游戏）的应用场景、商业模式、伦理与安全（如偏见、幻觉、版权）等问题。

AIGC-Interview-Book 的内容目录，基本上就是沿着这个逻辑展开的。它没有试图一次性覆盖所有细节，而是抓住了每个层次最核心、最高频的考点进行组织。这种结构化的好处在于，求职者可以按图索骥，先夯实基础，再逐个击破技术难点，最后提升工程和业务视野，形成一个完整的知识闭环。

2.2 问题驱动的学习路径：模拟真实面试场景

这个项目另一个显著特点是“问题驱动”。它包含了大量的面试真题、高频问题集和思考题。这不仅仅是简单的Q&A罗列，其背后是一种高效的学习方法模拟。

真实的面试是什么样子的？面试官往往会从一个宽泛的问题开始（“请介绍一下Transformer”），然后根据你的回答，层层深入地追问细节（“Self-Attention的矩阵计算复杂度是多少？为什么？”“Multi-Head Attention相比Single-Head有什么优势？有哪些变体？”），最后可能会让你在白板或在线编辑器上实现一个核心片段（“请写一下Self-Attention的PyTorch伪代码”）。

这个项目的设计就模拟了这种场景。通过将问题分类、分级，它引导你：

记忆与理解：先回答“是什么”和“为什么”的基础问题。
分析与对比：回答“A和B有什么区别”、“各自的优缺点是什么”这类问题，这考察的是你的知识网络是否联通。
应用与设计：回答“如何用XX技术解决YY问题”、“请设计一个系统”这类开放性问题，这考察的是你的知识迁移和系统思维能力。
动手与实践：通过代码题，考察你是否真的理解原理，并能将其转化为可运行的代码。

注意：在使用这类问题集时，切忌死记硬背答案。最好的方法是，把每个问题当作一次模拟面试。先自己尝试回答，记录下思路的卡点和模糊之处，然后再去对照项目的解析或自行查阅资料补充。最后，尝试脱离资料，用自己的语言完整地复述一遍。这个过程才是知识内化的关键。

2.3 开源协作与内容迭代：保持前沿性的关键

AIGC领域日新月异，今天的热点可能半年后就成了基础知识。因此，一本静态的“书”是远远不够的。AIGC-Interview-Book 以GitHub开源项目的形式存在，这可能是它最明智的选择之一。

开源意味着：

持续更新：维护者和社区贡献者可以随时提交新的内容，补充最新的模型（如Gemini、Claude 3、Sora）、技术和面试题。
集体智慧：一个人的视野总是有限的。开源社区可以汇聚众多从业者、面试官和求职者的经验，共同修正错误、补充案例、提供多元化的解题思路。
透明与可信：所有内容都在阳光下，接受所有人的检验和讨论，这比某些来路不明的“面经”要可靠得多。

对于使用者来说，你不仅要关注项目的main分支，更应该留意最近的Issues和Pull Requests，那里往往有最新的讨论和即将加入的内容。同时，如果你在学习和面试中有新的心得或发现了更好的答案，积极参与贡献，也是巩固自己知识、建立技术影响力的好方法。

3. 核心模块深度解析与学习要点

3.1 大语言模型：超越Transformer的背诵

大语言模型是AIGC的皇冠，也是面试的重灾区。项目中对LLM的覆盖，通常会从Transformer开始，但你需要准备的内容远不止于此。

Transformer的深度理解：面试官默认你已经熟悉Self-Attention、FFN、LayerNorm这些基础组件。他们更可能问：

位置编码的演进：为什么Sinusoidal位置编码在长文本上会失效？RoPE、ALiBi等相对位置编码是如何解决这个问题的？它们的数学形式是怎样的？
注意力机制的优化：Flash Attention是如何将计算复杂度从O(N²)的内存访问优化到O(N²)的？它的核心思想是什么？还有哪些近似注意力方法（如Linear Attention）？
模型架构的变体：Decoder-only（GPT）、Encoder-only（BERT）、Encoder-Decoder（T5）各自适合什么任务？为什么当前的LLM多以Decoder-only为主？Mixture of Experts (MoE) 架构如GLaM、Mixtral是如何工作的，有什么优缺点？

训练与微调全流程：你需要清晰地描述从预训练到应用的全链路。

预训练：数据如何构建（Common Crawl清洗、多语言处理）？训练目标（Next Token Prediction）有什么缺陷？如何应对？
有监督微调：指令微调的数据集如何构建（如Self-Instruct）？它如何让模型学会“听从指令”？
对齐技术：这是当前的核心。RLHF（基于人类反馈的强化学习）的三个步骤（SFT、奖励模型训练、PPO优化）具体如何操作？DPO（直接偏好优化）为什么被认为更简单有效？它的损失函数是什么？
高效微调：LoRA的原理是什么？为什么只训练低秩矩阵就能达到接近全参数微调的效果？QLoRA又是如何进一步降低显存占用的？

关键能力与评估：模型的好坏如何衡量？

评估基准：你知道MMLU、GSM8K、HumanEval、BIG-Bench这些基准分别测试什么能力吗？
涌现能力：思维链（CoT）是如何被激发的？为什么说它是“涌现”的，而不是规模简单放大的结果？
幻觉与事实性：模型为什么会“胡言乱语”？有哪些技术可以缓解幻觉（如RAG、Self-Consistency）？

实操心得：准备LLM部分时，强烈建议你跟着一篇经典论文的复现代码（比如MinGPT、nanoGPT）自己动手实现一个迷你版的GPT。不用太大，哪怕只有几层，几百万参数。这个过程会让你对数据流水线、模型前向传播、损失计算、梯度回传有刻骨铭心的理解。面试时，你可以自信地说：“我亲手实现过一个Transformer，我在处理Masked Attention时遇到过XX问题，我是通过XX方式解决的。” 这种实践经验的价值，远超背诵十篇论文的摘要。

3.2 图像生成与扩散模型：从噪声到艺术的数学

扩散模型是继GAN之后最重要的图像生成技术，Stable Diffusion的出现更是让它变得触手可及。面试中，你需要穿透“去噪”这个直观概念，理解其背后的数学原理和工程巧思。

前向与反向过程：这是扩散模型的基石。

前向过程（加噪）：这是一个马尔可夫链，每一步都对图像添加一点点高斯噪声。你需要理解噪声调度器，不同的β_t（噪声方差）设置策略（如linear, cosine）会对训练和采样产生什么影响。
反向过程（去噪）：核心是学习一个噪声预测网络 ε_θ。为什么预测噪声比直接预测原始图像更稳定？推导出这个损失函数（简化后的均方误差）是关键。

关键改进与变体：原始DDPM速度慢，效果也有提升空间。

DDIM：它如何将扩散过程重新定义为非马尔可夫过程，从而实现确定性采样和更快的采样速度？它的采样公式是怎样的？
条件生成：如何引导扩散模型生成我们想要的内容？Classifier Guidance和Classifier-Free Guidance有什么区别？后者为什么更流行？
Latent Diffusion：Stable Diffusion的革命性在哪里？为什么要在VAE的潜空间中进行扩散？这带来了哪些好处（计算效率、细节质量）？
ControlNet：它是如何实现精准的空间条件控制的（如边缘图、姿态图）？它的“零卷积”层设计有什么妙处？

微调与个性化：这是让扩散模型落地到具体业务的关键。

DreamBooth：它如何用3-5张图片就让模型学会一个新概念（如特定的人或物体）？它修改了模型的那一部分？
LoRA for Diffusion：在扩散模型中应用LoRA有什么不同？通常注入到哪些层（Cross-Attention）？为什么有效？
Textual Inversion：它学习的是一个新的词嵌入，而不是模型权重。它适合什么场景？

采样器：这是影响生成速度和质量的“玄学”部分。你需要了解Euler、DDIM、DPM++、LCM等常见采样器的特点和适用场景。例如，LCM（Latent Consistency Model）是如何实现一步或几步采样的？

3.3 多模态与智能体：AIGC的未来形态

单一模态的生成已经很强，但未来属于多模态的融合与交互。这部分是考察你技术视野和前瞻性的重点。

多模态大模型：

对齐技术：图文模型如CLIP，是如何让图像和文本在共享的嵌入空间中对齐的？它的对比学习损失函数是如何工作的？
融合架构：像Flamingo、BLIP-2这样的模型，是如何处理不同模态输入的？是早期融合、晚期融合还是中间融合？LLaVA、Qwen-VL等开源模型通常采用什么架构（视觉编码器+LLM+投影层）？
具身智能：这是一个更前沿的方向，模型需要理解物理世界并通过动作交互。面试中可能会问及相关的仿真环境（如Habitat）、任务设定和基础挑战。

检索增强生成：这是解决大模型“幻觉”和知识过时问题的利器。

核心流程：RAG的“检索-生成”流程是怎样的？如何将用户查询、检索到的上下文和系统指令组合成有效的Prompt？
检索器：除了简单的向量相似度检索（使用FAISS、Chroma等），还有哪些高级检索技术？如HyDE（假设性文档嵌入）、Reranker（重排序模型）如何提升检索质量？
评估：如何评估一个RAG系统的好坏？是看最终答案的准确性，还是分解为检索召回率、答案相关性等指标？

智能体：让大模型学会使用工具、进行规划，是通向AGI的重要路径。

ReAct框架：将推理（Reasoning）和行动（Action）结合，让模型边想边做。它的Prompt模板是怎样的？
工具使用：如何让大模型理解并调用外部API、数据库、搜索工具？LangChain的Agent和Tools模块是如何设计的？
规划与反思：智能体如何分解复杂任务？如何从失败的行动中反思并调整策略？Tree of Thoughts (ToT) 和 Graph of Thoughts (GoT) 等框架提供了什么新思路？

4. 工程实践与系统设计能力考察

4.1 提示工程：与模型对话的艺术

很多人低估了提示工程的重要性，认为就是“说人话”。但在实际业务中，设计稳定、高效、可控的Prompt是成本最低、见效最快的优化手段。

基础技巧：角色设定、指令清晰、提供示例（Few-shot）、步骤分解（Chain-of-Thought）。这些需要熟练掌握。

高级模式：

思维链：不仅仅是“让我们一步步思考”，可以尝试不同的变体，如“首先，从问题中提取关键信息...其次，回忆相关公式...”。
自我一致性：让模型生成多个推理路径，然后投票选择最终答案。这在数学和逻辑问题上特别有效。
生成-判断-修正循环：让模型先生成一个答案，然后自己扮演裁判去评估这个答案的缺陷，最后进行修正。这能有效提升复杂任务的完成质量。

系统化设计：在实际产品中，Prompt往往是一个复杂的模板系统。

变量注入：如何安全地将用户输入、检索结果、对话历史等动态内容注入到Prompt模板中，同时避免提示注入攻击？
结构化输出：如何通过Prompt让模型稳定地输出JSON、XML等结构化数据，方便后端解析？使用像{“key”: “value”}这样的明确格式，并在Few-shot示例中强化。
流水线设计：一个复杂任务可能需要多个Prompt接力完成。例如，先用一个Prompt分析用户意图并拆分子任务，再用不同的Prompt调用不同的工具或知识库，最后用一个Prompt汇总结果。你需要考虑如何设计这个流水线，并管理中间状态。

注意事项：提示工程不是玄学，需要像调试代码一样进行测试和评估。建立一个包含各种边界案例的测试集，用A/B测试对比不同Prompt版本的效果（如准确率、响应长度、有害内容率），是工程上的必备环节。不要迷信网上流传的“魔法Prompt”，最适合你业务场景的Prompt，一定是你自己通过数据迭代出来的。

4.2 模型部署与推理优化：让想法飞入寻常百姓家

训练出一个好模型只是第一步，如何低成本、高性能、高并发地提供在线服务，是工程上的巨大挑战。这部分是区分研究型人才和工程型人才的关键。

推理框架选型：

vLLM：当前LLM服务化的首选之一。它的核心创新是PagedAttention，灵感来自操作系统的虚拟内存分页。你需要理解它如何通过高效管理KV Cache来极大地提高吞吐量，尤其是在长文本场景下。
TensorRT-LLM：NVIDIA的官方优化库，能对模型进行图优化、内核融合、量化，并在Tensor Core上达到极致性能。它和vLLM的定位有何不同？（vLLM侧重吞吐和调度，TensorRT-LLM侧重单卡极致延迟和效率）。
TGI：Hugging Face的推理服务框架，集成了模型并行、连续批处理等特性，易于与HF生态集成。
ONNX Runtime：对于跨平台部署（特别是边缘设备）是一个好选择。

核心优化技术：

量化：将模型权重和激活从FP16/BF16降低到INT8甚至INT4。你需要了解：
- 训练后量化：简单快速，但精度损失可能较大。
- 量化感知训练：在训练中模拟量化过程，获得精度更高的低精度模型。
- GPTQ、AWQ：这些主流的LLM量化方法有什么区别？GPTQ是对权重进行逐层量化，而AWQ则关注激活分布，保护“重要权重”。
连续批处理：这是提高GPU利用率的生命线。当多个请求的序列长度不一致时，动态批处理如何工作？如何管理不同序列的KV Cache？
FlashAttention：不仅仅是训练时用，推理时同样能大幅降低内存访问开销，提升速度。

系统设计考量：如果面试官让你设计一个类似ChatGPT的在线服务，你会考虑哪些方面？

服务架构：API网关 -> 负载均衡 -> 模型服务集群（可能按模型版本分流）。
缓存策略：对于高频的、确定的Prompt（如系统指令），结果是否可以缓存？
流式输出：如何实现Token-by-Token的流式返回，提升用户体验？使用Server-Sent Events还是WebSocket？
监控与降级：如何监控服务的延迟、吞吐量、错误率？当流量激增时，如何实施降级策略（如关闭流式、延长响应时间）？
成本估算：估算一下服务100万日活用户，平均对话20轮，需要多少GPU成本？这会迫使你思考模型大小、量化程度、批处理大小等具体参数。

4.3 基于大模型的系统架构设计

这是面试中的“压轴题”，通常以开放性问题形式出现，例如“设计一个智能客服系统”或“设计一个AI辅助编程工具”。回答这类问题，需要展现你的全局观和工程思维。一个通用的框架可以遵循以下步骤：

第一步：需求澄清与范围界定不要急于说技术。先问清楚，和面试官对齐：

核心功能：这个系统主要解决什么问题？（例如，客服系统是回答常见问题，还是处理复杂投诉？）
用户场景：主要用户是谁？在什么环境下使用？（例如，是网页在线客服，还是集成在APP里的助手？）
关键指标：如何衡量系统成功？是回答准确率、用户满意度、还是问题解决率？
约束条件：有什么限制？比如响应时间要求（<2秒）、预算（只能用开源模型）、数据隐私要求等。

第二步：高层架构设计画出系统的核心组件框图，并阐述数据流。

用户接口层：Web/App前端、API网关。处理用户请求的接收和响应返回（支持流式）。
智能路由与意图识别：用户的输入首先到达这里。这可能是一个轻量级的分类模型或规则引擎，用于判断用户意图（是查询订单，还是技术问题），并决定后续流程。对于简单、确定性问题，可以直接走FAQ检索；对于复杂问题，再走大模型流程。
知识核心层：
- 知识库：存储产品文档、历史问答对、解决方案文章等。可能是向量数据库（如Milvus, Pinecone）用于语义检索，也可能是传统数据库用于精确查询。
- 大模型服务：提供核心的文本理解和生成能力。这里需要说明模型选型（例如，用ChatGLM3-6B作为基座，成本可控），以及是否需要进行领域微调。
- 工具模块：如果系统需要执行具体操作（如查询订单状态、创建工单），需要设计一套工具（Tools）和智能体（Agent）框架来调用。
编排与处理层：这是大脑。通常使用像LangChain这样的框架来编排整个流程：接收用户问题 -> 调用意图识别 -> 根据意图从知识库检索相关上下文 -> 构建包含上下文和指令的Prompt -> 调用大模型生成回答 -> 如果需要，驱动智能体调用工具 -> 格式化最终回复。
数据与反馈层：如何持续改进系统？
- 日志系统：记录所有的用户交互，包括输入、检索到的上下文、模型输出、用户反馈（如有）。
- 评估与再训练：定期用日志数据评估模型表现，筛选出bad cases，用于后续的模型微调或Prompt优化。

第三步：深入关键细节选择1-2个关键模块进行深入说明，展示你的技术深度。

如果强调知识检索：可以详细说明RAG流水线。如何对知识库文档进行分块（chunking）？分块大小和重叠度如何选择？使用什么嵌入模型（text-embedding-ada-002, BGE）？检索时是使用简单的向量相似度，还是结合了关键词检索的混合搜索？如何解决检索到的上下文可能不相关或信息冗余的问题？
如果强调复杂任务处理：可以详细说明智能体设计。如何定义工具？如何设计Agent的Prompt，使其能有效地规划、使用工具并处理错误？如何保证工具调用的安全性（例如，防止用户通过Prompt注入执行危险操作）？

第四步：讨论非功能性需求

性能与扩展性：如何应对流量高峰？模型服务是否可以水平扩展？缓存策略如何设计？
安全与合规：如何过滤模型生成的有害内容？如何保护用户隐私数据不被泄露给模型？如何满足数据驻留等合规要求？
成本控制：如何通过缓存、模型量化、异步处理等方式降低推理成本？

通过这样结构化的回答，你不仅能展示对AIGC技术的掌握，更能体现出一名工程师应有的系统思维和解决问题的方法论。

5. 面试准备策略与实战心得

5.1 如何高效使用AIGC-Interview-Book

有了这么好的资料库，怎么用才能效果最大化？我的建议是“主动学习，而非被动阅读”。

第一步：自我诊断，制定计划不要从头到尾通读。先快速浏览目录，对照前面提到的知识体系，给自己做一个评估。哪些领域是熟悉的？哪些是陌生的？哪些是知道概念但经不起深问的？根据你的目标岗位（是偏LLM算法，还是多模态应用，还是AI工程架构），确定学习的优先级和重点模块。

第二步：以题带学，深度挖掘针对每个目标模块，直接去看对应的面试题。不要先看答案，而是：

模拟面试：把问题念出来，假装对面坐着面试官，尝试口头回答。用手机录下自己的回答。
差距分析：回听录音，或对照答案，找出自己的不足：是概念表述不清？是原理理解有误？还是缺乏实例支撑？
主题式学习：针对这个不足，回到项目的理论部分，或者去阅读相关的经典论文、技术博客，进行主题式深度学习。例如，被问到“LoRA的原理”，你不仅要看懂公式，最好还能用PyTorch写一个简单的LoRA层，并思考：LoRA的秩r怎么选？初始化为什么用高斯分布和零矩阵？把它应用到BERT和应用到Stable Diffusion有什么不同？
输出巩固：学习完后，尝试用自己的语言，把这个知识点讲给一个“技术小白”听，或者写一篇简短的技术笔记。输出是检验学习效果的最好方式。

第三步：构建知识连接AIGC的知识不是孤立的点。当你学习RAG时，要联想到之前学的Embedding模型、向量数据库、Prompt工程。学习扩散模型时，要联想到VAE的潜空间、Transformer的注意力机制。尝试画一张自己的“AIGC知识图谱”，把不同模块之间的关系（如依赖、对比、演进）用线连起来。面试中很多高阶问题，考察的正是这种连接能力。

第四步：实战编码，保持手感项目中的代码题一定要动手写。不要只看。在本地环境或Google Colab上实际运行。遇到bug就去调试，这是最好的学习过程。除了项目里的题，建议去LeetCode或类似平台，有意识地刷一些与AI相关的题目，比如实现一个简单的Attention层、写一个训练循环、或者处理一个文本分类任务。保持编码手感在面试中至关重要。

5.2 面试现场应对技巧与心态

技术过硬是基础，但面试现场的发挥同样重要。

沟通与表达：

结构化回答：对于复杂问题，采用“总-分-总”结构。先说结论或核心观点，再分点阐述，最后总结。例如，“要降低大模型服务的推理延迟，主要有三个方向：模型层面、推理引擎层面和系统架构层面。首先，在模型层面...”
白板编码：写代码前，先和面试官确认函数签名、输入输出。边写边解释你的思路。写完后，主动走一个测试用例。保持代码整洁，有适当的注释。
不懂不装懂：遇到完全不懂的问题，坦诚地说“这个领域我了解不深”。但可以尝试基于已有知识进行推理：“我虽然没研究过XX技术，但根据我对同类技术YY的理解，我猜想它可能会...”。这展示了你的学习能力和思维活跃度。

项目经历阐述：这是展示你综合能力的最佳机会。使用STAR法则（情境、任务、行动、结果）来组织你的回答。

情境：简要说明项目背景和要解决的问题。
任务：你个人在其中承担的具体职责和目标。
行动：这是重点！详细说明你做了什么，以及为什么这么做。例如，“为了提升检索精度，我对比了BM25和向量检索，发现对于专业术语，BM25效果更好，而对于语义相似问题，向量检索更优。因此，我设计了一个混合检索器，并实现了动态权重调整...”。多讲技术决策背后的思考。
结果：用量化数据说明你的贡献（如“将回答准确率提升了15%”、“将P99延迟降低了200ms”）。

反向提问环节：当面试官问“你还有什么问题吗？”，这同样是一个展示你思考深度和求职诚意的机会。不要问那些在官网就能查到的问题（如公司福利）。可以问：

“团队目前面临的最大的技术挑战是什么？”
“如果我加入，您希望我在前三个月主要贡献在哪个方向？”
“团队的技术栈和协作流程是怎样的？”
“公司如何保证我们在快速跟进前沿技术的同时，又能扎实地打磨产品？”

准备AIGC面试是一场马拉松，不是冲刺。它需要你构建扎实的知识体系，积累真实的项目经验，并不断练习表达和沟通。AIGC-Interview-Book这样的开源项目是一个极好的路线图和题库，但真正的答案，需要你在学习和实践中自己去书写。保持好奇，持续动手，深入思考，你一定能在这个充满活力的领域找到自己的位置。