线性函数实战指南：从水电账单到编程索引的5个真实应用-编程实验室

1. 这不是数学课本里的定义，而是你每天都在用的“直来直去”逻辑

“线性函数”这四个字一出来，很多人脑子里立刻浮现出黑板上歪歪扭扭的 y = 2x + 1，或者老师念得飞快的“一次函数、图像为直线、斜率截距……”，然后迅速关掉页面——不是不想学，是真不知道它和自己有什么关系。我带过上百个从零开始学数据分析、自动化脚本、甚至做小生意记账的学员，90%的人第一次听到“线性”两个字，第一反应是“这玩意儿我这辈子都用不上”。直到某天，他发现Excel里那个“趋势线”选项默认勾选的就是“线性”，直到他手动调低手机屏幕亮度时，滑块每挪1格，亮度值就稳定下降5%，直到他给自家小店算水电费：基础费35元 + 每度电0.62元 × 实际用量——这三个场景，没有一个写了 y = kx + b，但每一个都是线性函数在真实世界里稳稳落地的脚印。

线性函数的本质，根本不是公式，而是一种可预测的、等比例的、不拐弯的响应关系。它描述的是：当输入（比如用电量、时间、广告投放金额）变化一个固定单位时，输出（比如电费、路程、销售额）就跟着变化一个完全确定、绝不打折、从不跳变的固定量。这种关系之所以重要，是因为它是人类理解世界最底层的“锚点”——我们默认事物该这么运行：多干1小时活，就该多拿1小时工资；多加1勺糖，甜度就该匀速上升；车速表显示60km/h，那1分钟内它就该跑完1公里。一旦现实偏离了这个“直来直去”的预期，我们才会警觉：为什么流量涨了三倍，订单只多了10%？为什么客服人力翻倍，投诉反而更多？这时候，线性函数就成了你的第一把尺子——先画出“理想直线”，再看实际数据落在哪儿，偏差本身，就是最有价值的信息。

这篇文章不讲证明、不推导极限、不碰矩阵变换。它只聚焦一件事：让你亲手拆开5个真实到能摸到温度的案例，看清线性函数长什么样、怎么认、怎么算、怎么防坑，以及——最关键的是，什么时候它其实是个“假朋友”，正在悄悄误导你的判断。无论你是刚接触函数的中学生，想搞懂报表里那个“线性拟合R²=0.98”到底意味着什么的运营新人，还是需要给客户解释“为什么报价单上写着‘单价×数量+基础服务费’”的技术顾问，这篇内容都给你留好了位置。它不假设你记得斜率公式，但假设你愿意花15分钟，亲手算一遍自己家上个月的网费账单——那张账单，就是最好的教具。

2. 线性函数的骨架：为什么必须是 y = kx + b？少一个字母都不行

2.1 “y = kx + b”不是发明，是观察世界的必然结果

很多人以为 y = kx + b 是数学家拍脑袋定下的规矩。其实恰恰相反，这个形式是人类在反复丈量现实后，被迫总结出来的最简表达。我们来还原一下这个过程：假设你在帮邻居设计一个简易雨水收集系统，桶底有个小孔，水会慢慢漏下去。你记录了不同时间点的水位高度：

时间 x（分钟）	0	2	4	6	8
水位 y（厘米）	50	46	42	38	34

你一眼就能看出规律：每过2分钟，水位降4厘米；换算成单位时间，就是每分钟降2厘米。这个“每分钟降2厘米”就是变化的速率，也就是k。它回答了核心问题：“输入（时间）每增加1个单位，输出（水位）会怎样变化？”——这里，k = -2（负号表示下降）。现在，如果时间 x = 0，水位是多少？表格里明确写着50厘米。这个“起点值”，就是b。它回答了另一个关键问题：“当输入为0时，输出的基准状态是什么？”——没有这个 b，你就无法定位整条线在坐标系里的“落脚点”。所以，k 和 b 各司其职：k 握着变化的“方向盘”，决定线往哪斜、斜多陡；b 握着“定位仪”，决定线从哪儿出发。缺了 k，所有点都堆在一条水平线上，毫无变化；缺了 b，所有线都挤在原点，失去现实意义。这就是为什么，任何试图描述“等比例变化+固定起点”的关系，最终都逃不开 y = kx + b 这个骨架——它不是数学的任性，而是现实的语法。

2.2 k 的三种面孔：斜率、单价、效率，本质都是“单位代价”

k 值，这个看似冰冷的字母，在不同场景下披着完全不同的外衣，但内核始终如一：它量化了“投入1单位，换来多少产出”的确定性比率。我们拆开三个高频场景：

生活场景（打车费）：某平台起步价13元（含3公里），之后每公里2.5元。这里，x 是“超出3公里的部分”，k = 2.5。它意味着：你多走1公里，车费就铁定多掏2.5元，不多不少。这个 k 是平台写进合同的“单位距离成本”。
工作场景（外包开发）：开发一个小程序，基础功能包价8000元，每增加一个定制模块，加收1200元。x 是“模块数量”，k = 1200。它代表：客户每多提1个需求，供应商的成本就可精确预估增加1200元。这个 k 是团队基于历史项目沉淀下来的“单位功能开发成本”。
物理场景（匀速运动）：一辆自行车以恒定速度15km/h行驶。x 是“行驶时间（小时）”，y 是“路程（公里）”。k = 15。它宣告：时间每推进1小时，路程就必然延伸15公里。这个 k 是物理定律赋予的“单位时间位移”。

看到没？无论是钱、时间还是空间，k 的本质从未改变：它是一个可被测量、可被承诺、可被预算的确定性转换因子。它的威力在于“可预测”——只要 k 稳定，你就能在行动前，精准算出结果。这也是为什么商业合同、工程报价、物理定律，都极度依赖线性关系：因为只有这样，风险才可控，承诺才可信。

2.3 b 的隐藏身份：门槛、沉没成本、安全余量，它让线性不“从零开始”

如果说 k 是线性函数的“引擎”，那么 b 就是它的“底盘”。b 常被简单称为“截距”或“常数项”，但这太轻飘了。b 承载着现实中那些无法被“按比例”稀释的硬性存在：

门槛成本（开店）：你想开一家奶茶店，加盟费5万元，首批原料设备3万元，合计8万元。之后，每卖出一杯奶茶，净利润约8元。这里，x 是“销售杯数”，k = 8，b = 80000。b = 80000 意味着：你卖了0杯，也已经亏了8万。这个 b 是你踏入这个行业的强制入场券，它决定了盈亏平衡点（x = -b/k = 10000杯）——没卖够1万杯，所有努力都在填这个坑。
安全余量（电池续航）：你的笔记本电脑标称续航8小时。实测发现，从100%电量开始，每使用1小时，电量下降约12.5%。但有趣的是，当电量降到15%时，系统会强制休眠。这意味着，真正可用的“线性放电区间”是从100%到15%，共85%的电量。如果我们把“剩余可用时间”设为 y，“已使用时间”设为 x，那么 y = -12.5x + 100 这个公式，只在 y ≥ 15 时成立。这里的 b = 100 不是虚的，它是厂商设定的安全冗余底线，防止你用到关机那一刻。
基础服务（云服务器）：某云服务商提供套餐：月付120元，包含1核CPU、2GB内存、100GB存储。超出部分，CPU每核每月加收80元。这里，x 是“额外CPU核数”，k = 80，但 b = 120。这个 b 是你获得基础服务能力的最低付费门槛，它确保了即使你什么都不加，也能跑起一个最小可用的服务。

b 的存在，彻底打破了“从零开始”的幻想。它提醒我们：世界很少有真正的“白纸”。每一次启动，背后都站着看不见的初始投入、安全边界或基础配置。忽略 b，是初学者最大的陷阱——他们只盯着 k（单价/效率），却忘了自己还没跨过那个 b（门槛/成本）。

3. 五种真实世界中的线性函数：从账单到算法，手把手拆解

3.1 场景一：家庭水电费账单——最朴素的线性验证

这是每个人每月必见的“线性函数实战报告”。我们以某市居民生活用电为例（2024年阶梯电价政策）：

第一档（0-260度）：0.52元/度
第二档（261-600度）：0.57元/度
第三档（600度以上）：0.82元/度

提示：注意！整个计费规则不是一个单一的线性函数，而是由三个分段线性函数拼接而成。但每一档内部，绝对是完美的 y = kx + b 形式。

我们聚焦第一档（0-260度）：假设你家本月用了200度电。计算过程如下：

k = 0.52（每度电的单价，即变化率）
b = 0（因为第一档没有基础费，用0度电，费用就是0元）
x = 200（用电量）
y = 0.52 × 200 + 0 = 104 元

实操验证技巧：别急着套公式。拿出你上个月的账单，找到“总电量”和“总电费”两项。用计算器算一下：总电费 ÷ 总电量 = ? 如果结果非常接近0.52（比如104÷200=0.52），恭喜，你成功验证了第一档的线性关系。如果结果是0.55，别慌——立刻检查：你家上月用电是不是超过了260度？如果是，那你的平均单价已经被第二档的高价“拉高”了，这恰恰证明了分段线性的存在。线性函数的第一个价值，就是帮你诊断：我的实际使用，落在了哪个“价格区间”里？

3.2 场景二：手机电池电量百分比——被精心设计的线性映射

你有没有发现，手机从100%掉到90%，似乎比从20%掉到10%慢得多？这不是错觉，而是工程师对线性函数的一次精妙“伪装”。现代锂电池的实际电压-电量关系是非线性的（电压下降先缓后急），但用户需要的是直观、可预期的“百分比”。解决方案就是：用一个线性函数，去“拟合”一段最平稳的电压区间。

以某旗舰机为例，其电池管理系统（BMS）采集到的核心数据是电压（V）。实测发现，在3.7V到3.9V这个区间，电压随电量变化最接近线性。于是，工程师设定：

当电压 V = 3.9V 时，上报电量 y = 100%
当电压 V = 3.7V 时，上报电量 y = 0%

这就构成了一个关于电压 V 的线性函数：y = k × V + b。代入两点求解：

100 = k × 3.9 + b
0 = k × 3.7 + b
两式相减：100 = k × (3.9 - 3.7) = k × 0.2 → k = 500
代入得：0 = 500 × 3.7 + b → b = -1850
所以最终映射公式为：y = 500V - 1850

为什么这么做？因为3.7V-3.9V是电池最“健康”、最稳定的放电平台。在这个区间用线性映射，用户看到的电量下降速度最均匀，心理预期最稳定。而低于3.7V或高于3.9V的部分，则由BMS用查表法（非线性）精细管理，确保安全。你看不见背后的复杂，只感受到“电量掉得挺匀”，这正是线性函数作为“用户界面”的强大之处——它把复杂的物理世界，翻译成人类大脑最容易处理的“直来直去”语言。

3.3 场景三：Excel趋势线预测——当数据“看起来很线性”时

销售经理小王拿到一份季度数据：1月销量120台，2月135台，3月148台，4月162台，5月175台。他在Excel里选中数据，右键“添加趋势线”，勾选“线性”，并显示公式和R²值。图表上立刻出现一条漂亮的直线，公式显示 y = 13.4x + 106.6，R² = 0.998。

注意：R²（决定系数）越接近1，说明数据点越紧密地围绕在这条直线上，线性拟合效果越好。R²=0.998，意味着99.8%的数据波动，都能被这条直线解释。

但小王没停在这里。他拿起笔，用公式算了一下6月预测值：y = 13.4 × 6 + 106.6 = 187台。然后，他做了件关键的事——他把原始数据点（x, y）代入公式，计算每个点的“预测误差”：

月份 x	实际销量 y	预测销量 y'	误差 (y - y')
1	120	120.0	0.0
2	135	133.4	+1.6
3	148	146.8	+1.2
4	162	160.2	+1.8
5	175	173.6	+1.4

误差全部在±2台以内，且无明显正负交替模式（即不是系统性高估或低估），这说明线性模型不仅“看起来好”，而且预测偏差小、稳定可靠。小王心里有底了：6月备货187台，是个合理起点。线性函数在此处的价值，不是宣称“未来一定如此”，而是提供一个基于历史、偏差可控、便于沟通的“共识基线”。它让销售、生产、采购部门能在同一个数字上展开讨论，而不是各说各话。

3.4 场景四：编程中的数组索引计算——计算机底层的线性心跳

当你在Python里写my_list[5]，或者在C语言里写arr[3]，你以为只是“取第几个元素”？背后是一场精密的线性运算。计算机内存是线性的字节流，一个数组的所有元素，必须被“摊开”放在连续的内存地址上。假设my_list的首地址（即my_list[0]的地址）是 1000，每个元素占4个字节（比如一个32位整数），那么：

my_list[0]的地址 = 1000 + 0 × 4 = 1000
my_list[1]的地址 = 1000 + 1 × 4 = 1004
my_list[2]的地址 = 1000 + 2 × 4 = 1008
...
my_list[n]的地址 = 1000 + n × 4

这不就是标准的 y = kx + b 吗？其中：

y 是目标元素的内存地址（输出）
x 是索引号（输入）
k = 4（每个元素的字节大小，即“步长”）
b = 1000（数组的起始地址，即“基址”）

为什么这个线性关系至关重要？因为它让“随机访问”成为可能。CPU不需要从头遍历，只要拿到索引 x，一个乘法加法（1000 + 4*x），瞬间就能算出地址，直接读取。如果这个关系是非线性的（比如地址跳跃无规律），那每次取数都要搜索，数组将失去其核心优势。所以，线性函数在这里，是支撑现代编程效率的隐形脊梁——它把抽象的“第n个”概念，稳稳地锚定在物理世界的“第n×4个字节”上。

3.5 场景五：健身计划中的热量缺口——用线性思维规划长期目标

健身教练给学员制定减脂计划：目标是12周减重6公斤。根据生理学，减重1公斤脂肪，理论上需要制造约7700千卡的热量缺口。所以总缺口 = 6 × 7700 = 46200 千卡。平均到12周，每周缺口 = 46200 ÷ 12 = 3850 千卡。

这个“每周3850千卡”就是一个典型的线性目标分解。它隐含的函数是：
累计缺口 y（千卡） = 3850 × 周数 x

x = 1 周，y = 3850
x = 2 周，y = 7700
...
x = 12 周，y = 46200

但这里埋着一个巨大的认知陷阱：人体代谢会适应。线性函数假设“每周制造3850千卡缺口，体重就匀速下降0.5公斤”。然而现实是，随着体重下降，基础代谢率（BMR）也会降低，维持同样活动所需的热量减少。这意味着，到了第8周，同样的饮食和运动，产生的实际缺口可能只有3200千卡，导致体重下降变慢。

如何应对？教练的实操经验是：用线性函数做“路标”，但用动态调整做“方向盘”。前4周严格按3850执行；第4周末评估：如果体重下降达标（2公斤），继续；如果只降了1.5公斤，就微调下周缺口目标（比如提高到4000千卡），并重新计算后续路径。线性函数提供了清晰的起点和衡量尺度，而承认其局限性，并主动修正，才是专业实践的精髓。它不是真理，而是你手中最趁手的“第一把尺子”。

4. 线性函数的四大认知陷阱与避坑指南：为什么它有时是个“温柔的谎言”

4.1 陷阱一：混淆“相关”与“因果”——那条漂亮的直线，可能只是巧合

这是数据领域最高频、杀伤力最强的误区。你画出散点图，添加线性趋势线，R²高达0.95，然后自信满满地宣布：“A增长，B就增长，所以A导致B！” —— 错了，大错特错。

经典反例：冰淇淋销量 vs 溺水事故数量。数据显示，夏季冰淇淋销量飙升的同时，溺水事故数量也大幅上升，两者线性相关性极强（R² > 0.9）。难道吃冰淇淋会导致溺水？显然不是。真相是：高温天气（C）这个第三变量，同时导致了人们更爱吃冰淇淋（A），也导致了更多人去游泳（从而增加了溺水风险B）。A 和 B 之间，没有直接因果链，只有共同的驱动者 C。

避坑指南：

永远追问“第三个变量”：当你发现两个变量线性相关时，立刻停下来，问自己：“有没有一个我没看见的、更底层的因素，同时影响着它们？”
做控制实验：如果条件允许，尝试固定其他变量。比如，在同一泳池，控制水温、救生员数量，只改变冰淇淋供应量，看溺水率是否变化。
引入统计检验：学习使用偏相关系数（Partial Correlation），它能帮你剔除第三个变量的影响，单独看A和B的关系。

记住：线性相关性（r 或 R²）只描述“变化方向和紧密程度”，它不携带任何因果信息。把它当作一个“信号灯”，提示你“这里可能有故事”，而不是“故事的结局”。

4.2 陷阱二：外推失灵——把“过去很准”当成“未来一定准”

线性函数最诱人的地方，是它能轻松外推。昨天涨了10块，今天涨了10块，那明天是不是也涨10块？很多投资新手就是这么栽跟头的。线性外推，本质上是在假设“驱动变化的k值永恒不变”。但现实世界里，k 是会变的。

真实案例：某电商App的DAU（日活跃用户）增长。上半年，通过持续优化首页推荐算法，DAU呈现惊人线性增长：每周净增5000人（k = 5000）。运营团队信心爆棚，按此线性外推，Q3末DAU将突破200万。结果，7月中旬上线新版本后，DAU增长骤然放缓，8月甚至出现小幅下滑。

根因分析：上半年的 k = 5000，是建立在“算法优化红利”和“市场空白期”的双重基础上的。当红利释放完毕（用户对新功能的新鲜感消退），且竞品也跟进类似优化（市场趋于饱和），k 值自然衰减。线性模型没有内置“衰减机制”，它只会忠实地画出那条无限延伸的直线。

避坑指南：

设定“有效外推窗口”：对于任何线性模型，明确告诉自己：“这个k值，我只敢相信它在未来N个周期内有效。” N 的大小，取决于你对驱动因素稳定性的判断。对于技术迭代快的领域（如互联网），N 可能只有2-4周；对于基础设施建设（如电网负荷），N 可能长达数月。
监控k值漂移：每周计算一次实际增长率，与模型预测的k值对比。如果连续2周实际k < 预测k的90%，就要启动模型复审。
准备“断点预案”：在你的线性计划里，主动标注几个关键节点（如“用户规模达100万时”、“上线满3个月时”），在这些节点，强制暂停，重新评估驱动因素是否依然稳固。

线性函数是优秀的“短期导航仪”，但绝不是“长期航海图”。把它用在刀刃上，而非刀背上。

4.3 陷阱三：忽略“b”的动态性——那个“起点”，可能正在悄悄移动

我们习惯把 b 当作一个静止的常数：“基础费35元”、“起始电量100%”。但现实中，b 本身也可能随时间、环境或策略而漂移。忽略这一点，会让整个线性框架崩塌。

案例：SaaS软件的客户留存率。某CRM软件，历史数据显示，新注册客户在首月的平均留存率为75%（即 b = 75%）。销售团队据此制定目标：每获取100个新用户，首月能留下75个。这看起来很线性。但今年Q2，公司上线了全新的新手引导流程，并增加了24小时在线客服。结果，新注册用户的首月留存率跃升至88%。此时，旧的 b = 75% 已失效，新的 b = 88% 成为基准。

更隐蔽的案例：个人学习效率。你给自己定目标：“每天学英语1小时，30天后词汇量提升1000个”。这里，b 是“当前词汇量”，k 是“每小时提升量”。但如果你在第10天，掌握了更高效的记忆方法（如间隔重复），那么从第11天起，你的 k 值会显著提升。而如果你坚持用旧的 k 值计算，就会低估自己的进步，甚至产生挫败感。

避坑指南：

定期校准b：对于任何涉及“起点状态”的线性模型（如库存、资金、技能水平），建立固定的校准周期（如每周盘点库存、每月测评技能）。不要假设“b”一成不变。
区分“固有b”与“策略b”：有些 b 是物理/法律限制（如合同约定的基础服务费），很难变；有些 b 是策略选择的结果（如新手引导流程、学习方法）。后者，正是你可以主动优化、从而提升整体效能的关键杠杆。
在模型中标注b的来源：在你的Excel表格或笔记里，不要只写“b=75%”，而要注明“b=75%（2024年Q1历史均值，基于旧版引导流程）”。这样，当新数据进来时，你一眼就能识别出差异的根源。

b 不是锚点，而是航标。风向变了，航标的位置，也该随之调整。

4.4 陷阱四：强行线性化——当世界本就弯曲，你还硬要拉直它

这是最危险的陷阱：面对明显非线性的数据，为了图省事或迎合某种偏好，强行用一条直线去拟合，还美其名曰“简化”。结果，模型看起来“整洁”，却彻底失去了指导意义。

典型场景：网站访问量（PV）与服务器响应时间（RT）。直观感觉，PV越多，RT应该越长。但真实关系是：在服务器负载较低时（PV < 1000/秒），RT几乎恒定在100ms；当PV超过1000/秒，RT开始缓慢上升；一旦PV突破2000/秒，RT会呈指数级飙升，系统濒临崩溃。这是一个典型的“S型”或“指数型”曲线。

强行线性化的灾难：如果你用线性回归，得到 y = 0.05x + 80（y=RT, x=PV），那么当PV=5000时，模型预测 RT = 330ms。而真实情况可能是 RT > 5000ms，服务已不可用。这个线性模型，不仅没预警风险，反而给出了虚假的安全感。

避坑指南：

先画图，再建模：拿到数据，第一件事不是打开Excel拟合，而是用散点图（Scatter Plot）把x和y的关系直观画出来。眼睛是最快的非线性检测器。如果点的分布明显弯曲、聚集、或有平台区，立刻放弃线性。
学习基础非线性模型：掌握2-3个常用替代方案：
- 对数模型（y = a + b·ln(x)）：适用于“增长速度逐渐放缓”的场景（如用户增长后期）。
- 幂律模型（y = a·x^b）：适用于“规模效应”明显的场景（如城市GDP与人口的关系）。
- 分段线性（Piecewise Linear）：如前面提到的阶梯电价，用多条直线拼接，比一条直线更能刻画复杂现实。
拥抱“模型诊断”：拟合完线性模型后，务必画出“残差图”（Residual Plot）：横轴是x，纵轴是“实际y - 预测y”。如果残差点随机、均匀地分布在0线附近，说明线性假设合理；如果残差点呈现出明显的抛物线、U型或漏斗型分布，那就是世界在对你喊话：“嘿，我可不是直的！”

尊重数据的本来面目，比追求模型的简洁性重要一万倍。有时候，承认“我不知道确切公式”，远比硬塞一个错误的线性答案更专业。

5. 从理解到应用：一份可立即上手的线性函数自查清单

5.1 识别阶段：三步快速判定“它是不是线性？”

当你面对一个新问题、一份新数据、或一个新报价单时，用下面这个极简流程，30秒内完成初步判定：

找“变化率”：问自己：“输入（x）每增加1个单位，输出（y）的变化量，是不是一个固定的数？”
- ✅ 是：比如“每多雇1个客服，月成本固定增加8000元”。→进入下一步
- ❌ 否：比如“每多卖1台手机，返点比例从5%升到6%”，变化率在变。→大概率非线性，停止线性分析
找“起点”：问自己：“当输入（x）为0时，输出（y）是不是一个确定的、非零的值？”
- ✅ 是：比如“没卖一台手机，也有5000元基础运营费”。→符合 y = kx + b 结构
- ❌ 否：比如“不进货，库存就是0”，b=0。→仍可能是线性（y = kx），只是过原点
画个草图：在纸上快速标出2-3个已知点（x, y），连成线。
- ✅ 直线：点与点之间连线是直的，没有明显弯曲。→高度疑似线性
- ❌ 曲线：点连起来是弧线、折线或散乱。→非线性，需换模型

这个清单不是为了给你一个“是/否”的终极答案，而是帮你建立一种肌肉记忆：看到关系，先本能地去抓“k”和“b”这两个锚点。抓住了，你就拥有了拆解它的第一把钥匙。

5.2 构建阶段：手算k和b的两种可靠方法（不用Excel）

虽然Excel的SLOPE和INTERCEPT函数很方便，但亲手算一遍，才能真正吃透。这里提供两种接地气的方法，适合任何一张草稿纸：

方法一：两点法（最常用，适合有明确起点和变化点）
你需要两个可靠的（x, y）数据对。例如，某快递公司报价：寄1公斤收费12元，寄3公斤收费22元。

步骤1：计算k（斜率/单价）
k = (y₂ - y₁) / (x₂ - x₁) = (22 - 12) / (3 - 1) = 10 / 2 =5 元/公斤
步骤2：代入任一点，求b（基础费）
用 (x₁, y₁) = (1, 12)：12 = 5 × 1 + b → b =7 元
结论：报价公式为y = 5x + 7。验证：寄3公斤，y = 5×3 + 7 = 22，吻合。

方法二：平均值法（适合有多组数据，想求最佳拟合线）
你有5天的销售数据：(1, 120), (2, 135), (3, 148), (4, 162), (5, 175)。

步骤1：计算x和y的平均值
x̄ = (1+2+3+4+5)/5 = 3
ȳ = (120+135+148+162+175)/5 = 740/5 =148
步骤2：计算k（公式推导自最小二乘法，但计算很简单）
k = Σ[(xᵢ - x̄)(yᵢ - ȳ)] / Σ[(xᵢ - x̄)²]
分子：(1-3)(120-148) + (2-3)(135-148) + (3-3)(148-148) + (4-3)(162-148) + (5-3)(175-148)
= (-2)(-28) + (-1)(-13) + 0 + (1)(14) + (2)(27) = 56 + 13 + 0 + 14 + 54 =137
分母：(-2)² + (-1)² + 0² + 1² + 2² = 4 + 1 + 0 + 1 + 4 =10
k = 137 / 10 =13.7
步骤3：求b
b = ȳ - k·x̄ = 148 - 13.7 × 3 = 148 - 41.1 =106.9
结论：最佳拟合线为y = 13.7x + 106.9，与Excel结果（13.4x + 106.6）非常接近。手工计算的意义，在于让你看清每个数字的来龙去脉，而不是盲目信任软件。