news 2026/5/1 8:28:51

大模型到底是啥?运维人分钟搞懂(不用数学)怂

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型到底是啥?运维人分钟搞懂(不用数学)怂

1. 流图:数据的河流

如果把传统的堆叠面积图想象成一块块整齐堆叠的积木,那么流图就像一条蜿蜒流淌的河流,河道的宽窄变化自然流畅,波峰波谷过渡平滑。

它特别适合展示多个类别数据随时间的变化趋势,尤其是当你想强调整体流动感和各部分的相对比例变化时。

流图的核心思想是将传统的堆叠面积图进行"平滑"处理。

在matplotlib中,我们可以使用fill_between函数结合样条插值来创建平滑的边缘。

关键在于将堆叠的数据进行累积,然后对累积边界进行平滑处理。

# 数据准备

x = np.linspace(0, 10, 100)

# 构造三组波浪数据

y1 = 2 + np.sin(x) # 基础波动

y2 = 2 + np.cos(x - 1.5) # 错位波动

y3 = 2 + np.sin(x + 2) # 再次错位

# 省略 ...

# 绘图设置

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 6))

# --- 左图:普通堆叠面积图 (baseline='zero') ---

ax1.stackplot(x, y_data, labels=labels, colors=colors, baseline='zero', alpha=0.8)

# 省略 ...

# --- 右图:流图 (baseline='sym') ---

# 'sym' 表示对称中心布局

ax2.stackplot(x, y_data, labels=labels, colors=colors, baseline='sym', alpha=0.8)

ax2.axhline(0, color='black', ls='--', alpha=0.1) # 画一条中心参考线

# 省略 ...

# 去除右图边框,增加流动感

for spine in ax2.spines.values():

spine.set_visible(False)

plt.tight_layout()

plt.show()

流图解决了一个视觉错觉问题:在普通堆叠面积图中,上面的数据层会因为下面数据层的起伏而被迫“扭曲”,很难看出它原本的形状。

流图通过中心布局,减少了这种扭曲,非常适合展示随时间变化的趋势和不同类别权重的波动,这种有机的形态还能给读者带来极强的审美愉悦感。

2. 地平线图:数据的群山

想象一下远处的地平线上有一排连绵的山脉,每座山的高度代表一个数据值。

地平线图就是这样一种可视化技术,它将时间序列数据压缩在一个很小的垂直空间内,通过颜色和分层来展示数据的变化。

特别适合在有限空间内展示多个时间序列的对比。

地平线图的核心思想是数据分层和颜色渐变。

它将数据值分成若干层(通常是2-3层),每层用一种颜色表示。当数据值超过一层时,就用更深的颜色或不同的颜色填充。这样可以在很小的垂直空间内展示很大的数据范围。

from datetime import timedelta

# 生成模拟数据:过去10年五大科技公司的股价波动

np.random.seed(42)

# 生成日期范围:过去10年,每月一个数据点

dates = pd.date_range("2013-01-01", "2023-01-01", freq="ME")

companies = ["苹果", "谷歌", "微软", "亚马逊", "Meta"]

# 生成各公司的股价模拟数据(标准化到相似范围)

data = {}

for company in companies:

# 基础趋势:每家公司有不同的增长趋势,但最终都在70-90范围内

# 省略 ...

# 转换为DataFrame

df = pd.DataFrame(data, index=dates)

# 创建对比图表

fig, axes = plt.subplots(2, 1, figsize=(14, 10))

# ============ 传统堆叠面积图 ============

colors = ["#FF6B6B", "#4ECDC4", "#45B7D1", "#FFD166", "#9B5DE5"]

# 为堆叠面积图重新归一化数据

df_normalized = df.div(df.sum(axis=1), axis=0) * 100

y_cumulative = np.zeros(len(df))

for i, company in enumerate(companies):

axes[0].fill_between(

df.index,

y_cumulative,

y_cumulative + df_normalized[company].values,

color=colors[i],

alpha=0.7,

label=company,

edgecolor="white",

linewidth=0.5,

)

y_cumulative += df_normalized[company].values

# 省略 ...

# ============ 地平线图:股价波动对比 ============

# 生成股价变化百分比数据(更能体现波动对比)

np.random.seed(42)

price_changes = {}

for company in companies:

# 生成均值附近波动的变化数据

# 省略 ...

# 关键参数:定义“波段”

BAND_HEIGHT = 3.0 # 每个颜色波段代表的变化率幅度 (%)

NUM_BANDS = 3 # 正负方向各使用的波段层数

df = pd.DataFrame(price_changes, index=dates)

# 为每家公司计算并绘制地平线

for i, company in enumerate(companies):

# 公司的基准Y轴位置(水平线)

# 省略 ...

# 分层与绘制:从第1层到第NUM_BANDS层

for band in range(NUM_BANDS):

# --- 处理正偏差(上涨)---

# 计算当前层的数据:偏差值减去已绘制层的高度,并限制在本层高度内

# 省略 ...

# --- 处理负偏差(下跌)---

# 对负值取绝对值,进行类似处理

# 省略 ...

# 美化图表

# 省略 ...

# 6. 添加图例

import matplotlib.patches as mpatches

legend_patches = []

# 省略 ...

plt.tight_layout(h_pad=5)

plt.show()

地平线图是空间利用大师。当你有 20 个股票或者 50 个城市的温度需要放在一张图里对比时,普通的面积图会挤成一团乱麻。

地平线图可以将每个序列压缩成一个窄窄的横条,但在保持视觉分辨率的同时,还能让你看清极值(通过深颜色)。

3. 总结

数据可视化不仅是科学,也是艺术。流图和地平线图这两种面积图变体,分别从"流动之美"和"空间效率"两个角度拓展了面积图的可能性。

它们证明了,通过对基础图表的创意改造,我们可以让数据讲述更丰富、更生动的故事。挠韵侍忻

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 7:17:35

把近万个源文件喂给AI之前,我先做了一件事牙

插件化架构 v3 版本最大的变化是引入了模块化插件系统。此前版本中集成在核心包里的原生功能,现在被拆分成独立的插件。 每个插件都是一个独立的 Composer 包,包含 Swift 和 Kotlin 代码、权限清单以及原生依赖。开发者只需安装实际用到的插件&#xff0…

作者头像 李华
网站建设 2026/4/13 6:56:05

BMP581高精度气压传感器Arduino驱动详解

1. 项目概述SparkFun BMP581 Arduino Library 是专为 Bosch 新一代高精度气压传感器 BMP581 设计的嵌入式驱动库,面向 Arduino 生态系统提供标准化、可移植、错误感知的硬件抽象层。该库并非简单封装寄存器读写,而是完整实现了 Bosch 官方 BMP5 系列传感…

作者头像 李华
网站建设 2026/5/1 7:24:52

代码规范与团队协作效率

代码规范与团队协作效率:提升开发质量的关键 在软件开发中,代码规范与团队协作效率是决定项目成败的重要因素。统一的代码规范能减少维护成本,提高可读性,而高效的团队协作则能加速交付周期,降低沟通成本。尤其在多人…

作者头像 李华
网站建设 2026/4/13 10:14:14

为什么有些开源项目把代码从JavaScript迁移到了TypeScript?

为什么有些开源项目把代码从JavaScript迁移到了TypeScript? 近年来,越来越多的开源项目开始将代码库从JavaScript迁移到TypeScript。这一趋势背后反映了开发者对代码质量、可维护性和开发效率的更高追求。TypeScript作为JavaScript的超集,不…

作者头像 李华
网站建设 2026/4/13 12:44:39

【AI原生研发链路追踪系统搭建实战指南】:20年架构师亲授5大核心组件选型、埋点规范与实时告警闭环设计

第一章:AI原生研发链路追踪系统的演进逻辑与核心价值 2026奇点智能技术大会(https://ml-summit.org) 传统分布式追踪系统(如Jaeger、Zipkin)面向微服务架构设计,其Span模型与采样策略难以刻画AI研发特有的多阶段异构性——从数据…

作者头像 李华
网站建设 2026/4/13 3:38:56

Arduino PROGMEM增强库:类型安全的Flash数据管理

1. 项目概述pgm_utils是一个专为 Arduino 平台设计的 PROGMEM 数据管理增强库,其核心目标是系统性地解决嵌入式开发中 Flash 存储资源利用效率低、API 使用繁琐、类型安全缺失等长期痛点。在资源受限的微控制器(如 ATmega328P、ESP32、STM32 等&#xff…

作者头像 李华