news 2026/6/15 19:52:40

9.4 优雅发布:Pod 资源原地更新原理与生产实践

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
9.4 优雅发布:Pod 资源原地更新原理与生产实践

9.4 优雅发布:Pod 资源原地更新原理与生产实践

1. 引言:传统更新的痛点

在 Kubernetes 中,更新 Pod 的资源配额(如 CPU、Memory)通常需要:

  1. 修改 Deployment 的resources
  2. 删除旧 Pod
  3. 创建新 Pod
  4. 新 Pod 通过 Readiness Probe 后接收流量

这个过程叫Recreate(重建)

问题

  • 服务中断:删除 Pod 到新 Pod 就绪之间有间隙
  • 数据丢失:如果 Pod 有本地状态,会丢失
  • 启动慢:新 Pod 需要重新初始化(如连接池、缓存)

解决方案原地更新(In-Place Update)


2. 原地更新的原理

2.1 什么是原地更新?

原地更新是指:在不删除 Pod 的情况下,直接修改 Pod 的资源配额

传统方式

Pod A (CPU: 500m) -> 删除 -> Pod B (CPU: 1000m)

原地更新

Pod A (CPU: 500m) -> 直接修改 -> Pod A (CPU: 1000m)

2.2 技术实现

Kubernetes 1.27+ 支持Pod 原地更新,通过kubectl patch或更新 Deployment 的resources,Kubelet 会:

  1. 更新 Cgroup 的资源限制
  2. 不重启容器
  3. 不中断服务

3. 实战:原地更新资源配额

3.1 初始状态

apiVersion:apps/v1kind:Deploymentmetadata:
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 14:55:37

verl分块预填充功能实测,加速长文本生成

verl分块预填充功能实测,加速长文本生成 在大语言模型强化学习训练中,长文本生成的延迟和吞吐瓶颈长期困扰着生产部署。尤其在PPO等算法的rollout阶段,模型需高频次、大批量地生成数百甚至上千token的响应序列,传统单次全量prefi…

作者头像 李华
网站建设 2026/6/15 16:33:33

如何让AI接管手机?Open-AutoGLM自然语言指令部署教程

如何让AI接管手机?Open-AutoGLM自然语言指令部署教程 你有没有想过,以后不用自己点屏幕,只要说一句“帮我订一杯瑞幸的冰美式”,手机就自动打开App、选门店、加冰、下单付款?这不是科幻电影,而是正在发生的…

作者头像 李华
网站建设 2026/6/15 14:17:56

Qwen2.5-0.5B模型精简原理:0.5B参数的训练奥秘

Qwen2.5-0.5B模型精简原理:0.5B参数的训练奥秘 1. 小模型也有大智慧:为什么0.5B参数能撑起一场对话? 你可能已经习惯了动辄几十亿、上百亿参数的大模型时代——动用多张GPU,推理延迟以秒计,部署成本居高不下。但今天…

作者头像 李华
网站建设 2026/6/15 14:13:24

5分钟上手YOLOv9官方镜像,目标检测训练与推理一键搞定

5分钟上手YOLOv9官方镜像,目标检测训练与推理一键搞定 你是不是也经历过这样的场景:为了跑一个目标检测模型,花半天时间配环境、装依赖、解决版本冲突,结果还没开始训练就已精疲力尽?更别提遇到CUDA不兼容、PyTorch报…

作者头像 李华
网站建设 2026/6/15 10:48:43

All-in-One架构挑战:Qwen多任务干扰问题解决方案

All-in-One架构挑战:Qwen多任务干扰问题解决方案 1. 什么是真正的“All-in-One”?不是堆模型,而是让一个模型“分身有术” 你有没有试过同时打开三个AI工具:一个查情感倾向,一个写周报,一个改文案&#x…

作者头像 李华
网站建设 2026/6/15 12:21:09

简单三步完成Qwen3-Embedding-0.6B部署并验证结果

简单三步完成Qwen3-Embedding-0.6B部署并验证结果 1. 快速了解Qwen3-Embedding-0.6B的核心能力 你是不是也在找一个既能高效运行,又具备强大语义理解能力的文本嵌入模型?如果你的答案是“是”,那 Qwen3-Embedding-0.6B 很可能就是你现在需要…

作者头像 李华