news 2026/6/14 18:59:07

智能运维的“地基革命”:数据治理如何支撑大模型智能体?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
智能运维的“地基革命”:数据治理如何支撑大模型智能体?

岁末回望智能运维领域,大模型智能体正重塑运维格局,智能运维建设从基于小模型统计分析算法的1.0时代进入基于大、小模型融合智能体驱动的2.0时代。

热潮之下,擎创科技始终保持清醒洞察:行业存在一个易被忽视的核心迷思—不少企业过度迷信智能体的技术爆发力,却轻视了运维数据治理这一支撑智能落地的“地基工程”。事实上,国内客户普遍面临运维数据质量偏低的困境—若地基不牢,再先进的智能体也如空中楼阁。

当前,不少企业将大模型智能体视为解决运维顽疾的“银弹”,却忽略了一个残酷现实:智能体的效果上限由提示词工程的有效性决定,而提示词工程的有效性归根到底还是由运维数据质量决定。

某银行曾引入故障诊断智能体,却因日志字段缺失、指标命名混乱,告警的描述字段信息不一致导致根因分析准确率不足60%,这印证了行业共识:80%的智能体失效源于数据问题。

目前国内运维数据普遍存在的三大短板不会由于大模型智能体的出现而消失:

1 碎片化:监控工具分散,数据标准不一(如同一服务在不同系统中命名各异)

2 弱关联:指标、日志、链路数据缺乏统一标识,难以以业务为视角跨层分析

3 低时效:部分业务系统数据采集延迟超5分钟,无法支撑实时决策

在金融行业目前兴起的全链路可观测场景中,这一问题尤为突出:

  • 单一工具及数据源失效:网络协议解包无法覆盖加密流量和云内通信,APM工具难以适配老旧系统以及业务负荷重且对插件造成性能影响非常敏感的系统,日志串联因为缺乏跨业务的全域流水号很难实现

  • 拼接式治理需求:实际落地往往需要融合网络流数据、应用探针、日志关键字,通过关联分析补全链路缺口

面对复杂现实,运维建设必须摒弃“求新求快”的浮躁心态,回归“运维数据治理先行,智能体渐进落地”的务实路径。擎创科技的实践表明,下一代运维数据平台需具备三大核心能力:

1 动态数据编织:从“被动采集”到“主动关联”

  • 实体自动识别:通过自然语言处理(NLP)解析配置文件,如自动发现K8s Pod与业务服务的映射关系

  • 跨源关联引擎:将网络报文数据(如BPM类工具的协议解包结果)与APM链路数据对齐,补全加密流量的调用链缺口,并与相关上下文日志、系统组件关系和监控状况关联

2 实时特征工厂:让脏数据“可用、好用”

  • 智能补全:基于历史模式预测缺失指标(如通过CPU负载推算内存使用率)

  • 语义化标签:将原始日志报错转化为“支付超时率”“账户余额扣减失败”等业务可读特征,将原始告警基于语义描述进行分类标签

3 渐进式可观测体系:从“技术视角”到“业务视角”

  • 拼接式拓扑构建:融合CMDB配置项及配置项的拓扑关系、调用链数据,生成动态依赖图

  • 业务影响分析:当数据库延迟上升时,自动关联至“订单创建失败率”等业务指标

某省级城市商业银行业务全链路监控曾面临典型的数据困局:200+系统产生10万+指标,但命名混乱、关联缺失,我们通过三步实现破局:

1 数据治理攻坚:

利用动态实体识别,自动清洗并关联70%的脏数据,构建统一服务目录

2 拼接式可观测:

融合网络流数据(BPM)解决断流关联问题、应用交易日志明细(解决单笔交易追踪问题)、APM探针(解决深层调用性能诊断问题),补全了单一工具造成的全链路追踪缺口

3 智能体渐进落地:

先部署“容量预测智能体”(基于清洗后指标),再引入“故障诊断智能体”(并与处理单一源数据的专业智能体比如异常检测智能体和日志分析智能体协作),最终将MTTR从38分钟降至5分钟

大模型智能体是未来,但未来始于足下,当行业纷纷追逐技术热点、竞逐智能运维 2.0 赛道时,擎创科技始终坚守核心认知:没有高质量的运维数据,就没有真正可落地、可创造价值的智能运维 2.0

未来擎创科技愿与各位同仁携手,以务实创新的精神,筑牢数据治理根基,共同迎接智能运维的“地基革命”,让每一份运维数据都转化为企业数智化转型的坚实动力。


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 0:52:17

Jmeter 快速生成测试报告,学会领导主动给你加薪

我们使用Jmeter工具进行接口测试或性能测试后一般是通过察看结果数、聚合报告等监听器来查看响应结果。如果要跟领导汇报测试结果,无法直接通过监听器的结果来进行展示和汇报,因为太low了,因此测试完成后去整理一个数据齐全且美观的报告是非常…

作者头像 李华
网站建设 2026/6/12 10:14:33

第一章CentOS安装和卸载httpd

1,挂载光盘 mount /dev/cdrom /mnt2,切换到软件包目录 cd /mnt/Packages3,安装httpd rpm -ivh mailcap-2.1.41-2.el7.noarch.rpm httpd-tools-2.4.6-95.el7.centos.x86_64.rpm httpd-2.4.6-95.el7.centos.x86_64.rpm4,启动httpd s…

作者头像 李华
网站建设 2026/6/14 8:27:11

2025计算机就业真相:传统开发饱和,计算机专业就业困境?

计算机专业就业困境?收藏这篇,网络安全等方向让你脱颖而出 计算机专业就业市场呈现结构性变化,传统岗位竞争激烈,而人工智能、云计算、数据科学和网络安全等新兴领域人才稀缺。文章详细介绍了四个具有良好前景的职业路径&#xf…

作者头像 李华
网站建设 2026/6/14 13:32:17

Wan2.2-T2V-A14B在交通安全宣传视频中的事故规避演示

Wan2.2-T2V-A14B在交通安全宣传视频中的事故规避演示 你有没有想过,一条“下雨天司机紧急避让突然冲出的小孩”的安全提醒,下一秒就能变成一段逼真的8秒短视频?不是动画,不是实拍,而是由AI直接从文字生成的高清动态影像…

作者头像 李华
网站建设 2026/6/15 13:09:29

ffmpeg视频分辨率转换

9:16 视频在 16:9 画布上播放的命令ffmpeg -i 003.mp4 -vf "scale-1:720,pad1280:720:(1280-iw)/2:0,setsar1" -c:v libx264 -preset fast -crf 28 -an 011.mp49:16视频 在 1:1 画布上播放的命令ffmpeg -i 003.mp4 -vf "scale-1:720,pad720:720:(720-iw)/2:0,se…

作者头像 李华
网站建设 2026/6/10 19:02:57

如何在5分钟内完成量子程序调试?VSCode + Azure QDK高效实践

第一章:量子程序调试的挑战与现状 量子计算正处于从理论研究向工程实现过渡的关键阶段,而量子程序的调试成为制约其广泛应用的核心难题之一。由于量子态的叠加性、纠缠性和测量坍缩特性,传统基于断点和日志的调试手段在量子环境中失效&#x…

作者头像 李华