news 2026/5/1 9:13:44

2026年非结构化数据管理五大预测

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
2026年非结构化数据管理五大预测

各行业的企业正在存储比以往更多的数据。超过5拍字节(PB)已成为新常态,超过10 PB也越来越普遍。2026年非结构化数据管理的主题是"更多":更多数据、更多投资、更多痛点以及更多AI安全和风险担忧。非结构化数据的增长源于AI采用的加速、数字排放的激增以及富媒体和传感器数据的大量增加。然而,更多的数据也意味着更多潜在机遇,前提是企业能够高效地识别、过滤和分类数据以用于正确的应用场景,同时降低AI带来的风险。明年,我们预测随着AI推理应用的增长,组织将认识到非结构化数据管理在AI投资回报率中所扮演的关键角色。

以下是我们预见的未来一年五大主要趋势:

失控的数据增长为巨变创造完美风暴

今年,企业中的非结构化数据增长已达到临界点。根据Komprise 2026年非结构化数据管理状况报告,大多数企业存储超过5 PB的数据,40%的企业存储超过10 PB。使用5到10年前的方法管理这些数据已不再可行,因为管理和保护数据的成本高昂,而且AI数据准备、管理和审计的新需求不断涌现且难以预测。能够让IT基础设施和运营团队在存储和备份孤岛之间查看、理解、清理、过滤、分类和移动数据的能力,将成为管理风险、提高各部门数据可见性和访问性的关键。

IT预算在艰难的一年中幸存并将支持AI的新技术和人员配置

尽管全球经济动荡不定,IT领导者仍看好对未来的投资。随着AI技术从试点转向生产,高管们对AI对利润影响的期望很高。金融和技术分析师预测,2026年IT预算将增长4%至10%。这些资金不会全面分散使用,而是集中在优化的关键领域,包括数据、AI和基础设施,如存储、安全和数据管理。根据Komprise调查,64%的IT领导者表示,许多IT组织需要升级数据存储和数据管理平台。除技术之外,IT和业务高管还将寻求具有AI基础设施专业知识的IT领导者,以及能够设计、实施和管理智能体和数据工作流的技术人员。根据我们的研究,近一半的IT团队将增加员工,55%将进行重组和AI技能培训。

IT领导者将采用非结构化数据分类以提高数据安全性和AI投资回报率

非结构化数据是当今组织中最有价值的资产之一,但由于其增长过快且分散在众多系统和存储边界中,大部分仍处于未知状态。如果没有系统的方法来分类和过滤非结构化数据,例如识别过时版本、基于内容和相对价值进行搜索,IT部门将无法保护数据,也无法向利益相关者提供精确的AI数据集。然而,通过使用自动化文件扫描和标记工具丰富文件元数据,IT团队可以将敏感、无关和过时的数据排除在AI工作流之外。这也使员工更容易搜索项目所需的准确数据。为AI准备和分类数据将成为2026年数据管理的首要任务,仅次于存储成本优化。

生成式AI风险成为领导者的终极平衡艺术

消费者和员工已经跳上AI的快车,发现将这些新工具集成到日常任务中可以大幅节省时间。然而,高级IT和领导者不会容忍敏感数据泄露或勒索软件风险增加。与此同时,目前存在一些限制。Komprise调查发现,只有14%的组织在员工队伍中限制使用AI。同时,我们的研究和无数其他研究表明,敏感数据泄露、幻觉和数据来源不明确是IT和业务领导者最关心的问题。IT高管需要在提供尖端技术访问和鼓励员工试验之间取得适当平衡,同时警惕保护企业和客户数据。审计进出工具的数据并密切监控应用使用风险的能力,将成为IT、法律和安全团队共同开发的日益增长的最佳实践。

IT基础设施优先事项转向AI就绪的数据管理

随着AI从消费者原型成熟为现实世界的企业计划,IT运营团队感受到构建高性能基础设施的压力,包括支持GPU的存储。这对于处理AI的海量数据至关重要,但企业AI主要使用现有的组织数据。性能虽然重要,但不如制定正确的非结构化数据管理策略以提供良好的治理、数据清洁和AI数据分类来得关键。AI的数据管理需要超越存储优化,为不同受众提供全面管理的数据服务。这些服务包括数据使用和支出报告与分析、经济高效的归档和迁移、精细的数据搜索和分类、AI数据工作流和摄入服务,以及网络安全,如勒索软件保护和敏感数据管理。

Q&A

Q1:为什么非结构化数据增长在2026年会成为企业面临的重大挑战?

A:根据Komprise 2026年调查,大多数企业现在存储超过5 PB数据,40%的企业存储超过10 PB。使用传统方法管理这些数据已不可行,因为管理和保护成本高昂,同时AI数据准备、管理和审计的新需求不断涌现。企业需要能够跨存储和备份系统查看、理解、清理、过滤、分类和移动数据的新能力来管理风险。

Q2:企业在2026年的IT预算会如何分配?

A:尽管全球经济动荡,IT预算预计将增长4%至10%。这些资金将集中在关键优化领域,包括数据、AI和基础设施(如存储、安全和数据管理)。64%的IT领导者表示需要升级数据存储和管理平台。此外,近一半的IT团队将增加人员,55%将进行重组和AI技能培训,特别是招聘具有AI基础设施专业知识的人才。

Q3:非结构化数据分类对AI应用有什么作用?

A:通过自动化文件扫描和标记工具丰富文件元数据,IT团队可以将敏感、无关和过时的数据排除在AI工作流之外,这样能提高数据安全性并确保AI获得精确的数据集。同时也让员工更容易搜索到项目所需的准确数据。为AI准备和分类数据将成为2026年仅次于存储成本优化的首要数据管理任务。



版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 8:51:56

Google发布Gemini 3 Flash并将其设为默认模型

Google今天发布了基于上月推出的Gemini 3的快速且经济的Gemini 3 Flash模型,试图抢夺OpenAI的风头。该公司还将此模型设为Gemini应用和搜索AI模式中的默认模型。新的Flash模型在Google宣布Gemini 2.5 Flash模型六个月后到来,提供了显著改进。在基准测试中,Gemini 3 …

作者头像 李华
网站建设 2026/4/16 13:58:40

搞电机控制仿真最头疼的就是模型验证——参数调不准、算法跑飞、波形毛刺...今天给大伙儿整了套实用工具包,包含异步电机全家桶模型,直接解决从理论到落地的断层问题

推荐打包出一组异步电机、感应电机仿真模型,包括数学基础模型,无位置速度辨识模型,DTC 模型,FOC 模型等,模型总共有十多个,标价即总价。 模型已经运行过,在 2018b 版本上都没有问题,…

作者头像 李华
网站建设 2026/4/19 21:19:11

cesium126,230703,UE 建筑层移动和还原及其控制图层的实现 - 下:

(207)这里记录一下 UIBP 蓝图里,如何为按钮里的文本绑定文字,以前都是创建绑定函数,其实也可以直接绑定到本蓝图里的公共文本变量上 : 调用赋值,显示到屏幕 :因为没有老师的 smith 建…

作者头像 李华
网站建设 2026/4/27 18:47:21

【毕业设计】基于springboot+微信小程序的闲置物品处置平台的设计与实现(源码+文档+远程调试,全bao定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/5/1 8:44:35

深度解析:Allure报告如何提升你的测试效率?

Allure 简介与安装 Allure 是由 Java 语⾔开发的⼀个轻量级,灵活的测试报告⼯具。 Allure 多平台的 Report 框架。 Allure ⽀持多语⾔,包括 python、JaveScript、PHP、Ruby 等。 可以为开发/测试/管理等人员提供详尽的的测试报告,包括测试…

作者头像 李华