news 2026/5/1 8:42:53

非结构化数据的隐私性较低吗?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
非结构化数据的隐私性较低吗?

从听过任何关于人工智能讨论的调查来看,我们都知道隐私很重要。

我们一次又一次地听到人们谈论如何实现某种类型的人工智能系统,但他们担心涉及的隐私问题。

有时候,从整体格局的细致角度来看,能让我们看到如何做得更好。

例如,新系统越来越能够分析非结构化数据,并将所有相关数据点聚合成统一整体。

这对隐私意味着什么?非结构化数据本质上就不那么个人化,也不那么敏感吗?

把这大量非结构化数据看作是涵盖各种可能涉及任何内容的信息的总包。从这个角度看,从这么宽广的字段获取数据似乎比收集一个精心填充的数据库(里面有人员身份和可能的敏感财务信息如账号等)要小得多。

但你仍然可以有一些相当私密的数据存在于非结构化数据集中。例如,一封与某人HIPAA信息相关的信件,至少在肉眼看来可能没有包含这些内容。但当你用更强大的引擎拿回洞察时,你可能会发现机器能够从一些意想不到的地方提取敏感数据。

社交媒体的例子就是看待这个问题的一种方式。社交媒体是非结构化数据——我们都知道这一点——我们习惯在Facebook或 X 或微博 或在这上看到各种关于自己的故事。你可能会想,嗯,它没有我的社会安全号码或银行账户号码。但鱼叉式钓鱼者并不总是需要这些标识符,只要他们有正确的故事。此外,人工智能可能能够整合各种推断、时间线和影响,构建出令人恐惧的个人故事。比如想想保险欺诈侦探如何利用社交媒体。它可能会抓到欺诈行为——但侵入性有多大?

那么,新的人工智能系统是如何做到这一点的呢?如果你看硬件,我们正进入一个人工智能可以从更结构化数据集转向一种通用技术,吸收大量数据,以至于你可能会认为它接近普世知识的时代。

在最近一次参与某个AI活动中,一位专家谈到了一款拥有90万个核心和40亿晶体管的芯片,它便于扩展并消除并行编程。但她指出,这些系统在处理非结构化数据方面也更有能力。额外的能力有助于搜寻更广泛的知识库并收集你想要的东西。

“如今我们能够在单一系统上运行巨大的模型。因此,我们可以通过数据并行性快速且便捷地扩展。因此,不需要像威震天那样复杂的并行编程库......作为企业,通过开发者使用我们的系统,他们可以专注于人工智能,而非复杂的并行编程。因此,他们可以更快地开始和扩展工作。

一个视角是数据治理。你可以识别数据在AWS对象存储中的位置,以及随之而来的元数据。你可以开始分析AI是否能够从它通过非结构化数据中收集到的零碎信息构建敏感信息模型。首先,正如许多人现在问的那样:谁拥有这些数据?

随着进展,我们将开始看到隐私威胁的所在。或者如果我们不这样做,可能会在用户的个人体验层面看到这些问题,人们理所当然地感到不满。

我得说硬件本身相当令人印象深刻。这些工艺远远超出了多核技术的简单概念。看起来他们会把明天的数据中心变成你手中拿着的东西。

无论如何,当我们思考非结构化数据时,我们应该考虑它被简化、精炼和精炼后会是什么样子,机器能从中推测出关于你的一切!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 14:20:21

30、字幕和隐藏字幕技术详解

字幕和隐藏字幕技术详解 1. SubStation Alpha 相关介绍 SubStation Alpha(SSA/ASS)的规范可在 MooDub.free (http://moodub.free.fr/video/ass-specs.doc)查看。不过该规范较为简略,且与后续的规范和实现相比存在一些小错误,例如时间格式就有所不同。 SSA/ASS 文件既可…

作者头像 李华
网站建设 2026/4/29 7:41:26

34、Linux音频技术:从卡拉OK到流媒体与树莓派应用

Linux音频技术:从卡拉OK到流媒体与树莓派应用 1. TiMidity与卡拉OK系统 TiMidity可作为MIDI播放器用于卡拉OK系统。以下是使用TiMidity的相关内容: - 以TiMidity为库的背景视频 :代码结构与之前类似,位于 gtkkaraoke_player_video_pango.c 文件中。示例代码如下: …

作者头像 李华
网站建设 2026/5/1 8:07:20

终极指南:轻松掌握GuoFeng3古风AI模型完整安装与创作技巧

终极指南:轻松掌握GuoFeng3古风AI模型完整安装与创作技巧 【免费下载链接】GuoFeng3 项目地址: https://ai.gitcode.com/hf_mirrors/ai-gitcode/GuoFeng3 GuoFeng3作为专业的古风AI图像生成模型,以其独特的2.5D质感和传统中国美学风格&#xff0…

作者头像 李华
网站建设 2026/4/20 19:14:44

软件测试:【使用LoadRunner测试IPv6应用的注意事项】

使用LoadRunner对IPv6应用进行性能测试时,主要挑战在于工具本身的局限。和纯IPv4环境不同,必须精确规划和规避一系列限制,保证测试的有效。 LoadRunner测试IPv6的主要限制 协议支持限制:Web HTTP/HTML 协议下,不支持K…

作者头像 李华
网站建设 2026/5/1 1:42:12

SpringBoot中这10个神仙功能,惊艳到我了!

一、Conditional注解有些小伙伴在工作中可能遇到过这样的场景:不同环境需要加载不同的Bean配置。传统的做法是用Profile,但Conditional提供了更灵活的控制能力。基础用法Configurationpublic class DataSourceConfig {BeanConditional(ProdDataSourceCon…

作者头像 李华
网站建设 2026/4/26 13:04:58

WLED完整配置教程:从零开始打造智能灯光系统

WLED完整配置教程:从零开始打造智能灯光系统 【免费下载链接】WLED Control WS2812B and many more types of digital RGB LEDs with an ESP8266 or ESP32 over WiFi! 项目地址: https://gitcode.com/gh_mirrors/wl/WLED 想要轻松控制WS2812B等数字RGB LED灯…

作者头像 李华