Precog发布企业数据AI化新功能，自动添加业务上下文-编程实验室

从Salesforce、SAP Ariba或NetSuite等企业工具中提取数据相对容易，但让这些数据能够被AI模型理解和推理却困难得多。仅仅拥有大量表格、列或巨型多维JSON文件，并不能帮助模型对数据进行有效推理。这里缺少的关键要素是数据生成时的业务上下文。

专注于帮助企业从软件即服务（SaaS）API源提取数据并为分析或AI应用做准备的Precog公司，今天推出了一项新功能，将把业务上下文重新带入数据提取过程中。

Precog首席执行官Jon Finegold在发布前的采访中表示，为AI分析手动准备数据的过程可能需要数月时间。

"当你进入企业环境，想要开始分析关键业务数据时，这些数据往往分散在各种应用程序中，有时企业中会有超过100个应用程序，"Finegold说。"从这些应用程序中获取数据的过程——不仅仅是提取和加载，还要为其提供足够的上下文，让模型能够真正理解数据——这是一个非常手动的过程。"

尽管大语言模型的能力不断增强，但在处理大量数据推理时也不够可靠。

"如果有人听说要把所有数据发送给Gemini，不仅分块和Token化等过程成本极高，而且每次调用得到的答案都会不同，"Finegold指出。

为了解决这些问题，Precog采用了不同的方法来帮助客户从数据中获得更多价值。当Precog用户想要配置新的数据源用于AI应用时，他们现在可以广泛描述自己的用例（例如，"我想了解哪些客户最有利润，哪些让我们亏钱"）。然后Precog将使用其现有的ETL功能查看SaaS应用中的可用数据，仅提取特定用例所需的字段，并添加必要的上下文来帮助模型理解每个字段的含义。

这里需要注意的重要一点是，Precog实际上从不向大语言模型传递公司数据。相反，它将实际数据加载到数据仓库中，只向其语义引擎传递元数据。

Precog构建这个系统的一个巧妙之处在于，它还使用另一个模型自动创建数百个潜在问题——可以将其视为合成问题生成。

正如Precog首席产品官Becky Conning所说，这里的想法是生成一个"问题矩阵，让大语言模型能够生成语义模型来回答所有这些问题。"

Conning认为，这一切都是必要的，因为简单地构建一个与单个标准化表绑定的巨大语义模型只能回答非常有限的问题集。

同时，包含所有数据也行不通。"如果你包含所有数据——这些应用程序中的一些可能有数十万个数据集，由于JSON结构，每个数据集可能不仅代表一个表，还可能包含分解后的维度信息——那么Cortex就无法工作。实际上，任何这些自然语言查询大语言模型都无法工作。"

现代大语言模型的优势在于它们非常擅长将自然语言查询转换为SQL，因此为了查询数据，Precog不直接依赖模型——也不向该模型提供数据——而是使用Snowflake的Cortex NLQ大语言模型。该服务也可以使用其他大语言模型，但团队表示他们确实喜欢Cortex NLQ用于这种用例。

总的来说，这看起来是一种聪明的方式，利用大语言模型最擅长的能力，而不是试图将它们硬塞到更可能失败而非现有技术的用例中。

Q&A

Q1：Precog的新功能能解决什么问题？

A：Precog的新功能主要解决企业数据缺乏业务上下文的问题。虽然从企业工具中提取数据相对容易，但让AI模型理解和推理这些数据却很困难。该功能可以自动为数据添加必要的业务上下文，让模型能够真正理解数据的含义，大大简化了原本需要数月的手动数据准备过程。

Q2：Precog如何保护企业数据安全？

A：Precog在处理企业数据时采用了安全的分离架构。它从不将公司的实际数据传递给大语言模型，而是将实际数据加载到数据仓库中，只向语义引擎传递元数据。这种方式既能利用大语言模型的能力，又能确保敏感的企业数据不会泄露给外部AI服务。

Q3：Precog的语义模型是如何工作的？

A：Precog使用智能体自动生成数百个潜在问题，创建问题矩阵，让大语言模型能够生成语义模型来回答所有这些问题。它不是构建单一的巨大语义模型，而是根据具体用例只提取必需的数据字段。在查询时，系统利用现代大语言模型擅长将自然语言转换为SQL的优势，通过Snowflake的Cortex NLQ来处理查询。

让 Q 值估计更准确：从 DQN 到 Double DQN 的改进方案

DQN 用 max Q(s,a)计算目标值，等于在挑 Q 值最高的动作，但是这些动作中包括了那些因为估计噪声而被高估的动作，素以就会产生过估计偏差，直接后果是训练不稳定、策略次优。这篇文章要解决的就是这个问题，内容包括&am…

李华

【毕业设计】基于springboot的高校院系学生信息管理系统(源码+文档+远程调试，全bao定制等)

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…

李华

Agent Skills入门指南：从“不就是Markdown“到大模型稳定执行的关键

Agent Skills是Anthropic推出的供大模型使用的技能包，通过包含做事流程和资源，解决模型稳定、可复用、可分发执行问题。采用渐进式披露机制分三层加载，避免上下文爆炸。Skills包含核心文档、脚本、参考资料和静态资源，适合重复执行…

李华

AI工具存在严重安全脆弱性，治理刻不容缓

企业AI工具在网络攻击面前仍然极易受损，尽管各大企业正在竞相扩大AI工具的应用范围。网络安全公司Zscaler在周二发布的威胁报告中指出了这一问题。报告发现，企业正在向AI工具投入大量数据，"这让AI平台成为全球网络犯罪分子更大的攻击目标…

李华

AI运维专家圆桌：新兴技术类别的诞生

随着AI驱动代码生成工具的爆发式增长，运维和安全领域也出现了强烈的AI驱动响应，这并不令人意外。按照定义，SRE和安全专业人员的核心职能就是跟上变化的步伐，快速响应以维护在线系统的可靠性和安全性。这引出了我们要讨论的话题&am…

李华

让 Q 值估计更准确：从 DQN 到 Double DQN 的改进方案

【毕业设计】基于springboot的高校院系学生信息管理系统(源码+文档+远程调试，全bao定制等)

LCR001-两数相除

Agent Skills入门指南：从“不就是Markdown“到大模型稳定执行的关键

AI工具存在严重安全脆弱性，治理刻不容缓

AI运维专家圆桌：新兴技术类别的诞生