news 2026/6/15 21:33:58

办公文档平台ONLYOFFICE如何使用AI进行金融图表的描述识别

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
办公文档平台ONLYOFFICE如何使用AI进行金融图表的描述识别

随着协同办公与智能辅助编辑的需求增长,现代办公套件中的 AI 能力正在不断拓展。除了常规文本生成和语法检查等基础功能之外,开发者和高级用户希望让 AI 在更具体、定制化的场景中发挥作用,比如根据图像自动生成描述文字。办公文档平台ONLYOFFICE在其 AI 插件体系中提供了灵活的扩展机制,允许开发者定义自有功能并纳入其 AI 智能体处理流程。

>> 最新版本办公文档平台ONLYOFFICE 下载<<

AI描述图像的最终呈现

AI 描述图像的基本目标十分直观:选定文档中的一张图像,输入简要指令,然后得到由 AI 生成、写入到合适位置的文字。这个文字可以是图像标题、说明段落,也可以是面向辅助访问的替代文本。为了避免模型对用户意图做出模糊假设,这个功能依赖于明确的用户提示,从而确保生成结果与用户需求紧密对齐。

为了让 ONLYOFFICE 的 AI 引擎能够识别并调度该功能,需要将其提交为一个 RegisteredFunction。这个结构包含函数名称、参数定义和实际调用示例,是函数在插件体系中注册的基本格式。

函数定义与结构

函数被设定了一个输入参数 prompt(字符串类型),用于接收用户的指令,例如「为这张图生成一句简短说明」。该定义同样提供了多个典型调用示例,便于 AI 引擎和终端用户参考操作。

在代码层面,describeImage 定义如下:

let func = new RegisteredFunction({ name: "describeImage", description: "Allows users to select an image and generate a meaningful title, description, caption, or alt text for it using AI.", parameters: { type: "object", properties: { prompt: { type: "string", description: "instruction for the AI (e.g., 'Add a short title for this chart.')", }, }, required: ["prompt"], }, examples: [ { prompt: "Add a short title for this chart.", arguments: { prompt: "Add a short title for this chart." }, }, { prompt: "Write me a 1-2 sentence description of this photo.", arguments: { prompt: "Write me a 1-2 sentence description of this photo.", }, }, { prompt: "Generate a descriptive caption for this organizational chart.", arguments: { prompt: "Generate a descriptive caption for this organizational chart.", }, }, { prompt: "Provide accessibility-friendly alt text for this infographic.", arguments: { prompt: "Provide accessibility-friendly alt text for this infographic.", }, }, ], });
图像提取逻辑

要生成针对图像的文本,第一步是获取用户选中的图像数据。在 ONLYOFFICE 中,文档中的图像被称为 “drawings”。通过插件 API 调用 GetImageDataFromSelection 方法可以获得当前聚焦图像的 Base64 编码和尺寸信息:

let imageData = await new Promise((resolve) => { window.Asc.plugin.executeMethod( "GetImageDataFromSelection", [], function (result) { resolve(result); } ); });

其中返回的数据里包括如 "src":"data:image/png;base64,…" 格式的 Base64 字符串,这部分信息随后会作为 AI 请求的一部分发送出去。在处理过程中,还需要过滤掉占位符图像。例如 ONLYOFFICE 使用一个极小的白色矩形作为空白占位符,对这种情况要做特殊比对后跳过,否则会导致生成无意义的结果。

构建 AI 输入

一旦图像被成功提取,下一步是将图像数据和用户提示组合成 AI 引擎可理解的请求结构:

let messages = [ { role: "user", content: [ { type: "text", text: argPrompt }, { type: "image_url", image_url: { url: imageData.src, detail: "high" }, }, ], }, ];

在这段结构中,text提供了用户指令,例如“为该图生成解释性标题”;image_url则包含图像本身。通过detail:"high"表示希望模型尽可能以高分辨率分析图像。AI 模型通常能够处理 Base64 编码的数据,因此直接使用从文档中提取的字符串就足够,不需要先上传至服务器再传递 URL,这样的设计也减少了数据泄露或额外传输的风险。

发送请求与实时收集

构建好请求结构后,通过插件引擎的 chatRequest 方法发送消息,并实时收集 AI 输出:

let requestEngine = AI.Request.create(AI.ActionType.Chat); await requestEngine.chatRequest(messages, false, async function (data) { … });
将输出写回到文档

AI 返回的文字最终要写入到文档中,这里会根据用户是否选中图像分为两种情况:

  • 如果选中了图像,则在图像下方插入一段文字;
  • 如果未选中,则在当前光标位置后的段落位置插入。

示例代码如下:

async function insertMessage(message) { console.log("describeImage: insertMessage called", message); Asc.scope._message = String(message || ""); await Asc.Editor.callCommand(function () { const msg = Asc.scope._message || ""; const doc = Api.GetDocument(); const selected = (doc.GetSelectedDrawings && doc.GetSelectedDrawings()) || []; if (selected.length > 0) { for (let i = 0; i < selected.length; i++) { const drawing = selected[i]; const para = Api.CreateParagraph(); para.AddText(msg); drawing.InsertParagraph(para, "after", true); } } else { const para = Api.CreateParagraph(); para.AddText(msg); let range = doc.GetCurrentParagraph(); range.InsertParagraph(para, "after", true); } Asc.scope._message = ""; }, true);
AI图像描述与金融行业

在金融行业的数据报告与分析流程中,这类利用 AI 自动识别图表并生成描述文字的能力具有显著价值。金融文档中通常包含大量图表,如价格趋势图、收益率曲线、资产配置饼图及季度指标柱状图等,人工手动编写与审校这些图表说明既耗时又易出现遗漏。

借助 ONLYOFFICE 的图像识别与文本生成机制,用户可以让系统根据图像内容自动生成清晰、可读的解释文字,进而加快季报、分析报告或策略建议书的撰写效率。对于投资研究,通过自动化生成图表标题与注释,不仅减轻了重复劳动,还能将注意力集中在深层次数据洞察上。

在合规审查场景中,图像识别功能还可辅助梳理图表关联的风险提示或合规要点,保持报告在不同时间段或业务单元之间表述的一致性,提升内容的沟通效果。

通过 ONLYOFFICE 提供的自定义 AI 功能,我们能够高效地将文档中的图像自动转化为精准的文字说明,从定义函数元数据、提取图像内容、构建提示结构,到校验模型支持、发送请求与写回结果,每一步都围绕提升办公编辑体验展开。特别是在财经报告、数据分析、信息无障碍支持等实际场景下,该功能不仅节省了传统手动编辑的时间,还增强了图表解释的清晰度和一致性。结合金融行业对图表说明的专业要求,这一能力能有效辅助风险分析、投资策略撰写和内部汇报等关键业务流程。


慧都科技是专注软件工程、智能制造、石油工程三大行业的数字化解决方案服务商。在软件工程领域,我们提供开发控件、研发管理、代码开发、部署运维等软件开发全链路所需的产品,提供正版授权采购、技术选型、个性化维保等服务,帮助客户实现技术合规、降本增效与风险可控。

慧都科技ONLYOFFICE在中国的官方授权代理商,ONLYOFFICE是文档在线编辑领域的优秀产品,帮助企业实现高效的文档协同处理。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 12:45:30

5步搞定Magpie性能优化:让低配电脑也能流畅放大窗口

5步搞定Magpie性能优化&#xff1a;让低配电脑也能流畅放大窗口 【免费下载链接】Magpie An all-purpose window upscaler for Windows 10/11. 项目地址: https://gitcode.com/gh_mirrors/mag/Magpie 你是否在使用Magpie放大窗口时遇到卡顿、掉帧问题&#xff1f;作为一…

作者头像 李华
网站建设 2026/6/15 12:45:45

3步解锁Unreal Engine脚本注入:游戏自定义开发从入门到精通

3步解锁Unreal Engine脚本注入&#xff1a;游戏自定义开发从入门到精通 【免费下载链接】RE-UE4SS Injectable LUA scripting system, SDK generator, live property editor and other dumping utilities for UE4/5 games 项目地址: https://gitcode.com/gh_mirrors/re/RE-UE…

作者头像 李华
网站建设 2026/6/15 14:17:22

1小时打造Flutter+鸿蒙原型:快马平台实战演示

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 快速生成一个社交媒体应用原型&#xff0c;同时支持Flutter和鸿蒙平台&#xff0c;包含以下核心界面&#xff1a;1.用户个人资料页2.动态信息流3.消息列表4.发布功能。只需实现基本…

作者头像 李华
网站建设 2026/6/15 3:38:36

Windows安卓应用安装完全指南:让手机应用在电脑屏幕上焕发新生

Windows安卓应用安装完全指南&#xff1a;让手机应用在电脑屏幕上焕发新生 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否曾想过在电脑上直接运行手机应用&…

作者头像 李华
网站建设 2026/6/15 18:58:35

JumpServer API集成完全指南:从入门到精通

JumpServer API集成完全指南&#xff1a;从入门到精通 【免费下载链接】jumpserver jumpserver/jumpserver: 是一个开源的 Web 服务器和 Web 应用程序代理服务器&#xff0c;可以用于构建安全&#xff0c;高性能和易于使用的 Web 服务器和代理服务器。 项目地址: https://git…

作者头像 李华
网站建设 2026/6/15 12:37:51

3步打造专业简历:开源工具dnd-resume求职逆袭指南

3步打造专业简历&#xff1a;开源工具dnd-resume求职逆袭指南 【免费下载链接】dnd-resume &#x1f680; Resume Builder 在线简历生成工具 项目地址: https://gitcode.com/gh_mirrors/dn/dnd-resume 在竞争激烈的求职市场中&#xff0c;一份专业的简历往往是获得面试机…

作者头像 李华