news 2026/6/15 21:50:23

我用迭代优化的方法,Vibe Coding了一个PDF小工具#配合Notebooklm的工作流

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
我用迭代优化的方法,Vibe Coding了一个PDF小工具#配合Notebooklm的工作流

Shadow:平时在使用 Chat 等 AI 对话产品输入信息时,许多人会产生心理负担,感到无从下笔,需要思考很久才敢开始输入。

有2种方法可以缓解这个问题:

一种是使用语音输入,想到什么说什么;另一种是允许自己随意输入,但让 AI 先对输入内容进行语言梳理,并注意保持原意、不增删信息。

举个例子

最近 Notebooklm 的移动版更新了幻灯片生成功能,同时网页版也对免费用户开放了此功能。我用它制作了不少 PPT 。

在制作过程中,我会尝试不同的提示词,基于同一份输入材料生成多个不同版本的 PPT,然后从中挑选出我认为有价值的页面保留。

同时,还需要将 PPT 上 Notebooklm 的水印去除,替换成我自己的 Logo 。

基于自身的需求,产生了这个PDF小工具:

PDF Cleaner 工具

第一步:随意输入

---

做一个pdf处理工具,pdf每一页都是图片,直接把pdf每页都转为图片做处理。框选水印的区域,设置背景色,和文字,然后全面页面同样的位置做替换。支持删减页面。支持上传多个pdf,进行整合。导出为pdf。

--

让 AI 帮我把语句通顺下,不要改变原意,不随意增添其他信息

第二步:AI 梳理后

---

开发一个PDF处理工具,其核心功能是:将PDF文件的每一页作为图片处理。

主要流程为:上传一个或多个PDF文件,将每个PDF的每一页转换为图片。用户可在图片页面上框选水印区域,并设置该区域的背景色和替换文字,工具将把PDF所有页面中相同位置的内容进行统一替换。同时支持删除指定页面,以及将多个PDF文件合并处理。最终将处理结果导出为一个PDF文件。

Shadow:清晰很多,节省了不少梳理逻辑关系的脑力。

第三步:Vibe Coding

---

打开,Google AI Studio ,Build 模式,把上面的提示,输入。但我在末尾补充了2句:

---

1、良好的用户体验:本地缓存输入和结果,保留历史记录,提供example示例。

2、做完后记得再次核对下功能实现的完整度。

Shadow:这样加是基于上百个测试总结出的经验。

Gemini 总共花了 136s ,来看看 Vibe Codiing 生成的效果:

最后,我的PDF制作成果:

这个PPT也是我最近在各种场合里分享的 AgentOS 的内容

如果你想掌握AI使用技巧,以及 Vibe Coding 从入门到进阶之路,欢迎了解 Mixlab AI编程训练营:

N22 上海线下2天,12月27-28号

N21 线上 AgentOS AI编程训练营,12月17-1月17号。

欢迎微信咨询

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 18:57:44

ComfyUI性能调优:如何提升GPU算力利用率

ComfyUI性能调优:如何提升GPU算力利用率 在AI图像生成领域,我们常常面临一个看似矛盾的现象:明明配备了RTX 4090这样的顶级显卡,任务运行时GPU利用率却像心电图一样剧烈波动——峰值冲到90%,下一秒又跌回个位数。这种“…

作者头像 李华
网站建设 2026/6/15 19:21:18

中草药智能识别与科普系统

中草药智能识别与科普系统 1. 项目背景与目标 1.1 背景 中草药作为传统医学的重要组成部分,其种类繁多,形态各异。对于非专业人士而言,准确识别中草药不仅困难,而且容易混淆。随着计算机视觉和深度学习技术的发展,利用…

作者头像 李华
网站建设 2026/6/15 19:31:22

Transformer模型压缩技术降低Qwen-Image-Edit-2509推理成本

Transformer模型压缩技术降低Qwen-Image-Edit-2509推理成本 在电商商品图批量修图、社交媒体一键换装、广告素材快速迭代等高频图像处理场景中,AI驱动的智能编辑正从“炫技”走向“刚需”。阿里巴巴通义实验室推出的 Qwen-Image-Edit-2509 模型,凭借其对…

作者头像 李华
网站建设 2026/6/15 13:39:23

突破传统报表开发瓶颈:UReport2创新实践全解析

突破传统报表开发瓶颈:UReport2创新实践全解析 【免费下载链接】ureport UReport2 is a high-performance pure Java report engine based on Spring architecture, where complex Chinese-style statements and reports can be prepared by iterating over cells. …

作者头像 李华
网站建设 2026/6/15 1:31:00

23、时间间隔表示与类型关系解析

时间间隔表示与类型关系解析 1. 持续时间管理与建模 1.1 单时间点建模 最初,人们尝试用单个时间点来表达有效性。但这种方法存在明显局限,数据存储和后续处理效率低下,因为可能出现大量重复元组。不过,当把这个时间点定义为有效性的起始点时,能对持续时间进行建模。每个…

作者头像 李华
网站建设 2026/6/15 6:14:37

32、构建可靠解决方案:避免 SQL 注入与时间戳增强

构建可靠解决方案:避免 SQL 注入与时间戳增强 1. SQL 注入问题解析 SQL 注入是一种通过用户输入扩展原始 SQL 语句代码的技术。用户不提供所需的值,而是提供可执行的 SQL 代码,这可能导致访问通常不可用(隐藏)的数据、进行未经授权的值更改或删除个别对象,严重损害系统的…

作者头像 李华