news 2026/5/1 1:26:41

OpenAI 连夜发新模型,我在 Lovart 拿它和「大香蕉」干了一架

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
OpenAI 连夜发新模型,我在 Lovart 拿它和「大香蕉」干了一架

左边是 OpenAI 刚刚发布的GPT Image 1.5,右边是谷歌的Nano Banana Pro

相同的提示词,你觉得哪个更好?

昨天我说,OpenAI 急了。

今天来点更硬核的。

三个场景深度实测,是骡子是马,拉出来遛遛。


改个发型

怎么测?

还是「Lovart」。

两个模型它都支持,几小时前GPT Image 1.5刚上线就能用了。

手速真快,服气。

开头那张图就是第一个测试。

要求很简单:把人物改成光头,其他元素不变。

上传 Sam Altman 的图片。

输入提示词。

Make him completely bald. Keep everything else exactly the same - the colorful polo shirt, the yearbook frame, the text at the bottom, the vintage photo style.

先看 OpenAI 的。

衣服颜色、层次、底部文字、复古颗粒感,一致性挺好。

但仔细看,头被拉长了,脑袋变大了,不太像原来的 Altman 了。

再看谷歌这边。

一致性同样不错,光头质感甚至更自然一些。

脸部特征的保持也稍微好一点,至少还能认出来是同一个人。

另外,也修复了原图里左耳朵丢失的问题。

个人感觉这轮,谷歌小胜。

两个模型在精准编辑上都保持了很好的一致性,但Nano Banana Pro在细节上更胜一筹。

接着把两张图拖到一个画布里。

在「Touch Edit」模式下选中(按住Cmd(Mac)/Ctrl(Windows)点击,或者直接在左侧工具栏切换到Mark模式选择)。

输入下面的提示词,发送。

将这两张图左右并排放置,中间留一条细细的白色分隔线。 左图上方添加标签 "GPT Image 1.5",右图上方添加标签 "Nano Banana Pro"。 标签样式:深灰色背景,白色文字,小圆角矩形,位于图片左上角/右上角。 整体背景为浅灰色 (#f5f5f5)。

就得到了文章开头的对比图。

一目了然。


四宫格图

第二个测试,套图一致性。

同一个人物,不同的设定,保持风格统一。

一个提示词,生成一张 2x2 的四宫格。

提示词:

A single 2x2 grid image in high-fashion editorial style, shot from bird's-eye view with LOMO Lc-a film aesthetics. The scene: a sea of scattered black-and-white fashion magazine covers and billboard fragments on the ground. A stunning female model stands at the center of each panel - she is THE SAME PERSON across all four panels, with identical face, hairstyle, and body proportions. Four seasons, four looks: - Top left: SPRING - cherry blossom petals floating among the magazines, model in an oversized pastel blazer and flowing silk dress - Top right: SUMMER - harsh sunlight casting dramatic shadows, model in a crisp white linen shirt and high-waisted shorts, barefoot - Bottom left: AUTUMN - golden and crimson leaves scattered everywhere, model in a camel cashmere sweater and tailored trousers - Bottom right: WINTER - light snow dusting the magazine covers, model in a black wool coat with leather gloves CRITICAL: This is ONE single image divided into 4 panels, not 4 separate images. The model must be recognizably the same person in all panels - same face, same bone structure, same hair color and style. Style references: Vogue editorial, Steven Meisel, high-fashion campaign. LOMO film grain, vintage color grading, dramatic yet elegant composition.

GPT Image 1.5画的。

说实话,多少有点失望。

虽然四格都完成了,模特的脸也一致。

但姿势太统一了,缺乏变化。

季节感也有点弱。

再看谷歌这边。

差距肉眼可见。

同样是四季,Nano Banana Pro的每一格都像是时尚大片。

季节元素也更到位。夏天阳光和阴影,秋天金黄落叶,冬天飘落的雪。

甚至还加上了文字标签。

所以这一轮,谷歌完胜。


时代广场的巨人

第三个测试,文字渲染。

在 Lovart 里新建项目。

左侧工具栏选择新增图像生成器

接着选择模型,参考图片从「画布」里选就行。

设置清晰度、尺寸,输入提示词,开始。

图像生成器的好处是这些参数不用写进提示词里,可控性更强了。

非常推荐。

A cinematic masterpiece photograph of a colossal man (exact face and body from reference) sitting like a god among the skyscrapers of Times Square at the blue hour. THE GIANT: He sits confidently with legs crossed, wearing a black cashmere turtleneck and tailored dark jeans. One hand rests on a rooftop, the other holds up a massive iPhone toward camera - screen showing "AI信息Gap" in minimalist white typography on a soft pink-to-purple gradient. THE CITY: Shot from a low drone angle looking up, making him appear even more monumental. Times Square stretches below him - yellow taxis like toy cars, pedestrians like ants, steam wisps rising from the streets. KEY VISUAL ELEMENT: Behind him, ONE giant digital billboard displays "AI信息Gap" in glowing white text on deep black background. LIGHTING: Golden hour meets blue hour. Warm tungsten glow from street level, cool blue sky above. Dramatic rim light on the giant's shoulders and hair. Style: Blade Runner meets Apple commercial. This should look like a $10 million Super Bowl ad campaign.

OpenAI 的结果。

构图没问题,光影质感也到位。

但看文字,不但乱码,还少了个「息」字。

谷歌的答案。

手机屏幕,AI信息Gap,正确。

广告牌,AI信息Gap,正确。

这轮,几乎没有悬念。

Nano Banana Pro的中文渲染能力,目前还是独一档。

其实,GPT Image 1.5的英文渲染能力没问题。

比如,我用「Text Edit」把「AI信息Gap」改成了「Lovart」。

不用重新生成,直接无痛修改任何文字。

换成英文,这感觉不就来了。


不只是图片

测完图,我发现 Lovart 最近上线了 PPT 功能。

试试。

以经典论文「Attention Is All You Need」为例。

在 Lovart 对话框左下角点击Slides,上传这份 PDF 文件。

右下角打开Thinking模式,让它深度思考。

然后输入提示词,发送。

根据上传的《Attention Is All You Need》论文PDF,生成一份通俗易懂的解读PPT,25页。 目标读者:对AI感兴趣但没有深度技术背景的人。 内容结构: - 封面:论文标题 + 「一篇改变AI历史的论文」 - 背景篇:2017年之前的序列模型困境(RNN/LSTM的问题) - 核心篇:Transformer架构全解(Encoder-Decoder、Self-Attention、Multi-Head Attention、Position Encoding),用图解代替公式 - 意义篇:这篇论文如何催生了GPT、BERT、ChatGPT - 尾页:论文原文链接、延伸阅读 视觉风格: - 整体调性:科技教育风,像 3Blue1Brown 的视觉语言 - 主色系:深蓝渐变背景,亮橙色作为强调色 - 大量使用架构图、流程图、对比图 - 复杂概念用动画分步拆解的静态版呈现 设计原则: - 一页一个概念,不堆砌 - 用类比解释术语(比如"Attention就像人类阅读时的注意力聚焦") - 公式能不出现就不出现,用可视化代替 这份PPT要让完全不懂AI的人也能看懂Transformer是什么。

Lovart 疯狂思考,25 页 PPT 生成好了。

逆天。

25 页,一页不少。

深蓝背景,橙色强调,和我要求的一模一样。

从 RNN 的困境讲到 Self-Attention 的原理,再到 GPT、BERT 的诞生。

逻辑清晰,层层递进。

点开一页看看。

这页讲 Self-Attention,Query、Key、Value 的概念都是可视化拆解。

对 PPT 里的文字不满意?

用前面提到的「Text Edit」直接改。

比如这页全是英文,我想换成中文。

逐个替换,点击应用修改

搞定。

配图不对?

用「Touch Edit」指哪改哪。

比如这页右上角的大脑图标,我想换成芯片。

按住Cmd点击选中它,输入提示词。

把这个大脑图标换成一个发光的芯片图标,保持相同的青色风格。

大脑完美替换成了芯片,其他元素一点没变。

想替换背景?

用「Edit Elements」一键拆分图层。

比如这页「MODERN AI EQUATION」,有标题、图标、背景。

选中它,点击顶部的编辑元素

整页 PPT 被拆成独立图层。

文字是文字,背景是背景。

单独编辑,互不干扰。

划重点,这可是一份 25 页的 PPT。

强如谷歌 NotebookLM,最多也只能生成 15 页。

最后,点击顶部标题栏,还能导出 PPTX 或 PDF 格式。

最关键的是,我开通了 Lovart 会员,生成这份 PPT,0 积分消耗。

太爽了。

划重点:活动依然还在,订阅 Basic 及以上,Nano Banana Pro0 积分爽用一整年。

最近还新加了订阅 Pro 及以上,GPT Image 1.5也是 0 积分用一整年。

12 月 20 日截止,有需要的上车抓紧。


结尾

三轮下来,谷歌Nano Banana Pro赢了两轮半。

精准编辑,小胜。

套图一致性,完胜。

中文渲染,独一档。

GPT Image 1.5不是不行,英文场景表现不错,速度也快了不少。

但面对大香蕉,还差点意思。

两个都想试试?

目前能同时用上它们的地方,就「Lovart」。


我是木易,一个专注 AI 领域的技术产品经理,国内 Top2 本科 + 美国 Top10 CS 硕士。

相信 AI 是普通人的“外挂”,致力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用 AI 为你的未来加速。


精选推荐

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 8:43:12

魏牌蓝山深陷仪表台“裂缝门”:三代车型全中招,质量管控遭质疑

【文/深度评车&财经三剑客】近日,长城汽车旗下的魏牌蓝山系列车型深陷“裂缝门”泥潭,从2023年初代车型到尚未上市的2026款展车,无一幸免地被曝出仪表台装饰板开裂问题,这一系列事件如同巨石投入平静湖面,激起车主…

作者头像 李华
网站建设 2026/4/28 1:27:04

Python 科学计算有哪些提高运算速度的技巧

VBA不会完全被Python取代、但Python在自动化、数据分析与跨平台开发等方面的优势使其越来越受欢迎、两者将长期并存且各具优势。 Python以其易于学习的语法、强大的开源生态系统和跨平台支持,逐渐成为自动化和数据分析领域的主流工具。然而,VBA依旧在Exc…

作者头像 李华
网站建设 2026/5/1 6:18:27

Doris安装 FE

好的,我们来详细说明如何安装 Apache Doris 的前端(FE)节点。FE 负责元数据管理、集群管理、查询解析和规划等任务。以下是安装步骤: 编辑 FE 配置文件 apache-doris/fe/conf/fe.conf,修改以下参数: ## 指定 Java 环境 JAVA_HOME=/home/doris/jdk # 指定 FE 监听 IP 的…

作者头像 李华
网站建设 2026/4/30 7:39:00

Android 14.0 framework监听某个app启动获取应用使用时长功能实现

1.前言 在进行14.0的系统定制开发中,在某些app的定制过程中,需要知道某个app的启动时候然后获取 应用使用时长的功能,所以就需要监听某个app的启动后就获取使用时长,需要在Activity的生命周期中来实现监听功能 2.frameworks监听…

作者头像 李华
网站建设 2026/5/1 6:13:26

深度学习框架目标检测算法YOLOV8预训练模型训练海上落水人员及障碍物数据集建立基于深度学习YOLOV8海上落水人员检测系统 海上搜救无人机 - 智慧海事监控平台

海上落水人员及障碍物数据集,有500多张并已经标注好了txt格式。已经划分hao训练集和验证集,可直接训练,【来源自建】 2类【溺水人员,障碍物】11海上落水人员及障碍物检测数据集 的完整 YOLOv8 训练与检测系统方案,包含…

作者头像 李华
网站建设 2026/5/1 6:13:45

springboot美容院管理系统(11523)

有需要的同学,源代码和配套文档领取,加文章最下方的名片哦 一、项目演示 项目演示视频 二、资料介绍 完整源代码(前后端源代码SQL脚本)配套文档(LWPPT开题报告)远程调试控屏包运行 三、技术介绍 Java…

作者头像 李华