news 2026/5/1 5:49:42

租用共绩算力4090实测龙猫图片编辑

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
租用共绩算力4090实测龙猫图片编辑

本人实测发现,本地配备的 16GB 显存显卡无法运行 LongCat-Image(龙猫图片编辑)项目,即便开启 CPU offloading(CPU 卸载)功能缓解显存压力,依然因显存不足导致运行失败。
为此,我在网上寻找共享算力资源,最终选择租用 4090 显卡进行测试,所使用的算力平台为【共绩算力】(官网:https://www.gongjiyun.com/)。

值得一提的是,该平台对个人开发者提供免费算力申请的机会,降低了测试和开发的成本。

该平台创建云主机的流程十分便捷,基础镜像已预装Miniconda等开发必备软件,无需额外配置基础环境,极大节省了前期准备时间。考虑到需妥善保存项目数据,我额外开通了共享存储卷并挂载至云主机。不过结合两次创建云主机的实测体验来看,共享存储卷存在明显短板——读写速度较慢;而云主机自带的本地存储则表现更优,读写效率显著更高,建议大家根据实际需求选择存储方式。

登录云主机后,可直接参照 LongCat-Image 的官方仓库(https://github.com/meituan-longcat/LongCat-Image)执行以下安装步骤:

# 克隆项目仓库(仅拉取main分支) git clone --single-branch --branch main https://github.com/meituan-longcat/LongCat-Image cd LongCat-Image # 创建并激活conda虚拟环境(指定Python 3.10版本) conda create -n longcat-image python=3.10 conda activate longcat-image # 安装项目依赖并以开发模式安装项目 pip install -r requirements.txt python setup.py develop # 配置Hugging Face镜像并下载模型权重 pip install "huggingface_hub[cli]" export HF_ENDPOINT=https://hf-mirror.com huggingface-cli download meituan-longcat/LongCat-Image-Edit --local-dir ./weights/LongCat-Image-Edit

环境配置完成后,运行示例脚本进行图片编辑测试:

python scripts/inference_edit.py

需要说明的是,项目代码中已内置CPU offloading机制,核心代码如下,其作用是将部分模型权重卸载至CPU,以此降低显存占用、避免出现OOM(显存溢出)错误:

pipe.enable_model_cpu_offload()# Offload to CPU to save VRAM (Required ~19 GB); slower but prevents OOMgenerator=torch.Generator("cpu").manual_seed(43)

即便开启了该优化机制,实测运行过程中显卡显存峰值占用仍达约17GB。这也印证了本地16GB显存显卡无法运行的核心原因——显存容量不足;而4090显卡的24GB显存,恰好能满足项目稳定运行的需求。

以下为本次测试的实际效果对比:
demo中编辑前的原图:

经过LongCat-Image编辑实现将“车换成摩托车”后的效果:

从编辑效果来看,整体表现十分出色:不仅成功实现了“车换摩托车”的核心需求,细节处理也相当到位,就连阴影部分都还原得自然逼真,没有出现明显的违和感。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/30 11:46:40

EmotiVoice如何实现跨语言情感迁移语音合成?

EmotiVoice如何实现跨语言情感迁移语音合成? 在虚拟助手开始对你“冷笑”、游戏角色用你母亲的声音愤怒咆哮的时代,我们不得不承认:语音合成早已不再是机械朗读那么简单。用户不再满足于“能说话”,而是要求它“会共情”——要能高…

作者头像 李华
网站建设 2026/4/30 12:41:24

EmotiVoice在广播剧制作中的效率提升实测

EmotiVoice在广播剧制作中的效率提升实测 在音频内容创作领域,尤其是广播剧这类高度依赖角色演绎与情感表达的媒介中,传统制作流程正面临前所未有的挑战。一场高质量的广播剧往往需要多位专业配音演员协同录制,反复调试语气、节奏和情绪表达&…

作者头像 李华
网站建设 2026/4/30 0:32:40

如何用EmotiVoice生成新闻播报风格语音?

如何用 EmotiVoice 生成新闻播报风格语音? 在信息爆炸的时代,每天有成百上千条新闻等待被传递。传统人工配音不仅耗时费力,还难以满足实时性与个性化需求。而当AI开始接管内容生产链条的末端——从写稿到播报——我们正站在一个自动化传播的…

作者头像 李华
网站建设 2026/4/19 17:55:04

语音合成服务计费模型设计:按token还是按时长?

语音合成服务计费模型设计:按token还是按时长? 在构建一个面向企业与个人开发者的语音合成服务平台时,我们常常会遇到这样一个看似简单却极为关键的问题:用户到底该为“说了什么”付费,还是为“说了多久”买单&#xf…

作者头像 李华
网站建设 2026/4/20 17:40:02

开源记账系统MoneyNote:3步搭建你的个人财务管家

开源记账系统MoneyNote:3步搭建你的个人财务管家 【免费下载链接】moneynote-api 开源免费的个人记账解决方案 项目地址: https://gitcode.com/gh_mirrors/mo/moneynote-api 在财务管理日益重要的今天,如何找到一款既安全又实用的记账工具&#x…

作者头像 李华