文章目录
- 前言
- 主界面:终于不用在菜单里捉迷藏了
- 自动任务:再也不用写该死的YAML了
- 技能广场:终于有中文能用的技能了
- 此电脑:AI终于能帮我找文件了
- Marvis办公室:多Agent协同,终于不用自己手忙脚乱了
- AI模式切换:效率和隐私,终于可以兼得了
- 本地模型支持:终于不用自己下权重了
- 与OpenClaw对比:各有千秋
- 常见问题解答
P.S. 目前国内还是很缺AI人才的,希望更多人能真正加入到AI行业,共同促进行业进步,增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow,教程通俗易懂,高中生都能看懂,还有各种段子风趣幽默,从深度学习基础原理到各领域实战应用都有讲解,我22年的AI积累全在里面了。注意,教程仅限真正想入门AI的朋友,否则看看零散的博文就够了。
前言
兄弟们,先问个扎心的问题,你们为了用个本地AI助手,都折腾过多少回?我先说,我为了装OpenClaw,重装了三次WSL2,改了五次防火墙配置,熬了两个通宵,最后它给我来了一句“网络连接失败”。那一刻我真想把电脑从窗户扔出去,然后转行去卖煎饼果子。
WSL2这东西,就跟你家那个不靠谱的亲戚似的,平时看着好好的,一到关键时刻就掉链子。你让它跑个模型,它能给你卡成PPT;你让它访问本地文件,它能给你权限报错;你重启一下,它能给你把整个环境搞崩。我身边至少有十个兄弟,因为折腾OpenClaw折腾到心态爆炸,最后放弃了本地AI,乖乖回去用云端。
结果就在昨天,我刷到腾讯出了个Marvis,号称原生Windows客户端,不用WSL2,不用搭网络,不用配防火墙,打开就能用。我当时第一反应是:又来一个割韭菜的?但抱着“我不入地狱谁入地狱”的心态,我还是花了一下午时间,把它从头到尾测了一遍。
测完之后我只能说:腾讯这次,居然没翻车。当然,坑还是有的,而且不少,我踩了一箩筐,今天就全给你们抖出来。
主界面:终于不用在菜单里捉迷藏了
打开Marvis的那一刻,我差点哭了。不是因为感动,是因为终于有个AI助手的界面,是给正常人设计的了。
之前用的那些本地AI助手,界面跟密码学教材似的,找个功能要翻三层菜单,每个按钮的名字都取得跟天书一样。你想新建个对话,得点“会话管理”→“创建新会话”→“选择模型”→“确认配置”,一套流程走下来,你都忘了自己要问啥了。
Marvis就不一样了,左边导航栏清清楚楚列着所有核心功能:搜索、新建对话、自动任务、技能广场、本地知识库、应用、文档、图库、此电脑。就跟微信的侧边栏似的,傻子都能找到。
顶部直接给你写着“本地模型已就绪,当前是隐私模式,请输入任务,交给我来完成”。不用你自己去查日志,不用你去终端看模型有没有加载成功,不用你去任务管理器看GPU占用率,它直接告诉你“我准备好了”。
就这一点,Marvis就已经赢了OpenClaw十条街。OpenClaw跑没跑起来,你得盯着终端输出看半小时,有时候卡着不动,你都不知道是模型没加载完,还是网络炸了,还是你刚才写的YAML又多了一个空格。
底部还贴心地给了六个常用场景的例子:航班特价速查、白皮书秒变PPT、机器人概念核心标的盘点、翻出电脑里的旅行回忆、本地发票整理&报销。对于新用户来说,直接照着抄指令就行,不用自己琢磨怎么写Prompt。
自动任务:再也不用写该死的YAML了
我敢说,90%的人放弃OpenClaw,都是因为写YAML。
YAML这个语言,发明出来就是为了折磨程序员的。别的语言写错了会报错,YAML写错了它不报错,它就是不工作,让你自己猜哪里错了。我曾经为了一个定时任务的配置,调试了三个小时,最后发现是多了一个空格。那一刻我明白了,为什么程序员的头发都掉光了,不是因为写代码,是因为写YAML。
Marvis的自动任务功能,直接把YAML给干没了。它是纯图形化界面,你点一下“新建自动任务”,选个时间,输个指令,点保存,完事。
比如你想每天早上9点看今日运势,就选“每天9:00”,输入“结合我的生日2021年12月18日15:00生成今日每日运势,写明整体运势好坏、今日宜做事项、避忌事项、专属幸运颜色”。
比如你想每天晚上8点看股票行情,就选“每天20:00”,输入“帮我在同花顺里看下机器人/人形机器人概念板块,查看板块内个股的涨跌、市值、PE等关键指标,总结成报告”。
不用写一行代码,不用管什么cron表达式,不用管什么缩进,点几下鼠标就搞定了。对于我这种YAML过敏的人来说,这简直是福音。
当然,它也有个坑。这个功能需要你保持电脑开机并运行客户端,关机、休眠或者退出客户端的时候,任务就无法执行。我第一天设置了,结果晚上关电脑睡觉,第二天起来啥也没有,白高兴一场。
技能广场:终于有中文能用的技能了
OpenClaw的技能库,说好听点是国际化,说难听点就是完全不管中国用户。
我之前想找个能整理国内发票的技能,翻了100页都找不到,好不容易找到一个,还是个老外写的,只能识别美国的发票。我想找个能查国内天气的技能,结果它给我返回的是华氏度,还得我自己换算。我想找个能生成小红书配图的技能,结果它生成的图全是老外的脸,根本没法用。
Marvis的技能广场,终于全是中文的了。它把技能分成了办公效率、休闲娱乐、生活服务、内容创作、理财投资、学术研究六大类,每个分类下面都是我们平时真的会用到的技能。
热门的技能有:
- 产品经理一站搭子:从拉需求到画原型,6个Skill全包
- GitHub热榜TOP10:每天自动更新全球最火的开源项目
- 把你装进AI里:数字分身、AI永生,听起来挺玄乎,实际玩起来还挺有意思
- 大佬围炉夜话:让乔布斯、马斯克、芒格、费曼给你出主意
- 微信读书AI助手:自动总结你看过的书,给你推荐新书
安装也特别简单,点一下“添加”就完事了,不用自己克隆仓库,不用自己装依赖,不用自己改配置。
不过我也要吐槽一下,有些技能看着牛逼,实际用起来跟智障似的。比如那个“大佬围炉夜话”,我花了两千Token,问马斯克怎么应对中年危机,它给我回了一句“保持好奇心,不断学习”。我要是能保持好奇心不断学习,我还会有中年危机吗?
我问芒格怎么理财,它说“不要把鸡蛋放在一个篮子里”。这还用你说?我奶奶都知道。我问费曼怎么教孩子学物理,它说“用简单的语言解释复杂的概念”。合着我花了这么多Token,就听了三句鸡汤?
此电脑:AI终于能帮我找文件了
这个功能,是我觉得Marvis最牛逼的功能,没有之一。
兄弟们,你们有没有过这种经历:老板让你找三个月前的一份合同,你打开资源管理器,一个个文件夹翻,翻了半小时,满头大汗,最后还是没找到。然后老板过来拍着你的肩膀说:“小伙子,工作要细心啊。”
我有过,而且不止一次。每次找文件,我都想把电脑砸了。
Marvis解决了这个问题。它可以直接访问你的电脑文件系统,左边导航栏清晰显示所有磁盘分区:本地磁盘(C:)、AI训练(D:)、home data(E:)、软件(F:)、all_works(G:)。
你只需用自然语言下达指令,它就能自动完成。比如:
- “帮我找到最近三个月的发票”
- “把桌面文件按类型整理到不同的文件夹”
- “搜索所有包含‘人工智能’关键词的Word文档”
- “把D盘里的所有图片压缩成一个ZIP包”
几秒钟就能搞定,比你自己找快一百倍。我昨天让它帮我找去年的一份项目报告,它两秒钟就给我找出来了,我当时差点给它磕一个。
不过这里有个天大的坑,你们一定要注意。Marvis能访问你所有的文件,包括你藏在D盘深处的“学习资料”。
我上次让它帮我找“工作文档”,结果它把我D盘里的“学习资料”也搜出来了,还贴心地问我“要不要整理成一个文件夹方便查看”。当时我旁边坐着我的同事,我差点当场去世。
所以兄弟们,用这个功能的时候,一定要把你的“学习资料”藏好,最好加密。不然哪天它把你的学习资料整理成PPT发给老板,你就可以直接收拾东西走人了。
Marvis办公室:多Agent协同,终于不用自己手忙脚乱了
写代码的兄弟们都懂,写一个功能,你得同时开N个软件:浏览器查资料,终端跑代码,VS Code写代码,Word写注释,Excel做测试用例。手忙脚乱,跟个八爪鱼似的。
Marvis采用了多Agent架构,可以同时调度多个AI代理协同工作:
- App Agent:操作应用程序
- File Agent:管理本地文件
- Browser Agent:浏览网页
- Computer Agent:控制系统设置
你在“办公室”里,可以实时查看每个Agent的工作状态、对话明细和Token消耗。每个Agent的执行步骤一目了然,就跟看监控似的。
比如你让它写一个登录接口,它会让Browser Agent去查最新的Spring Security文档,让File Agent去创建对应的Java文件,让App Agent打开VS Code,然后把代码写进去。你在旁边看着就行,不用自己动手。
不过它也有个坑,有时候Agent会打架。我上次让它整理桌面,File Agent说要把文件按类型分类,App Agent说要把快捷方式放左边,Computer Agent说要把回收站图标隐藏。三个Agent吵了半小时,最后桌面比原来更乱了。
AI模式切换:效率和隐私,终于可以兼得了
之前用AI助手,一直有个两难的问题:用云端AI,不敢传敏感文件,怕泄露;用本地AI,又卡得要死,写个代码要等半天。
Marvis解决了这个问题,它提供两种AI模式,可以随时切换:
| 模式 | 效率模式(推荐) | 隐私模式(本地模式) |
|---|---|---|
| 模型位置 | 云端 | 本机 |
| 数据流向 | 上传云端 | 本地处理 |
| Token消耗 | 消耗云端Token | 不消耗云端Token |
| 适用场景 | 需要更强算力 | 注重隐私保护 |
| 推荐人群 | 绝大多数用户 | 对数据安全有要求的用户 |
效率模式融合了端侧的极致响应与云端的强大算力,效果更好,速度更快,是绝大多数用户的首选。隐私模式专为保密场景设计,使用本地模型,全部文件均在本地处理和分析,数据不出本机。
不过这里有个最大的坑,也是最多人吐槽的地方:官方说本地模式不消耗Token,结果实际用起来,Token还是在跳。
我昨天切换到隐私模式,用了一天,发现办公室面板上的Token统计一直在跳动。我当时就火了,觉得被忽悠了,差点就把它卸载了。
后来我仔细研究了一下,才搞明白:本地模型推理本身确实不消耗云端Token,但Marvis客户端的一些基础服务,比如技能加载、搜索索引、自动任务调度等,仍然走的是云端接口,因此会消耗少量Token。
不过也不是完全没用,我实测下来,日常使用一天大概能省4-5万Token。对于免费用户来说,这已经非常可观了,相当于每天白嫖一杯奶茶钱。
本地模型支持:终于不用自己下权重了
之前装本地模型,简直是一场噩梦。你得自己去Hugging Face下权重,几百G的文件,下到一半网络断了,还得重新下。下完之后还得配环境,装CUDA,装cuDNN,搞半天跑不起来,最后发现是显卡不够。
Marvis用Ollama管理本地模型,支持几乎所有主流的开源模型:
- Qwen系列:Qwen3.6(96K/64K/128K上下文)、Qwen3.5(122B/35B)、Qwen3(32B/30B)等
- Gemma系列:Gemma4(31B)
- GLM系列:GLM-4.7-Flash、GLM-OCR
- DeepSeek系列:DeepSeek-R1(32B、8B)
- Nemotron系列:Nemotron3(33B)
模型大小从200MB到80GB不等,你可以根据自己的硬件配置自由选择。安装也特别简单,点一下就开始下载,自动适配你的显卡,不用你做任何配置。
我个人推荐Qwen3.6系列,它在性能和资源占用之间取得了非常好的平衡。我用RTX 5090跑Qwen3.6-35B,速度跟云端差不多,而且效果也非常好。
与OpenClaw对比:各有千秋
最后,我来给大家做个总结,Marvis和OpenClaw到底哪个更好。
其实它们的核心功能几乎完全一致:文件操作、终端执行、浏览器控制、代码生成、任务委派、定时任务、技能扩展,这些都有。
Marvis的优势:
- 原生Windows客户端,无需WSL2
- 图形界面,无需配置YAML
- 本地模式数据不出本机,隐私性更强
- 国内可用,网络稳定
- 中文技能多,更适合中国用户
OpenClaw的优势:
- 开源,社区更活跃,更新迭代更快
- 支持更多模型提供商,选择更灵活
- 自定义程度更高,适合技术极客
所以结论很简单:如果你追求开箱即用、稳定可靠的AI助手,不想折腾,那Marvis是更好的选择。如果你是技术极客,喜欢折腾,想要高度自定义,那OpenClaw可能更适合你。
常见问题解答
最后,我整理了几个大家最关心的问题,统一回答一下:
本地模式需要安装什么模型?
通过Ollama安装即可,推荐Qwen3.6系列(96K/64K/128K上下文)或Qwen3.5-35B-32K,性能和资源占用平衡。本地模式需要联网吗?
不需要。本地模式下模型推理不依赖网络,但技能加载、搜索索引等基础服务可能需要联网。本地模式消耗Token吗?
模型推理不消耗云端Token,但客户端基础服务(技能加载、搜索索引、自动任务调度等)可能消耗少量Token。Marvis和OpenClaw哪个更好?
看需求。要开箱即用选Marvis,要折腾配置选OpenClaw。
P.S. 目前国内还是很缺AI人才的,希望更多人能真正加入到AI行业,共同促进行业进步,增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow,教程通俗易懂,高中生都能看懂,还有各种段子风趣幽默,从深度学习基础原理到各领域实战应用都有讲解,我22年的AI积累全在里面了。注意,教程仅限真正想入门AI的朋友,否则看看零散的博文就够了。