全免费！GPT-5.2、Claude 4.5、Gemini 3 随便用，这个神仙平台杀疯了-编程实验室

有这么一个神仙平台。

大厂把它当成新模型的「试炼场」。DeepSeek、OpenAI、谷歌，都曾在这里秘密测试。

普通用户可以在这里薅羊毛。

你可以免费体验GPT-5.2、Gemini 3 Pro、Claude Opus 4.5、Grok 4.1，还有 DeepSeek、智谱、MiniMax 这些国产大佬。

图像模型，可以免费用Nano Banana Pro、GPT-Image-1.5和FLUX 2。

两周前，这个平台刚完成 1.5 亿美元 A 轮融资，估值 17 亿美元，成了独角兽。

从伯克利两个博士生的校园项目，到 17 亿美元，用了不到三年时间。

昨天，它又上线了 Video Arena 网页版。

15 个顶级视频模型免费玩，Veo 3.1、Sora 2、可灵 2.6 Pro、Seedance v1.5 Pro、Wan 2.5、Hailuo 2.3，全都有。

它就是 LMArena，lmarena.ai。

LMArena 不测跑分，只测「真人偏好」。

你输入一个问题，系统随机分配两个匿名模型回答。你不知道谁是谁，只能凭回答质量投票选出更好的那个。投票后才揭晓身份。

就像开盲盒。

600 万次真人投票累积下来，平台用类似国际象棋 Elo 评分系统计算排名。赢一场加分，输一场扣分，最终形成大模型榜单。

没有标准化试卷，题目来自全球 150 个国家、500 万月活用户的真实提问。

跑分可以刷榜，让模型提前背答案。但真人投票，很难作弊。

所以大厂都认这个榜。

OpenAI、谷歌、Anthropic、xAI，新模型发布前都会先送测 LMArena。

LMArena 有个传统，新模型发布前，厂商会取个代号匿名测试。

DeepSeek R1正式发布前几个月就在这里偷跑了。

OpenAI 的GPT-5代号「summit」，谷歌Gemini 2.5 Flash Image代号「nano-banana」，后者曾经红极一时，登顶图像生成和编辑榜榜首。

这个平台 2023 年还只是伯克利两个博士生的校园项目，叫 Chatbot Arena。顾问是 Ion Stoica，Databricks 联合创始人。

2025 年 5 月商业化，拿了 a16z 领投的 1 亿美元种子轮。

8 个月后又完成 1.5 亿美元 A 轮，估值 17 亿，成了独角兽。

现在年化收入超 3000 万美元，靠企业付费评测养活。测试和公开榜单对普通用户免费。

LMArena 最初只有文本对话一个赛道，现在已经扩展到八个。

想聊天，有Gemini 3 Pro、GPT-5.2、Claude Opus 4.5、Grok 4.1，还有DeepSeek R1、GLM-4.7。

谷歌目前霸占着 Text Arena 的榜首。

想让 AI 看图说话，Vision Arena 里谷歌同样遥遥领先。

想写代码，Code Arena（曾叫 WebDev Arena）可以一键生成前端页面让你打分。

Claude Opus 4.5稳居第一，Anthropic 在编程这个赛道杀疯了。

想生成图片，Text-to-Image Arena 累计超 420 万票，GPT-Image-1.5、FLUX 2、Ideogram 3都能免费用。国产的腾讯Hunyuan Image 3.0和字节Seedream 4.5也榜上有名。

想修图，Image Edit Arena 里 OpenAI 刚反超谷歌拿下榜首。谷歌的Nano Banana Pro屈居第二，累计 50 万票。

想生成视频，昨天刚上线的 Video Arena 有 15 个顶级模型，Sora 2 Pro和Veo 3.1并列第一。

这些平时要付费的模型，在 LMArena 上全免费。

那么，怎么用？

打开lmarena.ai，直接输入问题，你甚至都不用注册。

默认是 Battle 模式。

你输入问题，系统随机分配两个匿名模型回答，你按照结果投票，投完才揭晓背后的模型。

划重点，这个模式有机会遇到还没发布的神秘模型。比如谷歌即将发布的Gemini 3 Flash Image，也就是大香蕉Nano Banana Pro的弟弟。

如果你想指定模型对比，点击左上角的「Side-by-Side」，手动选两个模型 PK。

比如想看Claude Opus 4.5和GPT-5.2谁更强，直接选了对比。

如果只想正常聊天不投票，选「Direct Chat」，挑一个模型用。

想生成图像或修图，点输入框下方的「图像」按钮，输入提示词或者上传图片。

想生成视频，访问lmarena.ai/video，输入提示词就能生成，视频可以下载。

注意，需要登录才能玩视频生成，注册免费。

说完优点，再泼一泼冷水。

LMArena 的本职工作是收集投票数据做排行榜，不是生产力工具。

所以，白嫖只是顺便。

用 Battle 模式，每轮对话后必须投票，不能跳过。

模型响应速度有时比官方慢。频繁使用会触发限制。

时不时还可能弹人机验证。

但白嫖还要啥自行车。

600 万次真人投票，骗不了人。

我是木易，Top2 + 美国 Top10 CS 硕，现在是 AI 产品经理。
关注「AI信息Gap」，让 AI 成为你的外挂。

AI视频生成工具本地部署探险指南：从虚拟角色创建到视频生成的全流程解析

AI视频生成工具本地部署探险指南：从虚拟角色创建到视频生成的全流程解析【免费下载链接】HeyGem.ai 项目地址: https://gitcode.com/GitHub_Trending/he/HeyGem.ai 在数字化时代，AI视频生成技术正逐渐改变内容创作的方式。本文将带你探索AI视频…

李华

Sambert情感控制功能实测：喜怒哀乐语音风格一键切换教程

Sambert情感控制功能实测：喜怒哀乐语音风格一键切换教程 1. 能听懂情绪的AI语音？这次真的做到了你有没有想过，一段文字不仅能被读出来，还能带着“情绪”说出来？比如同样一句话：“今天天气不错”&#xf…

李华

为什么GPEN推理总失败？CUDA 12.4环境适配教程是关键

为什么GPEN推理总失败？CUDA 12.4环境适配教程是关键你是不是也遇到过这种情况：兴冲冲地部署了GPEN人像修复模型，结果一运行就报错——CUDA不兼容、依赖冲突、环境缺失……明明代码没动，别人能跑通，自己却卡在第一步&…

李华

run.sh脚本启动失败？unet镜像容器运行错误修复实战

run.sh脚本启动失败？unet镜像容器运行错误修复实战 1. 问题现场还原：为什么run.sh总在容器里“罢工” 你兴冲冲拉取了 unet person image cartoon compound 镜像，执行 docker run -p 7860:7860 -it <镜像ID> 启动容器，界面…

李华

NewBie-image-Exp0.1医疗可视化案例：虚拟助手形象生成部署实践

NewBie-image-Exp0.1医疗可视化案例：虚拟助手形象生成部署实践 1. 引言：当AI遇上医疗视觉设计你有没有想过，医院里的导诊机器人、健康App里的虚拟顾问，甚至远程问诊中的数字医生，它们的形象是怎么来的？传…

李华

MinerU能否替代传统OCR？端到端识别精度对比分析

MinerU能否替代传统OCR？端到端识别精度对比分析 PDF文档的结构化提取，长期被视作AI落地中“看似简单、实则棘手”的典型场景。你是否也经历过：花半小时手动复制粘贴论文中的公式，结果发现上下标全乱了；把一份带三栏排…

李华