news 2026/6/15 21:45:16

OpenAI 突然开源了一个“只有 0.4B 参数”的模型——

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
OpenAI 突然开源了一个“只有 0.4B 参数”的模型——

OpenAI 突然开源了一个“只有 0.4B 参数”的模型——

但它的 99.9% 权重都是 0。

是的,你没看错。
这个叫Circuit Sparsity的新模型,仅靠 0.1% 的活跃连接,就完成了传统稠密模型需要数十亿参数才能做的任务。

更惊人的是:

  • 它的推理路径像电路图一样清晰——每一条激活通路都可追溯;
  • 移除任意一个关键节点,任务立刻失效,能力与结构强绑定
  • 推理速度极快,资源消耗近乎为零,特别适合边缘设备或高并发场景。

OpenAI 说,这是他们探索“可解释 AI”的关键一步。

但作为开发者,我看到的却是另一个现实:

这种新型稀疏架构,和 GPT-5、Gemini、Claude、Mistral、GLM……完全不是一个物种。

它的 API 格式不同,token 计算逻辑不同,甚至“输入-输出”行为都更接近符号系统而非概率生成。

如果你现在想试试它?恭喜,你又要写一套全新的适配层。


而我?我只改了一行配置。

因为在Gateone.AI,Circuit Sparsity 从上线第一天起,就被纳入了统一智能路由体系

Python

编辑

# 切换模型?只需改 model 名 response = gateone.chat.completions.create( model="openai/circuit-sparsity", # 或 "gpt-5.2", "gemini-3-deepthink", "glm-4-6v" messages=[{"role": "user", "content": "解释量子隧穿效应"}] )

自动处理稀疏模型的特殊输入格式—— 无需研究其“电路激活协议”;
统一输出结构—— 无论底层是稠密、MoE、还是稀疏架构,返回格式一致;
A/B 测试超简单—— 对比 Circuit Sparsity 的可解释性 vs. GPT-5.2 的流畅性,数据秒出;
成本几乎为零—— 因其极低计算开销,调用费用趋近于免费,Gateone 自动优先调度它用于轻量任务;
未来兼容无忧—— 下次 OpenAI 发布“量子稀疏”或“神经符号混合体”,我们照样无缝接入。


稀疏模型不是替代大模型,而是补齐 AI 工具箱的最后一块拼图。

  • 高风险决策?用 Circuit Sparsity,路径可审计;
  • 实时边缘推理?用它,省电又快;
  • 教学/研究?它是绝佳的“白盒 AI”范例。

但前提是——你得能轻松用上它,而不是被集成复杂度劝退。


Gateone.AI 的使命,从来不是“聚合更多模型”,

而是让每一种 AI 范式,都为你所用,而不为你所累。

无论是 675B 的 Mistral Large 3,
还是 0.4B 的 Circuit Sparsity,
在 Gateone 看来,都是你工具箱里的一把刀——
你只管选,我们负责磨好、递到你手上。


🎁新用户注册即送 $2 体验额度(无需绑卡)
🔬 Circuit Sparsity 已上线 Gateone 平台,支持即时调用与对比实验
🔗 立即体验下一代 AI 范式的自由:https://gateone.ai

当世界在分裂成“稠密派”和“稀疏派”,
我们选择做那个连接所有可能的人

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 13:47:19

Claude Skills全攻略:AI代理的“超能力“,让大模型为你打工

Claude 现已引入 Skills 功能,显著提升了其执行特定任务的能力。Skills 本质上是一个包含指令、脚本和资源的结构化文件夹,Claude 能够根据任务需求动态加载这些资源。 这一机制的核心优势在于按需加载:Claude 仅在检测到当前任务与特定技能相…

作者头像 李华
网站建设 2026/6/15 18:33:56

Linux相关基础

VMware1.下载所需软件,个人学习使用VMware,这里需要注意,下载vmware成功,会在网络里面产生如下图俩个网络,VMnet1对应仅主机模式使用,VMet8个人创建虚拟机时候使用,对应NAT模式。下载好之和&…

作者头像 李华
网站建设 2026/6/15 14:11:00

Python线程与协程:多任务编程进阶指南

一、引言昨天讲了多任务和多进程,今天咱们接着将线程和协程.二、多线程1.线程的概念线程是程序执行的最小单位 , 实际上进程只负责分配资源 , 而利用这些资源执行程序的是线程 , 也就说进程是线程的容器 , 一个进程中最少有一个线程来负责执行程序 。同时线程自己不拥有系统资源…

作者头像 李华
网站建设 2026/6/15 12:37:46

DVWA漏洞靶场实战项目

DVWA漏洞靶场实战项目 一、项目概述 DVWA(Damn Vulnerable Web Application)是一个专门用于安全漏洞学习和测试的PHP/MySQL Web应用。本项目将带你完成DVWA靶场的搭建、配置和漏洞实战演练。 二、环境搭建 1. 准备工作 方案一:使用Docker&…

作者头像 李华
网站建设 2026/6/15 2:57:04

性能优化之分块渲染

在遇到大量数据需要渲染的时候&#xff0c;一次性渲染会阻塞主线程导致页面卡顿&#xff0c;可以用分块渲染提升页面性能&#xff0c;将大量DOM结点的渲染拆分为多个小任务&#xff0c;避免主线程长时间阻塞&#xff0c;减少页面卡顿。<script setup lang"ts">…

作者头像 李华
网站建设 2026/6/15 7:46:59

c++单调数据结构————单调栈,单调队列

目录 一&#xff0c;单调栈 二&#xff0c;单调队列 例题一(单调栈&#xff09;&#xff1a;蓝桥杯官网——百亿富翁 题目描述 输入描述 输出描述 输入输出样例 示例 1 代码详解&#xff1a; 解释&#xff1a;计算 dpl 时 stk 的工作过程 例题二&#xff08;单调队列…

作者头像 李华