一文讲透AI大模型相关的专业名词-编程实验室

一.LLM

1.全称Large Language Model（大语言模型，简称“大模型”）

LLM：Large Language Model（大语言模型，简称“大模型”）。

基本上，现在所有的大模型都是基于Transformer这套架构训练出来的。
说白了，大模型的底层引擎就是“Transformer”
“Transformer”是由Google发明（点火者），但是真正推广者是OpenAI。

2.我们平时见到的大模型有哪些？

ChatGPT (OpenAI)
通义千问 (阿里)
文心一言 (百度)
豆包 (字节跳动)
Kimi (月之暗面)
DeepSeek (深度求索)
等等

3.大模型是怎么工作的？

本质就是一个文字接龙游戏

举例

当用户问“鸿剑的文章怎么样”？然后大模型对此做出思考。
一会，思考的结果是“特别”，发送给用户。然后再把“特别”这个词抓回去，再回答“的”拼接到“特别”后面，发送给用户，然后再抓回去，再思考出“棒”，拼接到“特别的”后面，答案是“特别的棒”，然后再抓回去。发现该问题回答完了，就会输出一个结束标志（图中的绿色对钩）。
说白了，本质就是一个词一个词往外蹦的，所以我们用deepseek时，也能明显发现大模型给答案时，就是一个一个词的生成的（也叫流式生成），本质原因就是因为这个大模型的生成特点，就是文字接龙游戏。

二.Token

解析：
大模型本质上是一个庞大的数学函数，里面跑的全是矩阵运算。因此大模型接收的只能是数字，输出的也只能是数字。说白了大模型压根不认识人类写的文字。
所以人类要和大模型沟通，需要一个中间人（翻译官），即Tokenizer。它负责编码（将文字转为数字）和解码（将数字转为文字）。
所以Token是大模型处理文本的基本单位。
而Token不能说对应一个文字、或一个英文单词，而是具体分情况，但是大致比例如下图所示。

芯片测试提速秘籍：手把手教你配置MBIST BAP直接访问接口（含时序与时钟方案详解）

芯片测试提速秘籍：MBIST BAP直接访问接口的深度配置指南在芯片量产测试环节，时间就是金钱。传统MBIST测试中，通过IJTAG网络逐位串行配置控制器的模式，已经成为测试效率的瓶颈。想象一下，一颗拥有数百个嵌入式存储单元…

李华

除了北斗和风云，还有哪些中国卫星在3.6万公里高空默默服务？一份实用卫星功能指南

中国高轨卫星的隐秘力量：从太空守护日常的科技英雄当我们仰望星空时，很少有人会意识到3.6万公里高空的中国卫星群正在悄然改变着我们的生活。这些太空基础设施如同无形的守护者，在通信、气象、灾害预警等关键领域发挥着不可替代的作用。不同…

李华

多智能体强化学习实现四足机器人协同跳跃

1. 项目概述在四足机器人领域，单体的运动能力始终受到物理尺寸、驱动功率和能量效率等固有因素的限制。香港大学ARC实验室与EngineAI团队提出的"Co-jump"项目，通过多智能体强化学习(MARL)技术，让两台四足机器人无需外部通信即可实…

李华

企业如何通过Taotoken实现多模型API的统一管理与访问控制

企业如何通过Taotoken实现多模型API的统一管理与访问控制 1. 多模型统一接入的技术挑战在企业级AI应用开发中，技术团队常面临多模型厂商API的接入与管理难题。不同厂商的API协议差异、密钥分发机制分散、用量监控不透明等问题，会导致运维成本呈指数级…

李华

别再让SAM在医学图像上‘水土不服’了：手把手教你用Medical-SAM-Adapter搞定皮肤病灶分割

医学图像分割新范式：如何用Medical-SAM-Adapter突破皮肤病灶识别瓶颈当通用大模型遇上专业医学图像分析，水土不服的现象屡见不鲜。Segment Anything Model（SAM）作为计算机视觉领域的颠覆性成果，在自然图像分割中表现出…

李华

ViGEmBus虚拟手柄驱动：如何在Windows上实现完美游戏控制器兼容性？

ViGEmBus虚拟手柄驱动：如何在Windows上实现完美游戏控制器兼容性？ 【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus ViGEmBus是一款Win…

李华