news 2026/5/18 23:16:47

AI小白必看!从零到一,手把手拆解核心概念与术语,看这篇就够了!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI小白必看!从零到一,手把手拆解核心概念与术语,看这篇就够了!

如果你刚接触AI,会发现随便看一篇文章就冒出一堆名词:Token、Context、Agent、幻觉……每个都认识,但放一起就懵了。别慌,这篇文章就是来救场的。

🏗️ 第一部分:模型基础

LLM Large Language Model 核心

LLM就是"大语言模型"。"大"指的是参数量巨大——通常几十亿到上千亿个参数。"语言模型"的意思是:AI的核心能力是预测下一个词出现的概率

💡 举个例子:输入"今天天气",AI会计算下一个词最可能是"很好"“不错"还是"糟糕”,然后选概率最高的输出。它不是在思考,而是在算概率。

参数 / 权重 Parameters / Weights

参数是AI在训练过程中学到的"经验值"。AI看过海量文本后,会调整内部无数个数字,这些数字就是参数。参数越多,AI能处理的问题越复杂,表现越"聪明"。

⚠️ 参数量大 ≠ AI真正"理解"了世界,它只是在拟合海量数据中的统计规律。

训练 vs 推理 Training vs Inference

训练(Training)= AI在学习阶段,像学生上课。
推理(Inference)= AI在应用阶段,像学生考试。训练需要大量数据和算力,是"苦功";推理是你实际用AI时,它调用学到的经验来回答你的过程。

微调 Fine-tuning

通用LLM就像一个什么都学过的全科生,但如果想让它专攻某个领域——比如医疗、法律——就需要微调:用特定领域的数据再训练一次,让AI成为"专才"。

🔤 第二部分:AI的语言

Token 必懂

Token是AI处理文本的基本单位。AI不像人一样按"字"或"词"理解文字,它把文本切分成一个个Token。Token可能是一个字、一个词、一个标点,甚至是一段空格。

💡 中文"你好"可能被切成2个Token,“人工智能"可能切成3个Token。英文"learning"可能切成"learn"和”##ing"两个Token。这也是为什么AI处理中文更"费Token"。

Tokenizer 分词器

Tokenizer就是负责把文本切成Token的工具。不同的AI模型可能用不同的分词器,切法不同,效率也不同。

Token上限 Context Limit 重要

也叫上下文窗口大小,指的是AI单次能处理的最大Token数量。比如上下文窗口是128K Tokens,意思是每次对话最多能接收约10万字。超过这个范围,前面的内容就会被"忘掉"。

⚠️ 这就是为什么很长的对话会出现"AI失忆"的情况——不是它故意,是真的装不下了。

多模态 Multimodal

多模态指的是AI能同时处理多种类型的数据:文字、图片、语音、视频。一个多模态模型看到照片能描述内容,听到语音能转成文字,看到视频能总结情节。

🧠 第三部分:AI的记忆与对话

上下文 Context 核心

上下文是AI在一次对话中能"记住"的所有内容——你说过的话、AI回复过的话,都存在这个上下文里。AI生成回复时,是基于上下文里的一切信息来组织回答。

💡 你跟AI说得越详细、越清楚,它理解得就越准确。但上下文有容量限制,一旦满了,AI就会忘记最早的信息。

Session 会话

Session指的是一次完整的对话过程。每次你开启一个新对话,就是开启了一个新Session。不同Session之间通常是隔离的——你在A对话里教AI的东西,B对话里它不记得。

Memory 记忆

Memory是AI保存信息的机制,可以跨Session存在。比如有些AI助手支持"记忆"功能,你告诉它"我住在上海",它会记住,下次对话不用再说。

📌 Context是临时的,Session结束就没了;Memory是长期的,AI会一直记得。

💬 第四部分:提示词艺术

Prompt 提示词 核心

Prompt就是你给AI的指令或问题。想让AI回答得好,Prompt的写法非常重要。同样一个问题,问得好和问得不好,AI给出的答案可能差了一个银河系。

✅ 好的Prompt原则:说清楚你要什么、给出足够的背景信息、明确输出格式。

系统提示词 System Prompt

系统提示词是隐藏在"背后"的指令,用来告诉AI:你是什么角色,有什么行为规范,能做什么不能做什么。

💡 比如写作助手AI,系统提示词可能是"你是一位资深编辑,擅长用简洁有趣的语言帮助用户修改文章。"

用户提示词 User Prompt

用户提示词就是你每次实际输入的内容——你的问题、指令、要求。它直接影响AI这一轮的输出。

Few-shot / Zero-shot 小样本学习

Zero-shot= 不给例子,直接让AI凭本事回答。
Few-shot= 先给几个例子,让AI"找找感觉",再回答问题。

💡 "苹果是fruit,香蕉是fruit,狗是animal。请判断西瓜是fruit还是animal?"AI会模仿格式来回答。Few-shot比Zero-shot效果通常更稳定。

CoT Chain of Thought 思维链

意思是让AI把推理过程一步步写出来,而不是直接给答案。类似你做数学题时写步骤,而不是只写结果。

💡 启用CoT后,AI思考更缜密,复杂推理类问题错误率大大降低。

🎲 第五部分:AI的"随机性"

Temperature 温度

Temperature控制AI输出的"随机性"。

🔥 设得很低(0.1):AI每次都选最高概率的词,回答很稳定但较死板。
🔥 设得很高(1.0):AI更随机地选择词汇,回答更有创意但可能跑偏。

Top-p / Top-k AI选词方式

AI生成每个词的时候,是从词库里选。Top-k是只从概率最高的k个词里选;Top-p是只从累积概率加起来达到p的词里选。两者配合使用效果更好。

频率惩罚 / 存在惩罚 Frequency / Presence Penalty

两个用来"防止AI重复"的参数:

🔹频率惩罚:一个词用得越多,AI越倾向于不再用它
🔹存在惩罚:只要这个词出现过一次,AI就降低再用它的概率

🧩 第六部分:AI的能力扩展

Skills 技能

Skills是AI的"工具箱",每个Skill定义了一套特定的能力和操作方式。比如天气Skill让AI能查天气预报,图像生成Skill让AI能画图。

💡 AI本身不一定会画画,但给它装上图像生成的Skill,它就拥有了这项能力。

Tools / Function Calling 工具调用

Function Calling是AI和外部世界连接的方式。AI可以"召唤"一个函数来执行任务,比如查天气、搜网页、发消息。

🧠 AI是大脑,Tools是手脚。大脑指挥,手脚干活。

RAG Retrieval-Augmented Generation 检索增强生成

AI在回答问题之前,先从一个专属知识库里检索相关信息,再结合这些信息来生成答案。这样AI就能回答涉及私域知识的问题,而不只靠训练时学到的通用知识。

💡 比如问"我们公司去年营收多少",AI需要先检索公司数据库,再用RAG方式生成答案。

知识库 Knowledge Base

存放AI专属知识的地方。可以把文档、手册、制度文件传进去,AI就能基于这些内容回答问题。企业用AI做客服时,知识库就是核心。

Embedding 嵌入向量

把文字转换成一段数字(向量),意思相近的词在向量空间里距离更近。

💡 "狗"和"猫咪"的向量距离,比"狗"和"火车"近得多。AI通过这种数学方式"理解"词语之间的关系。

🚦 第七部分:规则与边界

Rules 规则

用来约束AI行为的明确指令。比如"禁止输出涉及政治的内容"、“所有回复必须用简体中文”。

Constraints 约束

对AI输出的具体限制条件。比如"回复不超过200字"、“必须用列表格式”。

📌 Rules = “不许做什么”;Constraints = “必须怎么做”

Output Limit / Max Tokens 输出上限

AI单次回复的最大Token数。即使上下文窗口很大,AI单次输出的长度也是有限制的。超过这个限制,AI的回答会被截断。

🤖 第八部分:AI的"分身"

Agent 智能体 重要

Agent是AI的"分身",能自主规划、执行一系列动作,而不只是被动回答问题。

🔹 普通AI聊天机器人:你问它答,问完就停。
🔹 Agent被赋予目标后:会自主拆解任务、调用工具、一步步推进,直到完成目标。

Subagent 子智能体

Agent的"下属",用来分解更复杂的任务。大Agent负责总指挥,把任务拆成小块,交给不同的Subagent分别处理,再汇总结果。

🏢 类似公司里的部门主管和下属的关系。

Multi-agent 多智能体协作

多个Agent同时工作,各司其职、协同完成复杂任务。比如一个项目里,一个Agent负责写代码,一个负责测试,一个负责部署,三个Agent互相配合。

⚠️ 第九部分:常见问题

幻觉 Hallucination 必知

AI一本正经地输出听起来很对但实际是错误的内容——引用不存在的论文、描述从未发生过的事件。

⚠️ 为什么会这样?因为AI不是在"回忆"事实,而是在"猜"最可能的词序列。它只会选概率最高的词组合,不等于这个组合反映了真实情况。

✅ 避免幻觉的方法:重要事实要核实,给AI的知识库要准确,复杂问题尽量启用RAG。

API 应用程序接口

普通人用AI是通过界面操作(聊天框),程序员用AI是通过API——把AI能力集成到自己的应用里,通过代码发送指令、接收回复。

💻 界面是"图形遥控器",API是"程序员遥控器"。本质上都是控制AI,但API更灵活、可自动化、能批量处理。

💡
看完这篇,你应该对AI领域的核心概念有了系统了解。
这些术语描述的是AI工作链条上的不同环节:
模型本身 → 怎么理解语言 → 怎么记忆 → 怎么接收指令 → 怎么输出 → 怎么扩展能力 → 怎么设定边界 → 怎么自主行动

理解了这个链条,你就不只是"会用AI",而是开始"懂AI"了。

AI行业迎来前所未有的爆发式增长:从DeepSeek百万年薪招聘AI研究员,到百度、阿里、腾讯等大厂疯狂布局AI Agent,再到国家政策大力扶持数字经济和AI人才培养,所有信号都在告诉我们:AI的黄金十年,真的来了!

在行业火爆之下,AI人才争夺战也日趋白热化,其就业前景一片蓝海!

我给大家准备了一份全套的《AI大模型零基础入门+进阶学习资源包》,包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。😝有需要的小伙伴,可以VX扫描下方二维码免费领取🆓

人才缺口巨大

人力资源社会保障部有关报告显示,据测算,当前,****我国人工智能人才缺口超过500万,****供求比例达1∶10。脉脉最新数据也显示:AI新发岗位量较去年初暴增29倍,超1000家AI企业释放7.2万+岗位……

单拿今年的秋招来说,各互联网大厂释放出来的招聘信息中,我们就能感受到AI浪潮,比如百度90%的技术岗都与AI相关!

就业薪资超高

在旺盛的市场需求下,AI岗位不仅招聘量大,薪资待遇更是“一骑绝尘”。企业为抢AI核心人才,薪资给的非常慷慨,过去一年,懂AI的人才普遍涨薪40%+!

脉脉高聘发布的《2025年度人才迁徙报告》显示,在2025年1月-10月的高薪岗位Top20排行中,AI相关岗位占了绝大多数,并且平均薪资月薪都超过6w!

在去年的秋招中,小红书给算法相关岗位的薪资为50k起,字节开出228万元的超高年薪,据《2025年秋季校园招聘白皮书》,AI算法类平均年薪达36.9万,遥遥领先其他行业!

总结来说,当前人工智能岗位需求多,薪资高,前景好。在职场里,选对赛道就能赢在起跑线。抓住AI风口,轻松实现高薪就业!

但现实却是,仍有很多同学不知道如何抓住AI机遇,会遇到很多就业难题,比如:

❌ 技术过时:只会CRUD的开发者,在AI浪潮中沦为“职场裸奔者”;

❌ 薪资停滞:初级岗位内卷到白菜价,传统开发3年经验薪资涨幅不足15%;

❌ 转型无门:想学AI却找不到系统路径,83%自学党中途放弃。

他们的就业难题解决问题的关键在于:不仅要选对赛道,更要跟对老师!

我给大家准备了一份全套的《AI大模型零基础入门+进阶学习资源包》,包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。😝有需要的小伙伴,可以VX扫描下方二维码免费领取🆓

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/18 23:14:06

OxyGent入门指南:10分钟快速搭建你的第一个多智能体系统

OxyGent入门指南:10分钟快速搭建你的第一个多智能体系统 【免费下载链接】OxyGent [ACL 2026] OxyGent: Making Multi-Agent Systems Modular, Observable, and Evolvable via Oxy Abstraction 项目地址: https://gitcode.com/gh_mirrors/ox/OxyGent OxyGent…

作者头像 李华
网站建设 2026/5/18 23:13:02

一站式搭建Python GUI开发环境:Anaconda、PyCharm与PyQt5的整合指南

1. 为什么选择AnacondaPyCharmPyQt5组合? 刚开始接触Python GUI开发时,我也被各种工具链搞得眼花缭乱。直到发现AnacondaPyCharmPyQt5这个黄金组合,开发效率直接翻倍。先说Anaconda,它不仅仅是Python发行版,更是一个强…

作者头像 李华
网站建设 2026/5/18 23:10:12

Go-Binance SDK终极指南:一站式解决加密货币交易API集成难题

Go-Binance SDK终极指南:一站式解决加密货币交易API集成难题 【免费下载链接】go-binance A Go SDK for Binance API 项目地址: https://gitcode.com/gh_mirrors/go/go-binance Go-Binance SDK是专为加密货币交易者设计的终极解决方案,这个强大的…

作者头像 李华
网站建设 2026/5/18 23:10:03

gemmlowp输出管道机制揭秘:灵活量化范式的完整教程

gemmlowp输出管道机制揭秘:灵活量化范式的完整教程 【免费下载链接】gemmlowp Low-precision matrix multiplication 项目地址: https://gitcode.com/gh_mirrors/ge/gemmlowp gemmlowp是一个专注于低精度矩阵乘法(GEMM)的高性能库&…

作者头像 李华
网站建设 2026/5/18 23:05:41

30 分钟 Shell 光速入门教程

30 分钟 Shell 光速入门教程 一、参考资料 【30分钟Shell光速入门教程】 https://www.bilibili.com/video/BV17m411U7cC/?share_sourcecopy_web&vd_source855891859b2dc554eace9de3f28b4528 二、笔记总结 第 1 部分第 2 部分第 3 部分

作者头像 李华
网站建设 2026/5/18 23:04:12

[STM32U3] 【STM32U385RG 测评】+ TrustZone及其测试

STM32U385RG属于 STM32 超低功耗家族,其内核是基于 96MHz 高性能的 Arm Cortex-M33 ,它集成了 Arm TrustZone及硬件加密加速器。那啥是TrustZone呢? 从字面讲TrustZone是指信任区,具体到ARM TrustZone 则是ARM为了防止设备有效资源…

作者头像 李华