news 2026/6/15 14:27:42

监督学习vs无监督学习:AI如何看懂世界

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
监督学习vs无监督学习:AI如何看懂世界

一、监督学习 vs 无监督学习

1. 监督学习(Supervised Learning)

  • 定义:模型从带有标签的数据中学习规律。
  • 关键特征:每条输入数据都有一个“正确答案”(标签)。
  • 目标:学会从输入预测输出。

例子

  • 输入一张猫的图片 → 标签是 “猫”
  • 输入一段话:“这部电影太棒了!” → 标签是 “正面情感”

🧠 常见任务:

  • 分类(Classification):预测类别(如垃圾邮件/非垃圾邮件)
  • 回归(Regression):预测数值(如房价、温度)

💡数据标注主要服务于监督学习,因为标签需要人工或半自动方式提供。


2. 无监督学习(Unsupervised Learning)

  • 定义:模型从没有标签的数据中发现隐藏结构。
  • 关键特征:只有输入,没有“正确答案”。
  • 目标:发现数据中的模式、分组或降维。

例子

  • 给1000个用户行为数据,自动分成“高活跃”“低活跃”等群体(聚类)
  • 把高维数据压缩成2D以便可视化(降维,如PCA)

🧠 常见任务:

  • 聚类(Clustering):如K-Means
  • 降维(Dimensionality Reduction)
  • 异常检测(Anomaly Detection)

❗ 无监督学习不需要人工标注,但效果通常不如监督学习可控。


对比总结表:

表格

特性监督学习无监督学习
是否需要标签✅ 需要❌ 不需要
数据标注角色核心
典型任务分类、回归聚类、降维
应用举例图像识别、语音识别客户分群、推荐系统

二、训练集、验证集、测试集的作用

想象你在教一个学生准备考试:

  • 训练集(Training Set)→ 学生平时做的练习题(用来学习)
  • 验证集(Validation Set)→ 模拟考试(用来调整学习方法)
  • 测试集(Test Set)→ 正式高考(用来最终评估水平)

详细说明:

表格

数据集占比(常见)作用是否参与模型训练?
训练集60%~80%模型从中学习参数✅ 是
验证集10%~20%调整超参数(如学习率)、选择模型、防止过拟合❌ 否(不用于更新参数,但用于决策)
测试集10%~20%最终评估模型性能,模拟真实场景❌ 否(完全隔离,只用一次)

⚠️重要原则

  • 测试集绝对不能在训练或调参时使用,否则会“作弊”,导致评估结果虚高。
  • 数据划分要随机且有代表性,避免偏差(比如所有猫图片都在测试集里)。

三、常见AI任务类型(与数据标注密切相关)

以下是三大主流计算机视觉任务(NLP也有类似分类):

1.图像分类(Image Classification)

  • 任务:判断一张图属于哪个类别。
  • 标注形式:整张图一个标签
    📌 例:image_001.jpg → "狗"

2.目标检测(Object Detection)

  • 任务:找出图中所有目标的位置和类别。
  • 标注形式:每个目标用一个边界框(Bounding Box) + 类别标签
    📌 例:在图中画一个框标出“猫”,另一个框标出“椅子”

3.语义分割(Semantic Segmentation)

  • 任务:对图像中每个像素打标签,标明属于哪个类别。
  • 标注形式:像素级掩码(Mask)
    📌 例:道路像素标为“路面”,行人像素标为“人”

🔍 还有更细粒度的任务,如:

  • 实例分割(Instance Segmentation):区分同一类别的不同个体(如两只不同的猫)
  • 关键点检测(Keypoint Detection):标出人体关节位置(用于姿态估计)

小练习(自测)

  1. 如果你要训练一个识别交通标志的模型,应该用监督学习还是无监督学习?为什么?
  2. 为什么不能用测试集来调整模型参数?
  3. 下面哪种任务需要最精细的标注?
    A. 图像分类
    B. 目标检测
    C. 语义分割

(答案见下方 👇)


参考答案

  1. 监督学习,因为需要明确知道每张图对应的是“停车标志”“限速标志”等标签。
  2. 因为会导致模型“记住”测试集,无法反映真实泛化能力,评估结果不可信。
  3. C. 语义分割(每个像素都要标注,工作量最大)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 11:03:09

Nodejs和vue的图书馆管理系统__图书借阅,图书阅读系统

文章目录图书馆管理系统(Node.js Vue)摘要--nodejs技术栈--结论源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!图书馆管理系统(Node.js Vue)摘要 该系统采用前后端分离架构&#xff0c…

作者头像 李华
网站建设 2026/6/15 14:19:23

开源大模型部署:GLM-4.6V-Flash-WEB安全配置指南

开源大模型部署:GLM-4.6V-Flash-WEB安全配置指南 智谱最新开源,视觉大模型。 1. 引言:为何需要安全的视觉大模型部署方案 随着多模态大模型在图像理解、文档解析、视觉问答等场景中的广泛应用,GLM-4.6V-Flash-WEB 作为智谱最新推…

作者头像 李华
网站建设 2026/6/15 14:10:57

ES集群健康状态维护:运维日常检查操作指南

Elasticsearch集群健康维护实战:从日常巡检到面试应对的完整指南你有没有遇到过这样的场景?凌晨三点,监控系统突然弹出一条红色告警——Elasticsearch 集群状态变红。登录 Kibana 一看,几十个分片未分配,搜索请求开始超…

作者头像 李华
网站建设 2026/6/10 6:19:47

手部追踪系统实战:MediaPipe Hands+IoT集成

手部追踪系统实战:MediaPipe HandsIoT集成 1. 引言:AI 手势识别与追踪的工程价值 随着人机交互技术的不断演进,非接触式控制正成为智能设备、虚拟现实、工业自动化等领域的关键能力。传统输入方式(如鼠标、键盘、触摸屏&#xf…

作者头像 李华
网站建设 2026/6/13 7:11:19

MediaPipe Hands教程:手部关键点检测优化

MediaPipe Hands教程:手部关键点检测优化 1. 引言 1.1 AI 手势识别与追踪 在人机交互、虚拟现实、智能监控和远程教育等前沿领域,手势识别正逐渐成为下一代自然交互方式的核心技术。通过摄像头捕捉用户的手部动作,并实时解析其姿态与意图&…

作者头像 李华
网站建设 2026/6/15 12:34:39

AI手势识别与追踪开发必备:API接口文档生成与调用示例

AI手势识别与追踪开发必备:API接口文档生成与调用示例 1. 技术背景与应用场景 随着人机交互技术的快速发展,AI手势识别正逐步成为智能设备、虚拟现实(VR)、增强现实(AR)和智能家居等领域的核心技术之一。…

作者头像 李华