news 2026/6/15 20:04:20

神经网络的学习(从数据中学习)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
神经网络的学习(从数据中学习)

从数据中学习

神经网络的特征就是可以从数据中学习。所谓“从数据中学习”,是指
可以由数据自动决定权重参数的值。这是非常了不起的事情!因为如果所有
的参数都需要人工决定的话,工作量就太大了。在第2 章介绍的感知机的例
子中,我们对照着真值表,人工设定了参数的值,但是那时的参数只有3 个。
而在实际的神经网络中,参数的数量成千上万,在层数更深的深度学习中,
参数的数量甚至可以上亿,想要人工决定这些参数的值是不可能的。本章将
介绍神经网络的学习,即利用数据决定参数值的方法,并用Python 实现对
MNIST手写数字数据集的学习。

对于线性可分问题,第2 章的感知机是可以利用数据自动学习的。
根据“感知机收敛定理”,通过有限次数的学习,线性可分问题是可
解的。但是,非线性可分问题则无法通过(自动)学习来解决。

数据驱动

数据是机器学习的命根子。从数据中寻找答案、从数据中发现模式、根
据数据讲故事……这些机器学习所做的事情,如果没有数据的话,就无从谈
起。因此,数据是机器学习的核心。这种数据驱动的方法,也可以说脱离了
过往以人为中心的方法。

通常要解决某个问题,特别是需要发现某种模式时,人们一般会综合考
虑各种因素后再给出回答。“这个问题好像有这样的规律性?”“不对,可能
原因在别的地方。”——类似这样,人们以自己的经验和直觉为线索,通过反
复试验推进工作。而机器学习的方法则极力避免人为介入,尝试从收集到的
数据中发现答案(模式)。神经网络或深度学习则比以往的机器学习方法更能
避免人为介入。

现在我们来思考一个具体的问题,比如如何实现数字“5”的识别。数字
5 是图4-1 所示的手写图像,我们的目标是实现能区别是否是5 的程序。这个
问题看起来很简单,大家能想到什么样的算法呢?

如果让我们自己来设计一个能将5 正确分类的程序,就会意外地发现这
是一个很难的问题。人可以简单地识别出5,但却很难明确说出是基于何种
规律而识别出了5。此外,从图4-1 中也可以看到,每个人都有不同的写字习惯,
要发现其中的规律是一件非常难的工作。

因此,与其绞尽脑汁,从零开始想出一个可以识别5 的算法,不如考虑
通过有效利用数据来解决这个问题。一种方案是,先从图像中提取特征量,再用机器学习技术学习这些特征量的模式。这里所说的“特征量”是指可以
从输入数据(输入图像)中准确地提取本质数据(重要的数据)的转换器。图
像的特征量通常表示为向量的形式。在计算机视觉领域,常用的特征量包括
SIFT、SURF和HOG等。使用这些特征量将图像数据转换为向量,然后对
转换后的向量使用机器学习中的SVM、KNN等分类器进行学习。

机器学习的方法中,由机器从收集到的数据中找出规律性。与从零开始
想出算法相比,这种方法可以更高效地解决问题,也能减轻人的负担。但是
需要注意的是,将图像转换为向量时使用的特征量仍是由人设计的。对于不
同的问题,必须使用合适的特征量(必须设计专门的特征量),才能得到好的
结果。比如,为了区分狗的脸部,人们需要考虑与用于识别5 的特征量不同
的其他特征量。也就是说,即使使用特征量和机器学习的方法,也需要针对
不同的问题人工考虑合适的特征量。

到这里,我们介绍了两种针对机器学习任务的方法。将这两种方法用图
来表示,如图4-2 所示。图中还展示了神经网络(深度学习)的方法,可以看
出该方法不存在人为介入。

如图4-2 所示,神经网络直接学习图像本身。在第2 个方法,即利用特
征量和机器学习的方法中,特征量仍是由人工设计的,而在神经网络中,连
图像中包含的重要特征量也都是由机器来学习的。

深度学习有时也称为端到端机器学习(end-to-end machine
learning)。这里所说的端到端是指从一端到另一端的意思,也就是
从原始数据(输入)中获得目标结果(输出)的意思。

神经网络的优点是对所有的问题都可以用同样的流程来解决。比如,不
管要求解的问题是识别5,还是识别狗,抑或是识别人脸,神经网络都是通
过不断地学习所提供的数据,尝试发现待求解的问题的模式。也就是说,与
待处理的问题无关,神经网络可以将数据直接作为原始数据,进行“端对端”
的学习。

训练数据和测试数据

本章主要介绍神经网络的学习,不过在这之前,我们先来介绍一下机器
学习中有关数据处理的一些注意事项。

机器学习中,一般将数据分为训练数据和测试数据两部分来进行学习和
实验等。首先,使用训练数据进行学习,寻找最优的参数;然后,使用测试
数据评价训练得到的模型的实际能力。为什么需要将数据分为训练数据和测
试数据呢?因为我们追求的是模型的泛化能力。为了正确评价模型的泛化能
力,就必须划分训练数据和测试数据。另外,训练数据也可以称为监督数据。

泛化能力是指处理未被观察过的数据(不包含在训练数据中的数据)的
能力。获得泛化能力是机器学习的最终目标。比如,在识别手写数字的问题
中,泛化能力可能会被用在自动读取明信片的邮政编码的系统上。此时,手
写数字识别就必须具备较高的识别“某个人”写的字的能力。注意这里不是“特
定的某个人写的特定的文字”,而是“任意一个人写的任意文字”。如果系统
只能正确识别已有的训练数据,那有可能是只学习到了训练数据中的个人的
习惯写法。

因此,仅仅用一个数据集去学习和评价参数,是无法进行正确评价的。
这样会导致可以顺利地处理某个数据集,但无法处理其他数据集的情况。顺
便说一下,只对某个数据集过度拟合的状态称为过拟合(over fitting)。避免
过拟合也是机器学习的一个重要课题。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 13:48:58

从数据中学习:神经网络如何自动发现模式

从数据中学习:神经网络如何自动发现模式 为什么“从数据中学习”如此重要? 神经网络最核心的特征就是能够从数据中自动学习。这意味着系统可以自己找到最优的权重参数值,而不是依赖人工设定。 想象一下,如果每个参数都需要手动调整…

作者头像 李华
网站建设 2026/6/15 13:46:07

City-Roads城市道路可视化工具:零基础入门完整指南

City-Roads城市道路可视化工具:零基础入门完整指南 【免费下载链接】city-roads Visualization of all roads within any city 项目地址: https://gitcode.com/gh_mirrors/ci/city-roads 想要快速了解城市道路网络布局?City-Roads作为一款基于Web…

作者头像 李华
网站建设 2026/6/15 17:10:36

Move Mouse实战指南:告别电脑自动锁屏的智能解决方案

Move Mouse实战指南:告别电脑自动锁屏的智能解决方案 【免费下载链接】movemouse Move Mouse is a simple piece of software that is designed to simulate user activity. 项目地址: https://gitcode.com/gh_mirrors/mo/movemouse 还在为远程会议中突然锁屏…

作者头像 李华
网站建设 2026/6/15 14:09:32

Z-Image-Turbo领域适配:医疗图像生成专项环境

Z-Image-Turbo领域适配:医疗图像生成专项环境使用指南 在医疗AI领域,高质量的医学图像生成对于辅助诊断、教学研究具有重要意义。Z-Image-Turbo作为一款高效的图像生成模型,通过8步蒸馏技术实现了亚秒级的生成速度,特别适合需要快…

作者头像 李华
网站建设 2026/6/15 13:17:35

B站推流码获取终极指南:免费绕开直播姬的完整教程

B站推流码获取终极指南:免费绕开直播姬的完整教程 【免费下载链接】bilibili_live_stream_code 用于在准备直播时获取第三方推流码,以便可以绕开哔哩哔哩直播姬,直接在如OBS等软件中进行直播,软件同时提供定义直播分区和标题功能 …

作者头像 李华
网站建设 2026/6/15 13:12:43

模型版本管理:Z-Image-Turbo多版本快速切换方案

模型版本管理:Z-Image-Turbo多版本快速切换方案实战指南 作为一名经常需要测试不同AI模型版本的研究人员,你是否也遇到过这样的困扰:每次切换Z-Image-Turbo版本时,都要重新配置环境、安装依赖,甚至可能因为版本冲突导致…

作者头像 李华