news 2026/6/15 15:00:11

DAY25 常见的降维算法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DAY25 常见的降维算法

前言:

在前几天我们主要讨论了关于特征筛选和降维方面的问题,所以在开始今天对常见降维算法进行分析前,我们需要先明确一下特征筛选和降维的区别,特征筛选是关于“取舍”,它在保留特征原始意义的前提下做减法;降维是关于“重构”,它通过创造新特征来做信息浓缩。两种思想:一、先通过特征筛选去掉明显无关或噪声特征,再对剩余的特征进行降维,以达到最佳效果。二、(1)要解释、有成本、需行动→ 特征筛选(2)要性能、可视化、关系复杂→ 降维(3)不确定、有时间、想最优 → 两者都试,用验证集说话。

一、主成分析法(PCA)

PCA的处理流程

1. 对数据进行均值中心化。

2. 对中心化后的数据进行SVD。

3. 使用SVD得到的右奇异向量 `V` 作为主成分方向。

4. 使用奇异值 `S` 来评估每个主成分的重要性(解释的方差)。

5. 使用 `U*S`(或 `X_centered * V`)来获得降维后的数据表示。

PCA主要适用于那些你认为最重要的信息可以通过数据方差来捕获无监督利用特征即可),并且数据结构主要是线性的情况。

二、t-SNE

t-SNE 是一种强大的非线性降维技术,主要用于高维数据的可视化。它通过在低维空间中保持高维空间中数据点之间的局部相似性(邻域关系)来工作。与PCA关注全局方差不同,t-SNE更关注局部细节。理解它的超参数(尤其是困惑度)和结果的正确解读力式非常重要。

三、LDA

线性判别分析 (LDA) 是一种经典的有监督降维算法,也常直接用作分类器。作为降维技术时,其核心目标是找到一个低维特征子空间(即原始特征的线性组合),使得在该子空间中,不同类别的数据点尽可能地分开(类间距离最大化),而同一类别的数据点尽可能地聚集(类内方差最小化)

小结:

PCA等无监督降维方法的目标是保留数据的最大方差,这些方差大的方向不一定是对分类最有用的方向。因此,在分类任务中,LDA通常比PCA更直接有效。当然各种分析方法我们无法对其一概而论,我们需针对特定的情况去分析我们该使用什么方式,实践一下各个方法的效果。

@浙大疏锦行

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 13:56:02

8 个MBA课堂汇报工具,AI写作降重推荐

8 个MBA课堂汇报工具,AI写作降重推荐 当论文压力袭来,你是否也在挣扎? MBA学习过程中,课堂汇报、论文写作、文献综述等任务接踵而至,让许多学生感到力不从心。尤其是在面对高重复率要求时,如何在有限的时间…

作者头像 李华
网站建设 2026/6/15 4:34:54

2025权威之选:贝锐蒲公英SD-WAN方案如何赋能企业远程视频监控

在数字化转型的深水区,一家成功将国际折扣零售模式本土化并发展至上百家门店的连锁企业,正遭遇着高速扩张带来的典型“成长烦恼”。其管理层发现,昔日引以为傲的分散式运营体系,如今却成了制约进一步发展的枷锁。这并非个例&#…

作者头像 李华
网站建设 2026/6/15 12:16:38

Qwen3-VL-30B + GPU算力加速:实现高效视觉问答与图表解析

Qwen3-VL-30B GPU算力加速:实现高效视觉问答与图表解析 在金融分析师面对堆积如山的财报图表时,在放射科医生连续阅片数小时后,在自动驾驶车辆驶入复杂施工路段的瞬间——我们越来越意识到,AI不能只“读文字”,它必须…

作者头像 李华
网站建设 2026/6/13 14:36:57

07FlyLTAS旅行社ERP散客滚动发团操作流程说明

流程图说明: 进入分团页面:从左侧菜单导航至散客团队模块,找到目标团队进入分团界面。筛选设置:通过日期、导游、线路、行程等多维度筛选,并可关键词搜索快速定位。状态监控:实时查看分团人数统计和行程饱和…

作者头像 李华
网站建设 2026/6/14 22:13:52

07FlyLTAS旅行社ERP散客行程分团状态说明

在散客分团操作流程中,查看分团状态的步骤及要点如下:步骤 1:进入散客分团页面后,查看顶部状态概览 在页面顶部区域,可直接看到 2 个核心数据:未分配总人数:当前待分配的散客总数量(…

作者头像 李华
网站建设 2026/6/14 19:32:30

Python MySQL关系映射实战:手把手搞定一对多与多对多建模

Python MySQL关系映射实战:手把手搞定一对多与多对多建模 文章目录Python MySQL关系映射实战:手把手搞定一对多与多对多建模学习开场:为什么关系映射是Python开发者的必修课?环境准备:搭建你的Python MySQL开发环境1. …

作者头像 李华