news 2026/5/28 16:35:41

C++:STL set 系列完全指南(从底层原理、核心接口到实战场景)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
C++:STL set 系列完全指南(从底层原理、核心接口到实战场景)

一. 容器分类:序列式容器与关联式容器的本质区别

STL 容器的设计围绕 “数据如何存储与访问” 展开,序列式与关联式容器的核心差异体现在存储逻辑与访问方式上,具体对比如下:

特性序列式容器(如 vector、list)关联式容器(如 set、map)
存储逻辑按插入顺序存储,元素位置由插入时机决定按键(key)的内在规则存储(如排序规则)
访问方式通过下标/迭代器位置访问(如vec[2]通过键值匹配访问(如set.find(3)
底层结构动态数组(vector)、双向链表(list)等平衡二叉搜索树(红黑树,set/map)、哈希表(unordered_set)
核心优势插入顺序稳定,适合频繁增删尾部元素自动排序,查找/删除效率高(O(log N)O(1)
典型使用场景存储连续数据、需要按插入顺序遍历、动态扩容需求去重排序、快速查找、键值映射、区间操作

补充说明

  • 序列式容器强调“位置”,元素的价值在于其存储的内容本身;
  • 关联式容器强调“关联关系”,元素的价值在于通过 key 快速定位(如 “根据 ID 查找用户信息”);
  • set 作为 “key” 型关联式容器,仅存储键值,核心功能是 “基于 key 的排序与查找”。

二. set 系列核心原理:红黑树赋能的高效特性

set 与 multiset 底层均基于红黑树(一种自平衡二叉搜索树)实现,这一结构赋予它们以下核心特性:

  1. 自动排序:红黑树的中序遍历结果为有序序列,因此 set 插入元素后会自动按 key 的默认规则(less升序)排序,无需手动调用排序函数,如果需要按自己的需求比较可以自行实现仿函数传给第二个模板参数。
  2. 去重与允许重复:set 不允许存储重复 key(multiset 支持重复 key);
  3. 不可修改 key:set 的迭代器为const_iterator,无法通过迭代器修改 key(修改会破坏红黑树结构);
  4. 高效操作:增删查操作的时间复杂度均为O(log N),远优于 vector 的O(N)

set的声明

template < class T, // set::key_type/value_type class Compare = less<T>, // set::key_compare/value_compare class Alloc = allocator<T> // set::allocator_type > class set;

参考文档:set - C++ Reference

set的构造相关接口

// empty (1) ⽆参默认构造 explicit set (const key_compare& comp = key_compare(), const allocator_type& alloc = allocator_type()); // range (2) 迭代器区间构造 template <class InputIterator> set (InputIterator first, InputIterator last, const key_compare& comp = key_compare(), const allocator_type& = allocator_type()); // copy (3) 拷⻉构造 set (const set& x); // initializer list (5) initializer 列表构造 set (initializer_list<value_type> il, const key_compare& comp = key_compare(), const allocator_type& alloc = allocator_type()); // 迭代器是⼀个双向迭代器 iterator -> a bidirectional iterator to const value_type // 正向迭代器 iterator begin(); iterator end(); // 反向迭代器 reverse_iterator rbegin(); reverse_iterator rend();

三. set 核心接口实战:基于实操代码详解

下面会通过多个测试函数覆盖 set 的核心操作,我们结合代码解析其使用方法与注意事项。

3.1 初始化与插入:去重 + 自动排序

set 支持多种插入方式,插入后自动去重并按升序排列代码示例(注意看注释)

#define _CRT_SECURE_NO_WARNINGS 1 #include<iostream> #include<set> using namespace std; // 测试set的插入与遍历(去重+自动排序) void test_set1() { set<int> s; // 方式1:单个元素插入 //s.insert(3); //s.insert(1); //s.insert(2); //s.insert(5); //s.insert(3); //s.insert(5); //s.insert(6); // 方式2:初始化列表批量插入 s.insert({ 3,1,2,5,3,5,6 }); // 遍历方式1:迭代器遍历(注意:*it不可修改) // 遍历结果: 去重+有序 set<int>::iterator it = s.begin(); while (it != s.end()) { //*it1 = 1;//不能修改 cout << *it << " "; ++it; } cout << endl; // 遍历方式2:范围for循环 for (auto& e : s) { cout << e << " "; } cout << endl; } int main() { test_set1(); return 0; }

关键说明

  • 若需降序排序,可指定排序仿函数:set<int, greater<int>> s

3.2 查找与删除:精准操作单个元素

set 提供find(查找)、count(统计)、erase(删除)接口,支持按 key 或迭代器操作:

// 测试set的查找与删除 // 测试set的查找与删除 void test_set2() { set<int> s; s.insert({ 3,1,2,5,3,5,6 });// 去重后:1 2 3 5 6 int x = 0; cin >> x; cout << s.erase(x) << endl;//删掉了几个返回值就是几,在set里就是1,没删掉就是0 //查找元素:find返回迭代器,未找到则返回s.end() //auto pos = s.find(x); //if (pos != s.end()) //{ // s.erase(pos);//找到后删除 //} // 统计元素个数:set中仅返回0或1(判断存在性) if (s.count(x)) { } for (auto& e : s) { cout << e << " "; } cout << endl; } int main() { test_set2(); return 0; }

关键说明

  • erase的返回值是删除元素的个数,在set里要么是0要么是1,multiset删了几个就是几
  • count在 set 中主要用于判断元素是否存在,在 multiset 中返回实际个数。

3.3 区间操作:lower_bound 与 upper_bound

set 的区间操作依赖lower_boundupper_bound,用于快速定位边界,结合erase可高效删除区间元素:

// 测试set的区间操作 void test_set3() { set<int> s; s.insert({ 3,1,2,5,3,5,6,7,9}); for (auto& e : s) { cout << e << " "; } cout << endl; // 需求:删除[3, 8]区间的元素(即>=3且<=8) // lower_bound(val):返回第一个>=val的迭代器(此处指向3) auto it1 = s.lower_bound(3); // upper_bound(val):返回第一个>val的迭代器(此处指向9) auto it2 = s.upper_bound(8); // 按迭代器区间删除:删除[it1, it2)内的元素 s.erase(it1, it2); for (auto& e : s) { cout << e << " "; } cout << endl; } int main() { test_set3(); }

关键说明

  • lower_boundupper_bound的时间复杂度均为O(log N),是区间操作的核心;
  • 区间[it1, it2)“左闭右开”,这样符合 STL 迭代器区间的通用设计(如[begin, end))。

四. multiset:支持重复 key 的关联式容器

multiset 与 set 接口一致,核心差异是允许重复 key,适用于需要存储相同元素并统计频率的场景:

// 测试multiset(支持重复key) void test_multiset() { multiset<int> s; // 插入重复元素(不会去重) s.insert({ 3,1,2,5,3,5,6,3,3 }); // 1. 遍历:有序但保留重复元素 multiset<int>::iterator it = s.begin(); while (it != s.end()) { //*it = 1;//不能修改 cout << *it << " "; ++it; } cout << endl; // 2. 查找:返回中序遍历的第一个目标元素 auto pos = s.find(3); //打印所有3 while (pos != s.end() && *pos == 3) { cout << *pos << " "; ++pos; } cout << endl; // 3.查找有3的区间,左闭右开,【) //std::pair<multiset<int>::iterator, multiset<int>::iterator> ret = s.equal_range(3); auto ret = s.equal_range(3); // 4. 统计:返回元素实际个数 cout << s.count(3) << endl;//有几个3 // 5.删除:按key删除所有匹配元素 cout << s.erase(3) << endl;//删掉所有的3,并返回删掉的3的个数 s.erase(5);//删掉所有的5 for (auto& e : s) { cout << e << " "; } cout << endl; } int main() { test_multiset(); }

set 与 multiset 的核心差异总结

操作set

multiset

插入重复元素自动去重,重复元素插入失败不去重,保留所有重复元素,插入成功
finda(key)返回唯一匹配元素的迭代器,未找到返回end()返回中序遍历中第一个匹配元素的迭代器
count(key)返回 0 或 1(仅用于判断元素是否存在)返回元素在容器中实际出现的次数
erase(key)若元素存在则删除 1 个,不存在则删除 0 个删除容器中所有与key匹配的元素

五. set 系列的实战价值:解决实际开发问题

set 系列的 “自动排序 + 高效查找” 特性在算法与工程中应用广泛,以下是两个典型题目

5.1:环形链表 II

题目链接:142. 环形链表 II - 力扣(LeetCode)
题目要求:找到环形链表的入口结点
思路:用 set 存储遍历过的节点,若插入节点时发现已存在,该节点即为入口。

C++算法代码

class Solution { public: ListNode *detectCycle(ListNode *head) { set<ListNode*> s; ListNode* cur = head; while(cur) { auto ret=s.find(cur); // 不存在就插入节点 if(ret==s.end()) s.insert(cur); // 已经存在证明这就是入环节点 else return cur; cur=cur->next; } return nullptr; } };

5.2 两个数组的交集(扩展差集思路)

题目链接:349. 两个数组的交集 - 力扣(LeetCode)
题目要求:给定两个数组,计算它们的交集(结果需去重)。
思路:用 set 对两个数组去重 + 排序,再用双指针遍历两个 set,找到共同元素。

C++算法代码

class Solution { public: vector<int> intersection(vector<int>& nums1, vector<int>& nums2) { vector<int> ret; // 1. 用set对两个数组去重+排序 set<int> s1(nums1.begin(),nums1.end()); set<int> s2(nums2.begin(),nums2.end()); auto it1=s1.begin(); auto it2=s2.begin(); // 2. 双指针遍历,找共同元素 while(it1!=s1.end()&&it2!=s2.end()) { //小的++ if(*it1<*it2) ++it1; else if(*it1>*it2) ++it2; //相等的是交集,加入结果,然后同时++ else { ret.push_back(*it1); ++it1; ++it2; } } return ret; } };

差集和交集的实战使用:多端文件同步的逻辑

通过“差集识别新增 / 缺失文件,交集比对时间戳确定更新方向”,避免全量传输,大幅减少带宽消耗和同步时间,是云存储、多端协作工具(如网盘、协同办公软件)的常见底层逻辑之一。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/25 6:59:22

在算法的潮汐中:我的赞叹与疑惑

整整一天的演讲、演示和讨论&#xff0c;像一阵海啸般冲刷着我的认知边界。在这个智能化的浪潮面前&#xff0c;我发现自己正站在一个前所未有的十字路口&#xff0c;心中充满了矛盾的赞叹与深刻的困惑。当AI只花几分钟就能代替我花几个小时做出来的视频&#xff0c;当它写出我…

作者头像 李华
网站建设 2026/5/28 14:52:38

heic打不开怎么办?别慌!5个简单方法,1分钟解决

“为什么从iPhone传到电脑里的照片都打不开了&#xff1f;” 很多Windows用户在整理苹果手机照片时&#xff0c;都会遇到这个令人头疼的问题。当你看到一堆以 .heic 结尾的文件&#xff0c;却无法用系统自带的看图软件打开时&#xff0c;不必惊慌。这其实是苹果为了节省存储空间…

作者头像 李华
网站建设 2026/5/9 7:28:44

[技术讨论] 【每周分享】CW32L011直流无刷电机驱动无霍尔测试

有幸拿到了武汉芯源的CW32L011直流无刷电机驱动开发板。 产品参数&#xff1a; 主控MCU&#xff1a;CW32L011K8T6 LQFP32(7*7) PCBA&#xff1a;7.4 * 11.6 cm 黑色沉金工艺 驱动能力&#xff1a;12~72V 800W MAX; 需要与电容\场效应管参数配合&#xff1b;大功率使用建议安装散…

作者头像 李华
网站建设 2026/5/26 20:39:31

日志技术(Logback Slf4j)

框架介绍Log4j&#xff08;不用&#xff09;&#xff1a;一个流行的日志框架&#xff0c;提供了灵活的配置选项&#xff0c;支持多种输出目标。Logback&#xff1a;基于Log4j升级而来&#xff0c;提供了更多的功能和配置选项&#xff0c;性能由于Log4j。Slf4j&#xff1a;&…

作者头像 李华
网站建设 2026/5/25 15:02:30

Kotaemon新闻摘要生成:7x24小时自动资讯简报

Kotaemon新闻摘要生成&#xff1a;7x24小时自动资讯简报 在金融交易室、媒体编辑部或企业战略部门&#xff0c;每天清晨打开邮箱看到几十条未读新闻推送时&#xff0c;你是否曾感到信息过载的窒息&#xff1f;更令人焦虑的是&#xff0c;关键事件可能在发布后10分钟内就影响股…

作者头像 李华
网站建设 2026/5/27 5:16:51

【分析式AI】-过拟合(含生活案例说明)

1. 专业术语说明 过拟合 是指一个机器学习模型在训练数据集上表现过于优异&#xff0c;以至于它学习了训练数据中的噪声、随机波动和无关特征&#xff0c;而非数据背后的真实、普适的分布规律。这导致模型的复杂度远高于问题本身所需的复杂度&#xff0c;其结果是模型在训练集…

作者头像 李华