news 2026/5/1 8:29:14

哈希表是一种基于映射关系的存储结构,其核心是哈希函数 $ H(key) $,它将任意关键字转换为地址空间内的索引值,从而实现快速存取

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
哈希表是一种基于映射关系的存储结构,其核心是哈希函数 $ H(key) $,它将任意关键字转换为地址空间内的索引值,从而实现快速存取

B-树的插入与删除操作需严格维护其结构平衡性。在插入时,首先将关键字插入到合适的叶节点中,若该节点关键字数量超过上限 $ m-1 $,则进行“分裂”:取中间关键字上移至父节点,原节点以中间关键字为界拆分为两个子节点。若分裂传递至根节点且导致根满,则根分裂并生成新的根,树高加一。删除操作时,若关键字位于非叶节点,则用其中序后继替代并转为对叶节点的删除;若删除后节点关键字个数小于最小要求 $ \lceil m/2 \rceil - 1 $,则通过左兄弟或右兄弟“借”关键字,若兄弟也无法借用,则与兄弟及父节点中的分隔关键字合并,可能导致合并后的节点继续向上合并,甚至树高减一。

哈希表是一种基于映射关系的存储结构,其核心是哈希函数 $ H(key) $,它将任意关键字转换为地址空间内的索引值,从而实现快速存取。理想情况下查找时间复杂度为 $ O(1) $。但由于哈希函数输出空间有限,不同关键字可能映射到同一地址,产生冲突。常见的冲突解决方法包括链地址法(拉链法)和开放定址法(如线性探测、平方探测)。为减少冲突,应设计分布均匀的哈希函数,并保持较低的装载因子。
当B-树中某节点的关键字个数超过 $ m-1 $(即最大允许关键字数)时,需对该节点进行分裂操作,以维持B-树的结构特性。具体步骤如下:

  1. 确定分裂位置
    将该节点中的 $ m $ 个关键字按升序排列(插入后已有序),选取中间关键字(第 $ \lceil m/2 \rceil $ 个关键字,即索引为 $ \left\lfloor \frac{m}{2} \right\rfloor $ 的关键字)作为上移关键字。

  2. 拆分左右两部分

    • 中间关键字左侧的 $ \lceil m/2 \rceil - 1 $ 个关键字保留在原节点中;
    • 右侧的 $ \lfloor m/2 \rfloor $ 个关键字构成一个新节点;
    • 若该节点是非叶节点(有子树),则其 $ m+1 $ 棵子树也需一并分割:前 $ \lceil m/2 \rceil $ 棵子树归属原节点,后 $ \lfloor m/2 \rfloor + 1 $ 棵子树归属新节点。
  3. 中间关键字上移至父节点
    将选出的中间关键字插入到父节点中的合适位置,并将新节点的指针作为右子树连接到父节点中。若父节点因此也超过了 $ m-1 $ 个关键字,则递归执行分裂,直至根节点。

  4. 若根节点分裂
    当根节点发生分裂时,创建一个新的根节点,将上移的关键字作为新的根,原根分裂为两个子节点。此时树的高度增加一层。

⚠️ 注意:分裂操作保证了每个节点的关键字个数始终满足 $ \lceil m/2 \rceil - 1 \leq n \leq m-1 $,从而保持B-树的平衡性。

# 示例伪代码表示分裂过程(以m=5为例)defsplit_node(node):mid=len(node.keys)//2# m=5时,mid=2,第3个关键字上移separator=node.keys[mid]left_keys=node.keys[:mid]# 前半部分保留right_keys=node.keys[mid+1:]# 后半部分新建节点left_children=node.children[:mid+1]ifnotnode.is_leaf()elseNoneright_children=node.children[mid+1:]ifnotnode.is_leaf()elseNonenew_right_node=BTreeNode(keys=right_keys,children=right_children)# 更新当前节点node.keys=left_keys node.children=left_childrenreturnseparator,new_right_node

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 7:18:14

迅雷离线下载后自动OCR?HunyuanOCR在下载工具中的创新应用

HunyuanOCR在下载工具中的创新应用 在今天的数字生活中,我们每天都在下载各种文件:从学术论文、电子书到网页截图、扫描文档。但你有没有遇到过这样的情况?好不容易用迅雷离线下载了一堆PDF讲义或图片资料,结果打开一看全是图像格…

作者头像 李华
网站建设 2026/4/28 23:58:01

如何将HunyuanOCR嵌入Web应用实现在线OCR工具网站

如何将HunyuanOCR嵌入Web应用实现在线OCR工具网站 在数字化浪潮席卷各行各业的今天,文档信息的快速提取与跨语言理解已成为办公、教育和跨境业务中的刚需。一张发票、一份合同、一段视频字幕——这些原本“沉睡”在图像中的文字,正通过光学字符识别&…

作者头像 李华
网站建设 2026/4/29 9:34:53

C++26来了!揭秘std::future新增超时控制的底层实现原理

第一章:C26 std::future 超时机制概述C26 对并发编程模型进行了重要增强,其中 std::future 的超时机制得到了标准化和统一。此前版本的 C(如 C11 至 C23)虽然支持通过 wait_for 和 wait_until 实现有限等待,但行为在异…

作者头像 李华
网站建设 2026/4/19 20:41:28

Clang 17性能优化十大陷阱:90%工程师都踩过的坑,你中了几个?

第一章:Clang 17性能优化的核心价值与挑战Clang 17作为LLVM项目的重要组成部分,不仅延续了对C、C和Objective-C语言的高效支持,更在编译时性能、代码生成质量以及诊断信息精确性方面实现了显著提升。其核心价值体现在更智能的优化策略、更低的…

作者头像 李华
网站建设 2026/4/27 1:30:10

百度网盘智能分类:结合HunyuanOCR识别图片内容打标签

百度网盘智能分类:结合HunyuanOCR识别图片内容打标签 在百度网盘每天处理数亿张用户上传的图片时,一个看似简单却长期困扰工程师的问题浮现出来:如何让一张名为“IMG_20240512_193845.jpg”的合同截图,能被搜索“租房合同”准确命…

作者头像 李华
网站建设 2026/4/30 2:28:06

IP 地址实用工具表

这是一张IP 地址实用工具表,整合了网络配置中常用的信息,核心功能是辅助 IP 地址规划、子网划分及网络参数配置,主要包含以下模块及解读: 1. 子网划分工具 列出了不同子网位数对应的子网掩码、可用 IP 地址数量、通配符,可快速计算子网的地址范围与资源量(例如 / 24 子…

作者头像 李华