news 2026/6/15 3:26:51

Linux----mmap

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Linux----mmap

在学习 Linux 内存管理、多线程或高性能 I/O 时,mmap()是一个绕不开的系统调用。很多人第一次接触它,都会把它理解成“另一种 malloc”,但实际上mmap 是 Linux 虚拟内存机制中最核心、最基础的接口之一

本文将从是什么、能做什么、怎么用、为什么重要四个层次,系统地梳理 mmap。


一、一句话理解 mmap

mmap()的本质不是“分配内存”,而是建立一段虚拟地址空间与某种资源之间的映射关系。

这里的“资源”可以是:

  • 磁盘文件

  • 匿名内存(不对应任何文件)

  • 设备(如共享内存、显存等)

一旦映射建立,程序就可以像访问普通内存一样访问这些资源


二、mmap 在 Linux 中处于什么位置?

从抽象层次看:

应用程序 ↓ libc (malloc / fopen / pthread) ↓ mmap / brk / read / write ← 关键接口 ↓ 虚拟内存系统(页表 / 缺页异常) ↓ 物理内存 / 磁盘 / 设备

mmap 是连接“用户程序”与“虚拟内存系统”的桥梁


三、mmap 的两种核心用法

文件映射(File-backed mapping)

int fd = open("data.bin", O_RDONLY); void *addr = mmap(NULL, size, PROT_READ, MAP_PRIVATE, fd, 0);

含义:

  • 把文件的一部分映射进进程地址空间

  • 对内存的访问 ≈ 对文件的访问

特点

  • 不需要read()/write()

  • 利用页缓存,按需加载

  • 支持零拷贝

典型应用

  • 加载共享库(.so

  • 大文件随机访问

  • 数据库、搜索引擎


匿名映射(Anonymous mapping)

void *addr = mmap(NULL, size, PROT_READ | PROT_WRITE, MAP_PRIVATE | MAP_ANONYMOUS, -1, 0);

含义:

  • 映射一段“无来源”的内存

  • 不对应任何磁盘文件

这正是:

  • 线程栈

  • 大块动态内存

  • 共享内存

的底层来源。


四、mmap 和 malloc 的关系

这是一个经典问题。

对比项mallocmmap
层级库函数系统调用
小内存使用 brk 扩展堆不适合
大内存内部直接用 mmap非常适合
回收可能延迟munmap 立即释放
碎片容易产生相对较少

glibc 的 malloc 在分配大块内存时,本身就会调用 mmap。


五、为什么 mmap 不“立刻占用”物理内存?

这是理解虚拟内存的关键。

mmap → 建立映射关系 访问 → 缺页异常 缺页 → 分配物理页

特点:

  • mmap 本身几乎是 O(1)

  • 物理内存按需分配

  • 未访问的映射不消耗 RAM

这也是 mmap高效、可扩展的根本原因。


六、mmap 与多线程:线程栈从哪里来?

在 Linux 中:

  • 主线程栈:由内核在execve时建立

  • 新线程栈:

    • 由 pthread 库

    • 使用mmap(MAP_ANONYMOUS)分配

/proc/<pid>/maps中常见:

7ffde9c1d000-7ffde9c3e000 rw-p ... [stack] 7f8c2a400000-7f8c2ac00000 rw-p ... [stack:tid]

所谓“线程栈在共享映射区”,指的正是这些 mmap 出来的匿名映射区域。


七、为什么 mmap 比 read/write 快?

read/write 至少需要一次“内核缓冲区 → 用户缓冲区”的数据拷贝;
mmap 让用户进程直接访问内核页缓存中的数据,从而避免了这一次拷贝。


先看 read/write 的真实路径

假设你调用:

read(fd, user_buf, size);

实际发生的事情是:

磁盘 ↓ DMA 页缓存(Page Cache) ← 内核态 ↓ memcpy 用户缓冲区 user_buf ← 用户态

关键点来了:

  • 磁盘 → 页缓存

    • 这是 DMA

    • 必须有(磁盘不能直接 DMA 到用户空间)

  • 页缓存 → user_buf

    • 这是一次CPU 拷贝

    • 跨内核态 / 用户态边界

    • 成本高、不可避免(对 read/write)

这一步就是大家说的“用户态 ↔ 内核态拷贝”


mmap 的路径:拷贝去哪了?

现在换成 mmap:

char *p = mmap(...); char x = p[0];

实际路径是:

磁盘 ↓ DMA 页缓存(Page Cache) ↑ 用户进程直接访问(VA → 同一物理页)

关键差异

  • 没有 memcpy

  • 用户虚拟地址直接映射到页缓存中的物理页

  • CPU 只是做一次普通的内存 load/store

页缓存既是“内核缓冲区”,也是“用户可见内存”


所以 mmap 到底“避免”了哪一次拷贝?

我们精确地说:

阶段read/writemmap
磁盘 → 内核页缓存必须必须
内核 → 用户memcpy无拷贝
用户访问普通内存普通内存

mmap避免的是

页缓存 → 用户缓冲区 的那次数据复制


为什么这次拷贝“特别贵”?

CPU 成本高

  • memcpy 是:

    • 逐字节 / cache line 拷贝

    • 占用 CPU

  • 大文件 → 明显拖慢程序


Cache 污染

  • read/write:

    • 数据被复制到 user_buf

    • cache 中出现两份相同数据

  • mmap:

    • 只有一份物理页


NUMA / 大内存下更明显

  • 大页拷贝跨 NUMA 节点

  • mmap 直接访问本地页缓存


八、从内核视角看 mmap(一句话)

mmap 的作用,是在进程页表中记录一条规则:
“当访问这段虚拟地址时,应当如何处理该访问。”

  • 从文件读?

  • 分配匿名页?

  • 是否共享?

  • 是否写时复制?


九、常见误区澄清

❌ mmap = 分配物理内存
✅ mmap = 建立虚拟地址映射

❌ mmap 只能映射文件
✅ 匿名内存是最常见用途之一

❌ 线程栈是特殊区域
✅ 在线程实现中,它只是 mmap 出来的一块内存


十、总结

mmap 是 Linux 虚拟内存机制的核心接口。
它不仅支撑了文件映射、高性能 I/O,也支撑了线程栈、动态内存分配和共享内存。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/14 23:07:45

30、脚本编程中的顶级设计、函数与流程控制

脚本编程中的顶级设计、函数与流程控制 1. 顶级设计理念 在处理复杂任务时,顶级设计是一种非常有效的方法。以停车为例,“停车”这个子任务可以进一步细分为以下步骤: 1. 寻找停车位 2. 将车驶入停车位 3. 关闭发动机 4. 拉起手刹 5. 下车 6. 锁车 而“关闭发动机”…

作者头像 李华
网站建设 2026/6/15 12:14:45

38、深入探索命令行:客户端/服务器架构与命名管道

深入探索命令行:客户端/服务器架构与命名管道 在编程领域,客户端/服务器架构是一种常见的编程架构,它可以利用诸如命名管道之类的通信方法,以及网络连接等其他进程间通信方式。其中,最广泛使用的客户端/服务器系统类型,当属网页浏览器与网页服务器之间的通信。在这个过程…

作者头像 李华
网站建设 2026/6/15 11:18:13

20、Perl编程:文件操作、哈希介绍及操作指南

Perl编程:文件操作、哈希介绍及操作指南 在Perl编程中,文件处理和数据结构的运用是非常重要的部分。下面将详细介绍文件操作、哈希(Hash)的相关知识。 文件操作 在Perl里,文件句柄的使用对于文件的读写十分关键。以下两种方式在功能上是一样的,但通常为方便起见,我们…

作者头像 李华
网站建设 2026/6/15 11:17:13

22、Perl正则表达式与程序交互实用指南

Perl正则表达式与程序交互实用指南 正则表达式在Perl中是非常强大的工具,它可以帮助我们处理各种文本匹配和替换任务。同时,Perl也提供了多种方式来与外部程序进行交互,这使得它在自动化任务和脚本编写方面表现出色。下面将详细介绍正则表达式的使用以及与外部程序交互的方…

作者头像 李华
网站建设 2026/6/15 14:05:04

核心期刊主编视角:如何甄别卓越学术论文

在学术前沿&#xff0c;核心期刊始终是彰显研究成果的关键舞台&#xff0c;其对论文质量的考量堪称严苛。身为核心期刊主编&#xff0c;肩负着遴选精品、助推学术发展的重任。那么&#xff0c;主编们究竟依据哪些标准来评判一篇论文的优劣&#xff1f;一、选题&#xff1a;创新…

作者头像 李华
网站建设 2026/6/15 14:36:11

大文件传输总卡壳?FastSend+cpolar 让跨网分享变简单

文章目录前言【视频教程】1.关于FastSend2.Docker部署3.简单使用FastSend4.安装cpolar内网穿透5. 配置公网地址6. 配置固定公网地址总结FastSend 与 cpolar 的搭配&#xff0c;解决了局域网限制&#xff0c;让大文件传输在跨网络场景下也能保持高效与安全&#xff0c;适合各类团…

作者头像 李华