Python 读取 txt 文件的全攻略-编程实验室

Python 读取 txt 文件是最基础的文件操作之一，核心通过内置的open()函数实现，配合不同的读取方法可适配小文件、大文件、按行读取、按字节读取等不同场景。本文从基础到进阶，结合实例讲解所有常用方法。

一、核心基础：`open()`函数与文件打开模式

1.`open()`函数的基本参数

python

open(file, mode='r', encoding=None)

参数	说明
`file`	文件路径（相对路径：相对于当前 Python 脚本的路径；绝对路径：完整路径）
`mode`	打开模式（默认`r`，只读模式），常用模式见下表
`encoding`	文件编码格式（推荐显式指定，如`utf-8`、`gbk`，避免乱码）

2. 常用文件打开模式

模式	作用
`r`	只读模式（默认），文件不存在则报错
`r+`	读写模式，文件不存在则报错
`rb`	二进制只读模式（用于非文本文件，如图片、视频，无需指定 encoding）
`a`	追加模式，文件不存在则创建
`w`	写入模式，文件不存在则创建，存在则清空原有内容

3. 关键：使用`with`语句（推荐）

with语句会自动关闭文件，避免因忘记调用close()导致的资源泄漏，是 Python 读取文件的最佳实践。

python

# 基本结构 with open("test.txt", "r", encoding="utf-8") as f: # 读取文件的操作 content = f.read()

二、常用读取方法（按场景分类）

先准备一个测试文件test.txt，内容如下：

plaintext

Python读取txt文件 这是第2行内容 Hello World! 这是最后一行

场景 1：小文件 → 一次性读取整个文件（`read()`）

适合文件体积小（几 KB~ 几十 KB），需要一次性获取所有内容的场景。

python

# 读取整个文件 with open("test.txt", "r", encoding="utf-8") as f: content = f.read() # 返回字符串，包含所有内容（包括换行符\n） print("文件全部内容：") print(content)

输出结果：

plaintext

文件全部内容： Python读取txt文件 这是第2行内容 Hello World! 这是最后一行

场景 2：中等文件 → 读取所有行到列表（`readlines()`）

将文件的每一行作为列表的一个元素，方便后续通过索引、切片处理行数据。

python

with open("test.txt", "r", encoding="utf-8") as f: lines = f.readlines() # 返回列表，每个元素是一行内容（包含换行符\n） print("文件的行列表：", lines) print("第2行内容：", lines[1].strip()) # strip()去掉换行符和首尾空格

输出结果：

plaintext

文件的行列表： ['Python读取txt文件\n', '这是第2行内容\n', 'Hello World!\n', '这是最后一行'] 第2行内容： 这是第2行内容

场景 3：任意文件 → 逐行读取（`for`循环遍历文件对象，推荐）

这是最高效、最内存友好的方式，逐行读取，不一次性加载整个文件，适合所有场景（尤其是大文件）。

python

with open("test.txt", "r", encoding="utf-8") as f: print("逐行读取文件：") for line in f: # 直接遍历文件对象，每次返回一行 print(line.strip()) # strip()去除换行符和多余空格

输出结果：

plaintext

逐行读取文件： Python读取txt文件 这是第2行内容 Hello World! 这是最后一行

场景 4：精准控制 → 按字节 / 字符读取（`read(n)`）

read(n)可指定读取的字符数（文本模式）或字节数（二进制模式），适合需要分段读取的场景。

python

with open("test.txt", "r", encoding="utf-8") as f: content1 = f.read(6) # 读取前6个字符 print("前6个字符：", content1) content2 = f.read(3) # 从当前位置继续读取3个字符 print("后续3个字符：", content2)

输出结果：

plaintext

前6个字符：Python 后续3个字符：读取t

场景 5：逐行读取（`readline()`）

每次调用readline()读取一行，直到返回空字符串（文件结束），适合需要手动控制读取进度的场景。

python

with open("test.txt", "r", encoding="utf-8") as f: line1 = f.readline() # 读取第一行 line2 = f.readline() # 读取第二行 print("第一行：", line1.strip()) print("第二行：", line2.strip())

输出结果：

plaintext

第一行：Python读取txt文件 第二行：这是第2行内容

三、进阶场景处理

1. 处理大文件（GB 级）

大文件的核心是逐行读取（避免一次性加载到内存），使用for循环遍历文件对象即可：

python

# 读取GB级大文件，逐行处理 with open("big_file.txt", "r", encoding="utf-8") as f: for line in f: # 处理每一行（如统计行数、提取关键信息） pass

2. 处理不同编码的 txt 文件

Windows 系统下的 txt 文件常使用gbk/gb2312编码，Linux/Mac 下多为utf-8，若编码不匹配会报UnicodeDecodeError，需显式指定编码：

python

# 读取GBK编码的文件 with open("gbk_file.txt", "r", encoding="gbk") as f: content = f.read() print(content) # 读取带BOM的UTF-8文件（Windows记事本保存的UTF-8文件常带BOM） with open("utf8_bom_file.txt", "r", encoding="utf-8-sig") as f: content = f.read() print(content)

3. 二进制模式读取（`rb`）

用于读取非文本文件（如图片、视频），或需要处理字节数据的场景：

python

with open("test.txt", "rb") as f: content = f.read() # 返回字节串（bytes） print("二进制内容：", content) # 转换为字符串（需指定编码） print("转换为字符串：", content.decode("utf-8"))

四、常见问题与解决方法

问题 1：`FileNotFoundError`（文件不存在）

解决：检查文件路径是否正确（相对路径是否相对于当前脚本，绝对路径是否完整）。

问题 2：`UnicodeDecodeError`（编码错误）

解决：显式指定正确的编码（如utf-8、gbk、utf-8-sig）。

问题 3：读取的内容有多余的换行符 / 空格

解决：使用strip()（去除首尾空格和换行符）、rstrip("\n")（仅去除换行符）。

问题 4：文件权限不足（`PermissionError`）

解决：检查文件的读写权限，确保当前用户有读取权限。

五、总结：方法选择建议

场景	推荐方法	优点
小文件（<100KB）	`read()`一次性读取	简单快捷
中等文件（100KB~1MB）	`readlines()`读取到列表	方便后续行处理
大文件（>1MB）	`for`循环遍历文件对象（逐行读取）	内存友好、效率高
精准分段读取	`read(n)`	灵活控制读取量

核心原则：优先使用with语句，避免资源泄漏；大文件必用逐行读取，避免内存溢出。掌握这些方法，就能处理所有 txt 文件的读取需求。

Python 读取 txt 文件的全攻略

一、核心基础：`open()`函数与文件打开模式

1.`open()`函数的基本参数

2. 常用文件打开模式

3. 关键：使用`with`语句（推荐）

二、常用读取方法（按场景分类）

场景 1：小文件 → 一次性读取整个文件（`read()`）

场景 2：中等文件 → 读取所有行到列表（`readlines()`）

场景 3：任意文件 → 逐行读取（`for`循环遍历文件对象，推荐）

场景 4：精准控制 → 按字节 / 字符读取（`read(n)`）

场景 5：逐行读取（`readline()`）

三、进阶场景处理

1. 处理大文件（GB 级）

2. 处理不同编码的 txt 文件

3. 二进制模式读取（`rb`）

四、常见问题与解决方法

问题 1：`FileNotFoundError`（文件不存在）

问题 2：`UnicodeDecodeError`（编码错误）

问题 3：读取的内容有多余的换行符 / 空格

问题 4：文件权限不足（`PermissionError`）

五、总结：方法选择建议

KDTree原理介绍

软件逆向工程框架—Ghidra逆向分析工具使用与实战教程建议收藏！

【Open-AutoGLM沉思MCP核心解密】：揭示下一代智能自动化架构的三大颠覆性突破

跨平台场景下Java如何处理大文件上传的版本兼容问题？

3 小时搭一个 AI 打工人：自动发日报、盯数据、推消息

云计算与大数据实训室系列产品介绍

一、核心基础：open()函数与文件打开模式

1.open()函数的基本参数

2. 常用文件打开模式

3. 关键：使用with语句（推荐）

二、常用读取方法（按场景分类）

场景 1：小文件 → 一次性读取整个文件（read()）

场景 2：中等文件 → 读取所有行到列表（readlines()）

场景 3：任意文件 → 逐行读取（for循环遍历文件对象，推荐）

场景 4：精准控制 → 按字节 / 字符读取（read(n)）

场景 5：逐行读取（readline()）

三、进阶场景处理

1. 处理大文件（GB 级）

2. 处理不同编码的 txt 文件

3. 二进制模式读取（rb）

四、常见问题与解决方法

问题 1：FileNotFoundError（文件不存在）

问题 2：UnicodeDecodeError（编码错误）

问题 3：读取的内容有多余的换行符 / 空格

问题 4：文件权限不足（PermissionError）

五、总结：方法选择建议

KDTree原理介绍

软件逆向工程框架—Ghidra逆向分析工具使用与实战教程建议收藏！

【Open-AutoGLM沉思MCP核心解密】：揭示下一代智能自动化架构的三大颠覆性突破

跨平台场景下Java如何处理大文件上传的版本兼容问题？

3 小时搭一个 AI 打工人：自动发日报、盯数据、推消息

云计算与大数据实训室系列产品介绍

一、核心基础：`open()`函数与文件打开模式

1.`open()`函数的基本参数

3. 关键：使用`with`语句（推荐）

场景 1：小文件 → 一次性读取整个文件（`read()`）

场景 2：中等文件 → 读取所有行到列表（`readlines()`）

场景 3：任意文件 → 逐行读取（`for`循环遍历文件对象，推荐）

场景 4：精准控制 → 按字节 / 字符读取（`read(n)`）

场景 5：逐行读取（`readline()`）

3. 二进制模式读取（`rb`）

问题 1：`FileNotFoundError`（文件不存在）

问题 2：`UnicodeDecodeError`（编码错误）

问题 4：文件权限不足（`PermissionError`）