news 2026/5/1 5:47:29

Python 读取 txt 文件的全攻略

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Python 读取 txt 文件的全攻略

Python 读取 txt 文件是最基础的文件操作之一,核心通过内置的open()函数实现,配合不同的读取方法可适配小文件、大文件、按行读取、按字节读取等不同场景。本文从基础到进阶,结合实例讲解所有常用方法。

一、核心基础:open()函数与文件打开模式

1.open()函数的基本参数

python

open(file, mode='r', encoding=None)
参数说明
file文件路径(相对路径:相对于当前 Python 脚本的路径;绝对路径:完整路径)
mode打开模式(默认r,只读模式),常用模式见下表
encoding文件编码格式(推荐显式指定,如utf-8gbk,避免乱码)

2. 常用文件打开模式

模式作用
r只读模式(默认),文件不存在则报错
r+读写模式,文件不存在则报错
rb二进制只读模式(用于非文本文件,如图片、视频,无需指定 encoding)
a追加模式,文件不存在则创建
w写入模式,文件不存在则创建,存在则清空原有内容

3. 关键:使用with语句(推荐)

with语句会自动关闭文件,避免因忘记调用close()导致的资源泄漏,是 Python 读取文件的最佳实践。

python

# 基本结构 with open("test.txt", "r", encoding="utf-8") as f: # 读取文件的操作 content = f.read()

二、常用读取方法(按场景分类)

先准备一个测试文件test.txt,内容如下:

plaintext

Python读取txt文件 这是第2行内容 Hello World! 这是最后一行

场景 1:小文件 → 一次性读取整个文件(read()

适合文件体积小(几 KB~ 几十 KB),需要一次性获取所有内容的场景。

python

# 读取整个文件 with open("test.txt", "r", encoding="utf-8") as f: content = f.read() # 返回字符串,包含所有内容(包括换行符\n) print("文件全部内容:") print(content)

输出结果

plaintext

文件全部内容: Python读取txt文件 这是第2行内容 Hello World! 这是最后一行

场景 2:中等文件 → 读取所有行到列表(readlines()

将文件的每一行作为列表的一个元素,方便后续通过索引、切片处理行数据。

python

with open("test.txt", "r", encoding="utf-8") as f: lines = f.readlines() # 返回列表,每个元素是一行内容(包含换行符\n) print("文件的行列表:", lines) print("第2行内容:", lines[1].strip()) # strip()去掉换行符和首尾空格

输出结果

plaintext

文件的行列表: ['Python读取txt文件\n', '这是第2行内容\n', 'Hello World!\n', '这是最后一行'] 第2行内容: 这是第2行内容

场景 3:任意文件 → 逐行读取(for循环遍历文件对象,推荐)

这是最高效、最内存友好的方式,逐行读取,不一次性加载整个文件,适合所有场景(尤其是大文件)。

python

with open("test.txt", "r", encoding="utf-8") as f: print("逐行读取文件:") for line in f: # 直接遍历文件对象,每次返回一行 print(line.strip()) # strip()去除换行符和多余空格

输出结果

plaintext

逐行读取文件: Python读取txt文件 这是第2行内容 Hello World! 这是最后一行

场景 4:精准控制 → 按字节 / 字符读取(read(n)

read(n)可指定读取的字符数(文本模式)或字节数(二进制模式),适合需要分段读取的场景。

python

with open("test.txt", "r", encoding="utf-8") as f: content1 = f.read(6) # 读取前6个字符 print("前6个字符:", content1) content2 = f.read(3) # 从当前位置继续读取3个字符 print("后续3个字符:", content2)

输出结果

plaintext

前6个字符:Python 后续3个字符:读取t

场景 5:逐行读取(readline()

每次调用readline()读取一行,直到返回空字符串(文件结束),适合需要手动控制读取进度的场景。

python

with open("test.txt", "r", encoding="utf-8") as f: line1 = f.readline() # 读取第一行 line2 = f.readline() # 读取第二行 print("第一行:", line1.strip()) print("第二行:", line2.strip())

输出结果

plaintext

第一行:Python读取txt文件 第二行:这是第2行内容

三、进阶场景处理

1. 处理大文件(GB 级)

大文件的核心是逐行读取(避免一次性加载到内存),使用for循环遍历文件对象即可:

python

# 读取GB级大文件,逐行处理 with open("big_file.txt", "r", encoding="utf-8") as f: for line in f: # 处理每一行(如统计行数、提取关键信息) pass

2. 处理不同编码的 txt 文件

Windows 系统下的 txt 文件常使用gbk/gb2312编码,Linux/Mac 下多为utf-8,若编码不匹配会报UnicodeDecodeError,需显式指定编码:

python

# 读取GBK编码的文件 with open("gbk_file.txt", "r", encoding="gbk") as f: content = f.read() print(content) # 读取带BOM的UTF-8文件(Windows记事本保存的UTF-8文件常带BOM) with open("utf8_bom_file.txt", "r", encoding="utf-8-sig") as f: content = f.read() print(content)

3. 二进制模式读取(rb

用于读取非文本文件(如图片、视频),或需要处理字节数据的场景:

python

with open("test.txt", "rb") as f: content = f.read() # 返回字节串(bytes) print("二进制内容:", content) # 转换为字符串(需指定编码) print("转换为字符串:", content.decode("utf-8"))

四、常见问题与解决方法

问题 1:FileNotFoundError(文件不存在)

  • 解决:检查文件路径是否正确(相对路径是否相对于当前脚本,绝对路径是否完整)。

问题 2:UnicodeDecodeError(编码错误)

  • 解决:显式指定正确的编码(如utf-8gbkutf-8-sig)。

问题 3:读取的内容有多余的换行符 / 空格

  • 解决:使用strip()(去除首尾空格和换行符)、rstrip("\n")(仅去除换行符)。

问题 4:文件权限不足(PermissionError

  • 解决:检查文件的读写权限,确保当前用户有读取权限。

五、总结:方法选择建议

场景推荐方法优点
小文件(<100KB)read()一次性读取简单快捷
中等文件(100KB~1MB)readlines()读取到列表方便后续行处理
大文件(>1MB)for循环遍历文件对象(逐行读取)内存友好、效率高
精准分段读取read(n)灵活控制读取量

核心原则:优先使用with语句,避免资源泄漏;大文件必用逐行读取,避免内存溢出。掌握这些方法,就能处理所有 txt 文件的读取需求。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/25 19:43:08

KDTree原理介绍

KDTree 之所以快&#xff0c;核心原因是通过空间划分将「暴力遍历」的线性时间复杂度&#xff0c;优化为「分层搜索」的对数时间复杂度&#xff0c;尤其在三维点云近邻搜索场景中优势显著。结合你提供的 FAST-LIO 代码&#xff08;使用 ikd-Tree 这个增量式 KDTree 实现&#x…

作者头像 李华
网站建设 2026/5/1 1:21:10

软件逆向工程框架—Ghidra逆向分析工具使用与实战教程建议收藏!

简介 Ghidra 是由美国国家安全局研究局创建和维护的软件逆向工程 (SRE) 框架 。该框架包括一套功能齐全的高端软件分析工具&#xff0c;使用户能够在包括 Windows、macOS 和 Linux 在内的各种平台上分析编译代码。功能包括反汇编、汇编、反编译、绘图和脚本&#xff0c;以及数百…

作者头像 李华
网站建设 2026/4/25 3:11:39

跨平台场景下Java如何处理大文件上传的版本兼容问题?

大文件传输解决方案设计与实施建议 需求分析与现状评估 作为上海IT行业软件公司项目负责人&#xff0c;针对贵司提出的大文件传输功能需求&#xff0c;我进行了全面分析&#xff1a; 核心需求&#xff1a; 单文件100G传输能力文件夹层级结构保持高可靠性断点续传(支持浏览器刷…

作者头像 李华
网站建设 2026/5/1 2:10:47

3 小时搭一个 AI 打工人:自动发日报、盯数据、推消息

读完本文&#xff0c;你将收获&#xff1a; 理解 n8n 是什么、能做什么、为什么值得选择掌握三种 Docker 部署方案&#xff1a;快速体验版、单机持久化版、生产就绪版学会配置 PostgreSQL 数据库、Nginx 反向代理、HTTPS 证书避开时区、Webhook、数据库膨胀等常见踩坑点拥有一套…

作者头像 李华
网站建设 2026/4/18 5:21:00

云计算与大数据实训室系列产品介绍

在数字经济加速渗透的今天&#xff0c;云计算与大数据技术已成为驱动产业升级的核心引擎&#xff0c;市场对具备实战能力的专业人才需求日益迫切。唯众深耕职业教育与实训领域多年&#xff0c;精准把握行业发展脉搏与教学痛点&#xff0c;打造出涵盖“教、学、练、评”全流程的…

作者头像 李华