gTTS终极指南：让你的Python代码“开口说话“-编程实验室

几行代码，就能让冰冷的文字变成生动的语音——这就是gTTS的魔力。

一、什么是gTTS？

gTTS（Google Text-to-Speech）是一款基于Google翻译TTS API的Python开源库，它能将任意文本转换为自然流畅的语音，并保存为MP3文件。

核心优势一览：

特性	说明
🌐 多语言支持	覆盖全球100+种语言和方言
⚡ 极简使用	几行代码即可完成语音合成
💰 完全免费	无需付费，享受Google语音合成技术
🎭 口音定制	支持不同地区的本地化发音
🎚️ 语速可调	支持正常/慢速两档切换

二、安装：一键搞定

打开终端，执行以下命令：

pipinstallgTTS

如果你想从源码安装：

gitclone https://gitcode.com/gh_mirrors/gt/gTTScdgTTS pipinstall.

环境要求： Python 3.7+，稳定的网络连接（需要访问Google服务）

三、快速上手：你的第一条语音

3.1 Python方式（推荐）

fromgttsimportgTTS# 创建语音对象tts=gTTS(text='你好，欢迎来到文本转语音的世界！',lang='zh-CN')# 保存为MP3文件tts.save('hello.mp3')print("✅ 语音文件已生成：hello.mp3")

运行后，当前目录下就会出现一个hello.mp3文件——就是这么简单！

3.2 命令行方式（更快）

不想写代码？直接用命令行：

gtts-cli"你好，世界！"--langzh-CN--outputhello.mp3

还可以从文件读取文本：

gtts-cli-ftextfile.txt--outputspeech.mp3

查看所有支持的语言：

gtts-cli--all

四、进阶玩法：解锁gTTS的隐藏技能

🔥 技能一：多语言混合合成

想让一段音频里既有中文又有英文？轻松实现：

fromgttsimportgTTS tts_en=gTTS('Hello, welcome!',lang='en')tts_zh=gTTS('你好，欢迎使用语音合成！',lang='zh-CN')withopen('mixed.mp3','wb')asf:tts_en.write_to_fp(f)tts_zh.write_to_fp(f)

🐢 技能二：语速调节

# 正常语速tts_normal=gTTS('这是正常语速',lang='zh-CN',slow=False)# 慢速播放（适合教学场景，语速约慢30%）tts_slow=gTTS('这是慢速播放',lang='zh-CN',slow=True)tts_slow.save('slow_speech.mp3')

🌏 技能三：地区口音定制（重磅功能！）

这是gTTS最强大的特性之一！通过调整tld参数，可以获取不同地区的发音特色：

语言/口音	语言代码	推荐tld
英语（美国）	en	us
英语（英国）	en	co.uk
英语（澳大利亚）	en	com.au
法语（法国）	fr	fr
法语（加拿大）	fr	ca
葡萄牙语（巴西）	pt	com.br
西班牙语（墨西哥）	es	com.mx

# 英式英语tts_uk=gTTS('Hello world',lang='en',tld='co.uk')tts_uk.save('hello_uk.mp3')# 美式英语tts_us=gTTS('Hello world',lang='en',tld='us')tts_us.save('hello_us.mp3')

💡小技巧：不指定tld时默认使用com，系统会根据你的网络位置自动选择最匹配的地区口音。在中国使用en语言代码，通常会得到美式英语发音。

💧 技能四：流式处理（内存友好）

对于内存敏感的场景，使用BytesIO进行流式处理：

fromgttsimportgTTSfromioimportBytesIO mp3_fp=BytesIO()tts=gTTS('Hello world',lang='en')tts.write_to_fp(mp3_fp)# 此时mp3_fp包含音频数据，可直接传递给播放器audio_data=mp3_fp.getvalue()

如果想直接播放（需安装pydub和ffmpeg）：

frompydubimportAudioSegmentfrompydub.playbackimportplay mp3_fp.seek(0)audio=AudioSegment.from_file(mp3_fp,format="mp3")play(audio)

五、实战应用场景

场景	示例代码
📚 有声读物	`gTTS(text=章节内容, lang='zh-CN').save(f'chapter_{i}.mp3')`
🎓 教育应用	`gTTS(text=单词, lang='en', slow=True).save('word.mp3')`
♿ 无障碍工具	为视障用户提供文本转语音功能
🤖 语音助手	为Python应用添加语音反馈
🎙️ 播客制作	批量转换文本为音频片段

批量处理长文本

当处理长篇文本时，建议分段处理以获得更好的语音效果：

deftext_to_speech_long(text,filename,lang='zh-CN'):paragraphs=text.split('\n\n')withopen(filename,'wb')asf:forparagraphinparagraphs:ifparagraph.strip():tts=gTTS(text=paragraph,lang=lang)tts.write_to_fp(f)

六、常用语言代码速查表

语言	代码	语言	代码
中文（简体）	zh-CN	日语	ja
中文（繁体）	zh-TW	韩语	ko
英语	en	德语	de
西班牙语	es	法语	fr
俄语	ru	葡萄牙语	pt
意大利语	it	阿拉伯语	ar

完整语言列表可通过from gtts.lang import tts_langs; print(tts_langs())获取。

七、故障排除指南 🔧

问题	解决方案
音频文件无法播放	确认文件扩展名为.mp3，检查播放器是否支持MP3格式
语音生成失败	验证文本非空，检查语言代码是否正确
安装失败	确保Python≥3.7，检查网络连接，可尝试国内镜像源
某种语言不工作	查看`gtts/langs.py`确认是否支持，或使用`--nocheck`跳过验证
请求被屏蔽	设置代理：`tts.save('out.mp3', proxies={'http': 'http://ip:port'})`

八、gTTS vs 其他TTS方案

方案	特点	适用场景
gTTS	免费、多语言、在线	个人项目、快速原型
pyttsx3	离线、跨平台	无网络环境、系统集成
Edge TTS	微软免费TTS、神经语音	高质量语音需求
Google Cloud TTS	付费、稳定	商业应用、高并发
Amazon Polly	AWS高质量TTS	企业级应用