news 2026/6/15 7:56:18

语音转字幕实战(字幕提取)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
语音转字幕实战(字幕提取)

下载

https://github.com/agermanidis/autosub

它是基于Google Web Speech API实现的,需要翻墙请求外部接口

通过python安装项目,会下载对应的autosub到环境变量

pip install git+https://github.com/agermanidis/autosub.git

输入以下命令有返回则代表安装成功:

autosub -h

让本地http请求走代理端口(这里演示我本地的mac环境,其他环境差不多,要启动一个翻墙服务,一般都是暴露1090端口)

vim ~/.zshrc

alias setproxy="export ALL_PROXY=http://127.0.0.1:1090"

alias unsetproxy="unset ALL_PROXY"

让环境变量生效

souce ~/.zshrc

setproxy

最后执行转字幕命令

autosub -S zh-CN -D zh-CN test.mp4 (之前发现卡住了,parse过程很慢,后面联想到请求googel接口问题,需要翻墙)

最后执行成功了,生成的效果还可以

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 3:25:29

Wan2.2-T2V-A14B本地部署指南:从环境配置到多GPU推理

Wan2.2-T2V-A14B本地部署指南:从环境配置到多GPU推理 在AI生成内容(AIGC)迅猛发展的今天,文本生成视频(Text-to-Video, T2V)正从“能出画面”迈向“可商用”的关键阶段。阿里巴巴自研的 Wan2.2-T2V-A14B 模…

作者头像 李华
网站建设 2026/6/15 7:10:37

使用TensorRT-LLM在生产环境部署LLM

使用TensorRT-LLM在生产环境部署LLM 在当今大模型落地的浪潮中,一个核心挑战逐渐浮出水面:如何将千亿参数的语言模型从“能跑”变成“高效稳定地跑”?企业不再满足于实验室里的demo,而是追求每毫秒延迟的优化、每一块GPU卡的极致利…

作者头像 李华
网站建设 2026/6/15 8:25:10

告别社区店促销困局:用数据解锁老客复购新路径

一、社区门店的促销挽客困局社区门店盲目促销,多是“花钱赚吆喝,难留老客”。不少经营多年的社区店,本有稳定熟客,近来却流失明显。急着挽客的老板,常会从利润里挤钱试促销:比如第一次满减,客流…

作者头像 李华
网站建设 2026/6/15 12:38:52

基于K8s的高性能Web服务器构建实践

基于K8s的高性能Web服务器构建实践 在AIGC浪潮席卷内容生产的今天,如何将强大的AI模型转化为稳定、可扩展的在线服务,已成为工程落地的核心挑战。尤其是文本到视频(T2V)这类计算密集型任务,既要保证生成质量&#xff0…

作者头像 李华
网站建设 2026/6/14 10:53:21

Dify本地部署完整教程

Dify 本地部署完整指南:从零搭建你的 AI 应用开发平台 在大模型技术飞速发展的今天,越来越多企业和开发者希望快速构建专属的 AI 应用——无论是智能客服、自动化文案生成,还是知识库问答系统。然而,直接调用 API 实现功能往往受…

作者头像 李华
网站建设 2026/6/15 4:05:08

Langchain-Chatchat本地部署实践与优化

Langchain-Chatchat本地部署实践与优化 在AI技术加速落地的2024年,大语言模型不再只是云端服务或API调用的对象,越来越多开发者开始尝试将LLM真正“握在手中”——尤其是在中文语境下,如何构建一个安全、可控、可定制的本地知识问答系统&…

作者头像 李华