news 2026/5/1 0:08:25

funasr_onnx asr语音转录使用案例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
funasr_onnx asr语音转录使用案例

参考:
https://github.com/modelscope/FunASR/blob/main/examples/industrial_data_pretraining/sense_voice/demo_onnx.py

安装:

pip install funasr_onnx


使用:

from pathlib import Path from funasr_onnx import SenseVoiceSmall from funasr_onnx.utils.postprocess_utils import rich_transcription_postprocess model_dir = "iic/SenseVoiceSmall" model = SenseVoiceSmall(model_dir, batch_size=10, quantize=True) wav_or_scp = [r"C:\Users\loong\Downloads\asr_example.wav"] res = model(wav_or_scp, language="auto", use_itn=True) print([rich_transcription_postprocess(i) for i in res])



版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 5:42:41

GLM-TTS能否接入智能音箱?本地化部署方案探讨

GLM-TTS能否接入智能音箱?本地化部署方案探讨 在如今的智能家居场景中,用户早已不再满足于“能说话”的智能音箱。他们希望听到的是熟悉的声音——比如母亲的温柔语调、孩子的天真嗓音,甚至是在不同情境下带有情绪变化的回应:早晨…

作者头像 李华
网站建设 2026/5/1 6:54:49

GLM-TTS在电子词典中的潜在应用价值分析

GLM-TTS在电子词典中的潜在应用价值分析 在语言学习设备领域,一个长期被忽视却直接影响用户体验的问题是:为什么电子词典的语音听起来总是“不像人”?即便技术已发展多年,许多产品仍停留在播放预录音频或调用通用TTS引擎的阶段——…

作者头像 李华
网站建设 2026/5/1 9:32:50

springboot vue网上招聘求职系统带邮箱

目录系统概述核心功能技术亮点应用价值关于博主开发技术介绍核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式&#x…

作者头像 李华
网站建设 2026/5/1 9:31:52

GLM-TTS与Airtable结合:管理语音任务与素材资源

GLM-TTS与Airtable结合:管理语音任务与素材资源 在内容创作进入“声音优先”时代的今天,有声书、虚拟主播、AI客服等应用场景对语音合成的效率和一致性提出了前所未有的要求。一个项目可能需要生成上百段语音,使用多个音色,并确保…

作者头像 李华
网站建设 2026/4/30 9:38:56

本地部署家庭自动化系统 Domoticz 并实现外部访问( Windows 版本)

Domoticz 是一款开源的家庭自动化系统,它允许用户通过一个直观的界面来监控和控制各种智能设备,能够与大量的智能家居设备兼容,如灯光、开关、传感器、温控器等,非常适合那些寻求高效、灵活且经济实惠的家庭自动化解决方案的人。本…

作者头像 李华
网站建设 2026/4/15 18:37:14

WebSocket消息被窃取?PHP加密防御方案详解,99%开发者忽略的漏洞

第一章:WebSocket消息被窃取?PHP加密防御方案详解,99%开发者忽略的漏洞在现代Web应用中,WebSocket因其低延迟、双向通信的优势被广泛用于实时聊天、通知推送等场景。然而,许多开发者忽略了其潜在的安全风险——未加密的…

作者头像 李华