news 2026/5/1 8:46:25

扣子Coze实战:一键打造自己的口播数字人视频(保姆级教程)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
扣子Coze实战:一键打造自己的口播数字人视频(保姆级教程)

大家好,我是汤师爷,专注AI智能体分享~

相信有不少朋友在问,有没有办法不出境,也能拍出专业的口播视频?

毕竟很多时候,我们想分享内容,却因为不敢出镜,迟迟不敢开始。

录制视频时总是觉得自己表情不自然,一遍遍重录。

新手拍摄常见的三大难题,让很多人望而却步:

1. 镜头恐惧

面对镜头时容易紧张、结巴,甚至完全忘记准备好的台词。

很多人需要反复拍摄几十次才能完成一个简单的片段,这严重影响了拍摄效率。
2. 表现力不足

即使克服了紧张感,很多新手在镜头前依然显得生硬、不自然。

语气平淡、表情僵硬、肢体动作不协调等问题需要大量练习才能改善,这个过程往往需要几个月甚至更长时间。
3. 成本压力

想要制作优质视频,投入成本远超很多人的想象。

不仅要租用专业的场地和设备(如补光灯、摄像机、收音设备等),还需要聘请专业团队(包括化妆师、摄像师、剪辑师等),这些支出加起来往往让创作者望而却步。

今天我就教你搭建一个口播数字人智能体,不露脸也能轻松搞定。

借助Coze工作流,直接用文案就能生成逼真的数字人口播视频。

篇幅不短,欢迎先收藏,再慢慢看。如果觉得有帮助,也请顺手点个赞、在看、转发支持一下~

1.选择数字人插件

Coze本身并没有提供官方的数字人插件,但市面上却有很多第三方插件可以用。

今天我们要用到的,就是「飞影数字人插件」。

插件这么多,我们怎么选呢?

建议大家关注几个核心指标:智能体使用数、调用量、成功率、执行时间。

这些数据,可以帮助我们快速筛选出优质的插件。

2. 前期准备阶段

在搭建口播数字人智能体之前,需要准备以下任务:

  1. 登陆飞影官网(https://hifly.cc?promoterCode=XmcyWURYbnVW77Vn)
  2. 克隆自己的专属数字人形象备用。
  3. 克隆自己的声音备用。

完成数字人和声音克隆后,我们就可以开始搭建口播数字人智能体了。

3.智能体的搭建流程

智能体的搭建流程主要分为两个步骤:梳理工作流、设置智能体。

3.1 梳理工作流

将口播数字人视频创作流程,转化为可自动化运行的工作流节点。

  1. 通过开始节点,收集必要的参数
  2. 使用飞影数字人插件,一键生成数字人视频
  3. 监控数字人的任务状态,直到任务完成
  4. 输出数字人的视频链接

3.2 设置智能体

  1. 设置人设与逻辑:配置口播数字人智能体的决策逻辑
  2. 设置快捷指令:配置智能化的快捷指令,让智能体更快速、便捷地响应用户的需求
  3. 测试并发布:全面的功能测试,确认正常后,将智能体正式发布到生产环境

4.创建工作流

登录Coze官网,在“资源库-工作流”里新建一个空白工作流,取名“spoken_digital_human”。

3.1 开始节点

  • 输入:
    • hifly_id:hifly_agent_token,飞影数字人产品的秘钥
    • speaker_id:克隆声音 ID
    • digital_human_id:克隆数字人 ID
    • text:视频文案

关于hifly_id、speaker_id、digital_human_id如何获取,下文会重点介绍。

3.2 一键生成数字人视频

我们将使用【飞影数字人】插件的create_lipsync_video2功能。

通过这个功能,我们可以一键生成口播数字人视频。

我们选择飞影数字人插件的create_lipsync_video2功能,插件节点命名为【一键生成数字人视频】

  • 输入:
    • hifly_id:开始 - hifly_id
    • speaker_id:开始 - speaker_id
    • digital_human_id:开始 - digital_human_id
    • text:开始 - text

3.3 设定循环,每10S监控任务的状态

数字人视频生成通常需要几分钟,我们会用任务查询插件,设定一个无限循环,每隔10秒就自动检查一次。

当插件返回任务完成状态时,就会自动停止循环,生成的视频链接就能顺利拿到。

我们将设定【循环】节点,每10S监控任务的状态。

  • 循环设置:无限循环
  • 输出:
    • output:监控数字人的任务状态 - video_Url

3.5 配置循环体

1.我们将使用【飞影数字人】插件的inspect_video_creation_status功能。

监控任务的状态,当任务完成后,输出数字人视频的链接。

  • 输入:
    • job_id:作品ID,一键生成数字人视频-job_id
    • hifly_id:开始-hifly_id

2.通过选择器节点,判断任务是否完成。

如果监控数字人的任务状态 - status = 2,说明视频还在生成中。

3.如果视频还在生成中,则使用【定时器】插件,等待10秒。

  • 输入:
    • seconds:等待时间

4.如果视频生成完成,则使用【终止循环】插件。

3.6 结束节点:输出数字人视频链接

  • 输出:
    • output:设定循环,每10S监控任务的状态-output

这样,工作流就搭建好了,最后点击发布工作流。

4.创建智能体

4.1 新建智能体

在Coze平台创建一个新的智能体,命名“口播数字人智能体”。

4.2 设置人设与逻辑

配置智能体的特征、回复风格和决策逻辑。

/* by 01022.hk - online tools website : 01022.hk/zh/navtiveunicode.html */ # 角色 你是口播视频生成神器,负责处理用户上传的视频、文本或音频,生成专属定制数字人视频,并提供相关服务。 ## 技能 ### 技能 1: 生成并反馈视频 1. 接收用户上传的视频、文本或音频后,启动名为“数字人视频生成”的工作流进行处理。 2. 在工作流运行完毕后,向用户展示生成的视频链接,并建议用户复制链接下载视频。 ## 限制 - 严格在“数字人视频生成”工作流运行结束后,按要求展示视频链接并给出下载建议。 - 将“数字人视频生成”工作流添加进智能体。

4.3 设置快捷指令

1.按钮名称:根据文本,生成口播数字人视频

2.指令名称:digital_human

3.工具:直接使用工作流

4.指令内容:生成数字人视频 {{digital_human_id}}{{hifly_id}}{{speaker_id}}{{text}}

4.4 测试并发布

全面的功能测试,确认正常后,将智能体正式发布到生产环境。

1.点击快捷按钮:根据文本,生成口播数字人视频

2.获取hifly_id

hifly_id就是飞影数字人会员的秘钥,hifly_agent_token,在个人中心获取。

3.获取speaker_id

speaker_id是克隆声音 ID,在声音克隆菜单下,获取声音 ID。

4.获取digital_human_id

digital_human_id是克隆数字人 ID,在数字人菜单下,获取素材 ID。

5.填写所有参数,并测试智能体

  • hifly_id:hifly_agent_token,飞影数字人产品的秘钥
  • speaker_id:克隆声音 ID
  • digital_human_id:克隆数字人 ID
  • text:视频文案

执行后,会输出数字人视频的链接:

最后,用剪映给视频加上音乐和字幕,就可以生成最终的口播视频啦~

5.总结

通过本文的介绍,我们学会了如何使用Coze工作流和飞影数字人插件,轻松打造一个专业的口播数字人智能体。

这套方案不仅让我们摆脱了出镜的困扰,还能大大提升内容创作的效率。

希望这个方法能帮助你更好地传递价值,创作出更多优质的内容。

如果你觉得这篇文章对你有帮助,欢迎点赞、收藏,不迷路,并转发给有需要的朋友

你的每一次互动都是我持续创作的动力!感谢支持~

对了,我整理了一份开源《智能体学习手册》,爆肝 10 万字,价值 999 元。限时开放领取👉:tangshiye.cn

本文来自博客园,作者:AI架构师汤师爷,转载请注明原文链接:https://www.cnblogs.com/tangshiye/p/19598717

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 10:58:02

网络安全行业10大副业汇总,总有一个适合你

网络安全行业10大副业汇总,总有一个适合你 网络安全行业这10大副业汇总 总有一个适合你 引言 在当今的网络安全行业中,除了全职工作外,许多师傅还通过副业来增加收入、不断拓展自身技能,并积累更多实际操作经验,为…

作者头像 李华
网站建设 2026/4/24 15:18:55

解决Docker启动后自动生成docker0虚拟网卡

解决Docker启动后自动生成docker0虚拟网卡(172.17.0.1)及启动失败问题 一、问题描述 Linux服务器中,Docker服务启动后会自动生成docker0虚拟网卡,其默认IP为172.17.0.1,多次执行删除命令后,重启Docker服务仍…

作者头像 李华
网站建设 2026/5/1 5:16:43

TranslateGemma-12B-IT实测:中英互译效果惊艳展示

TranslateGemma-12B-IT实测:中英互译效果惊艳展示 1. 引言:当翻译遇上大模型 想象一下,你手头有一份长达50页的英文技术文档,需要在明天早上9点前翻译成中文。传统方法要么是逐句粘贴到在线翻译工具,忍受格式错乱和术…

作者头像 李华
网站建设 2026/4/27 10:27:16

程序员是一个需要不断学习的职业。

程序员是一个需要不断学习的职业。幸运的是,在这个互联网时代,知识就在那里,等着我们去获取。 作为一个“收藏从未停止,学习从未开始”的博主,秉承着好东西不能独享的态度,把收藏的学习网站整理分享出来&a…

作者头像 李华
网站建设 2026/4/26 1:21:44

基于协同过滤的电商 商品推荐系统的设计与实现flask scrapy爬虫可视化

目录协同过滤电商推荐系统设计要点Flask后端与可视化实现关键技术栈示例项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作协同过滤电商推荐系统设计要点 数据采集层 使用Scrapy框架构建分布式爬虫&#xff…

作者头像 李华
网站建设 2026/4/18 13:34:35

Qwen3-ASR-0.6B系统部署:支持52种语言的语音识别

Qwen3-ASR-0.6B系统部署:支持52种语言的语音识别 1 快速上手:三分钟启动你的多语言语音识别服务 你是否遇到过这样的场景:会议录音需要转成文字,但发言人夹杂着英语、日语和粤语;客服热线里用户用西班牙语提问&#…

作者头像 李华