终极AI媒体创作指南:如何用Generative-Media-Skills打造专业级音视频内容
【免费下载链接】Generative-Media-SkillsMulti-modal Generative Media Skills for AI Agents (Claude Code, Cursor, Gemini CLI). High-quality image, video, and audio generation powered by muapi.ai.项目地址: https://gitcode.com/gh_mirrors/em/Generative-Media-Skills
Generative-Media-Skills是一套面向AI代理的多模态生成媒体工具集,专为Claude Code、Cursor和Gemini CLI设计,通过muapi.ai提供高质量的图像、视频和音频生成能力。本文将详细介绍如何快速上手这套强大工具,即使是新手也能轻松创建专业级媒体内容。
🚀 5分钟快速入门:从安装到生成第一张图片
1. 安装核心依赖
首先需要安装muapi CLI,这是所有功能的基础:
# 通过npm安装(推荐,无需Python环境) npm install -g muapi-cli # 或使用pip pip install muapi-cli # 也可以不安装直接运行 npx muapi-cli --help2. 配置API密钥
获取API密钥后进行配置:
# 交互式设置 muapi auth configure # 或直接传入密钥 muapi auth configure --api-key "YOUR_MUAPI_KEY"提示:API密钥可在muapi.ai/dashboard获取
3. 安装技能包
# 安装所有技能到AI代理 npx skills add SamurAIGPT/Generative-Media-Skills --all # 或安装特定技能 npx skills add SamurAIGPT/Generative-Media-Skills --skill muapi-media-generation4. 生成你的第一张图像
使用以下命令生成图像,体验AI创作的魔力:
# 基础生成命令 muapi image generate "a cyberpunk city at night" --model flux-dev # 自动下载结果 muapi image generate "a sunset over mountains" --model hidream-fast --download ./outputs使用Generative-Media-Skills生成的机械蜂鸟图像,展示了工具的高细节处理能力
🎨 探索专家级媒体生成功能
Generative-Media-Skills提供了丰富的专业级媒体生成功能,分为核心原语和专家库两个层次。
⚙️ 核心原语(/core)
核心原语是对muapi-cli的轻量级封装,提供原始API访问:
- 媒体处理(core/media/):文件上传功能
- 编辑工具(core/edit/):基于提示的图像编辑
- 平台支持(core/platform/):设置、认证和结果轮询
📚 专家库(/library)
专家库包含高价值技能,将创意意图转化为技术指令:
视觉创作类
- Nano-Banana(/library/visual/nano-banana/):基于推理的图像生成(Gemini 3风格)
- UI设计师(/library/visual/ui-design/):高保真移动/网页原型(原子设计)
- Logo Creator(/library/visual/logo-creator/):极简矢量品牌设计(几何原语)
使用Nano-Banana生成2K杰作的示例:
bash library/visual/nano-banana/scripts/generate-nano-art.sh \ --file ./my-source-image.jpg \ --subject "a glass hummingbird" \ --style "macro photography" \ --resolution "2k" \ --view动态影像类
- 电影导演(/library/motion/cinema-director/):专业电影指导和摄影
- Seedance 2(/library/motion/seedance-2/):导演级电影视频生成,支持文本转视频、图像转视频以及带原生音视频同步的视频扩展
使用Nano-Banana技能生成的高细节橘猫图像,展现了工具的真实感渲染能力
🎬 电影级视频创作全流程
创建史诗级电影场景
使用电影导演技能创建10秒史诗级场景:
cd library/motion/cinema-director # 创建10秒史诗级揭示场景 bash scripts/generate-film.sh \ --subject "a cybernetic dragon over Tokyo" \ --intent "epic" \ --model "kling-v3.0-pro" \ --duration 10 \ --view将图像转换为视频
bash library/motion/seedance-2/scripts/generate-seedance.sh \ --mode i2v \ --file ./concept.jpg \ --subject "camera slowly pulls back to reveal the full landscape" \ --intent "reveal" \ --view扩展现有视频
bash library/motion/seedance-2/scripts/generate-seedance.sh \ --mode extend \ --request-id "YOUR_REQUEST_ID" \ --subject "camera continues pulling back to reveal the vast city" \ --duration 10Generative-Media-Skills的AI代理界面,展示了任务管理和技能选择功能
🤖 MCP服务器:无缝集成AI开发环境
MCP(Model Context Protocol)服务器允许Claude Desktop、Cursor或任何MCP兼容代理直接调用生成工具,无需shell脚本:
muapi mcp serve配置Claude Desktop(~/Library/Application Support/Claude/claude_desktop_config.json):
{ "mcpServers": { "muapi": { "command": "muapi", "args": ["mcp", "serve"], "env": { "MUAPI_API_KEY": "your-key-here" } } } }MCP服务器提供19种结构化工具,包括:
muapi_image_generate:文本转图像(14种模型)muapi_video_generate:文本转视频(13种模型)muapi_audio_create:音乐生成(Suno)muapi_enhance_upscale:AI放大muapi_edit_lipsync:音频唇同步
⚡ 高级代理管道示例
异步处理与轮询
# 提交异步请求,捕获request_id,就绪时轮询 REQUEST_ID=$(muapi video generate "a dog running on a beach" \ --model kling-master --no-wait --output-json --jq '.request_id' | tr -d '"') # ... 执行其他工作 ... muapi predict wait "$REQUEST_ID" --download ./outputs命令链:上传→编辑→下载
URL=$(muapi upload file ./photo.jpg --output-json --jq '.url' | tr -d '"') muapi image edit "make it look like a painting" --image "$URL" \ --model flux-kontext-pro --download ./outputs📋 开始使用Generative-Media-Skills
要开始使用这套强大的媒体生成工具,只需克隆仓库并按照快速入门指南操作:
git clone https://gitcode.com/gh_mirrors/em/Generative-Media-Skills cd Generative-Media-Skills无论你是AI代理开发新手还是有经验的开发者,Generative-Media-Skills都能帮助你轻松创建专业级的图像、视频和音频内容。通过简单的命令行界面和丰富的技能库,释放你的创意潜能!
📄 许可证信息
本项目采用MIT许可证(MIT © 2026),详细信息请参见项目根目录下的LICENSE文件。
【免费下载链接】Generative-Media-SkillsMulti-modal Generative Media Skills for AI Agents (Claude Code, Cursor, Gemini CLI). High-quality image, video, and audio generation powered by muapi.ai.项目地址: https://gitcode.com/gh_mirrors/em/Generative-Media-Skills
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考