Install
openclaw skills install 8917-minimax-toolkitMiniMax 多模态工具集。用于图片生成、图生图、视频生成、视频模板、语音合成、长文本 TTS、声音克隆、声音设计与音乐生成。适用于需要调用 MiniMax 官方 API 处理文本、图片、音频或视频素材的场景。默认将产物输出到当前工作区的 `workspace/03-Resources/minimax-output/`;若当前目录不含 `workspace/`,则退回 `./outputs/minimax/`。支持 `--project` 做项目隔离,也支持 `--output-dir` 显式覆盖输出根目录。默认读取 MiniMax Token Plan API Key(环境变量 `MINIMAX_API_KEY` 或 `~/.openclaw/openclaw.json`)。
openclaw skills install 8917-minimax-toolkit这是一个 工具型 / Tool Wrapper skill。
用它在 MiniMax 官方 API 上执行多模态生成任务,并把产物稳定落到当前工作区或用户指定目录。
workspace/ 时再退回通用输出目录。--project。MINIMAX_API_KEY 或 ~/.openclaw/openclaw.json 读取。输出根目录优先级:
--output-dirMINIMAX_OUTPUT_DIRworkspace/03-Resources/minimax-output/workspace/ 时,退回 ./outputs/minimax/使用 --project <ProjectName> 时,产物进入项目子目录。
执行完成后,始终明确告诉用户:
执行前至少说明:
涉及私密图片、音频或视频时,先确认用户接受第三方 API 处理。
详细说明见:
references/budget-and-trust.mdreferences/api_info.mdreferences/costs.json按具体场景读取:
references/modalities.md:查看 9 类能力、对应脚本和 CLI 示例references/budget-and-trust.md:查看预算、上传与隐私边界references/api_info.md:查看当前模型 ID 与基础约束references/quota_mapping.json:查看运行时模型名与官方额度桶的映射references/official-doc-sources.md:查看需要定期核验的官方来源references/troubleshooting.md:查看联网失败、网页抓取失败、remains 查询失败时的排障指引可运行:
python3 scripts/mm.py remains
python3 scripts/mm.py check-docs
其中:
mm.py remains:查询官方 Token Plan 实时额度mm.py check-docs:抓取官方 FAQ + 查询 remains + 对比本地 references校验脚本会:
coding_plan/remains 接口references/ 中的关键配置references/checks/latest-check.md如果在线校验失败:
references/troubleshooting.md优先使用统一入口 scripts/mm.py:
# Image / Video / Music
python3 scripts/mm.py image "A red apple" --ratio 16:9 --project Demo
python3 scripts/mm.py video "Cinematic ruins" --project Demo
python3 scripts/mm.py music "Lo-fi beat" --instrumental --project Demo
# Speech (short text)
python3 scripts/mm.py speech "Hello world" --voice male-qn-qingse --project Demo
# Speech (long text / file)
python3 scripts/mm.py async-speech ~/script.txt --voice male-qn-qingse --project Demo
# Image-to-image
python3 scripts/mm.py i2i "anime style" --ref ~/photo.jpg --project Demo
# Video templates
python3 scripts/mm.py video-template labubu --media ~/photo.jpg --project Demo
# Voice clone / design
python3 scripts/mm.py voice-clone ~/my_voice.wav --voice-id my-voice
python3 scripts/mm.py voice-design "Warm deep male voice" --voice-id new-voice
支持的 modality:image, i2i, video, video-template, speech, async-speech, voice-clone, voice-design, music
当前支持显式功能开关:references/feature_flags.json
true / falsefalse,避免无意义调用注意:
voice-design 当前要求 --preview-textvoice-clone 建议提供 --preview-text,如提供 --prompt-audio 则需同时提供 --prompt-text详细示例见 references/modalities.md。
如需直接调用或处理更复杂场景,以下脚本仍可用:
scripts/mm_image.pyscripts/mm_i2i.pyscripts/mm_video.pyscripts/mm_video_template.pyscripts/mm_speech.pyscripts/mm_async_speech.pyscripts/mm_voice_clone.pyscripts/mm_voice_design.pyscripts/mm_music.py旧脚本作为兼容层保留,未来逐步收敛到统一入口。
MiniMax 产物默认落当前工作区或通用输出目录,执行前讲清 request 消耗与第三方 API 处理边界。